教室ブログ

2018.03.30

圧縮

こんばんは、Wam六十谷校の川口です。

英語をタイプしていると物凄い量を打ったつもりなのに情報量の少なさに愕然とすることがあります。文字自体が難解ではありますが、中国語や日本語は情報圧縮能力でアルファベットより優れていると思います。特に文字数制限のあるコミュニケーションツールで効果的ではないでしょうか。例えば”情報圧縮能力”の12バイトが英語だと”Information compression ability”と31バイトほどになります。情報理論における最大エントロピーで換算すると常用漢字は英数字の2.3倍以上になり、漢字における冗長度は特に高く、可逆圧縮も可能です。平仮名で表せることを漢字で書く意義や部首、書き順を記憶すること、漢字の成り立ちを学ぶことは符号化や特徴量を捉える研究とも言え、近年の深層学習や量子化とは比較できない贅沢な楽しみであると思います。漢検は準1級で3000字、1級で6000字を対象とするため、その組み合わせも膨大な数になりますが、蓴羹鱸膾、竡のような日常的に使用しない一文字も読めないような漢字を練習する価値を認識できたので、それらを活躍させる場を作るべく、普段から様々な漢字を広い語彙に載せて使えるように練習していきたいと思います。

この記事をシェア

すべて無料!
丁寧にサポートさせていただきます!

お急ぎの方はこちら! 電話でもお伺いいたします!

フリーダイヤル(受付時間10:00~22:00) フリーダイヤル® 0120-20-7733