2. MP3とは


MP3とは、正確には「MPEG-1 AUDIO Layer-3」の略称で、MPEGを構成する動画、音声、システムの3要素のうち、音声圧縮規格の1つである。ISOにより93年に標準化された。他に圧縮率の異なるLayer-1や2も存在するが、最も圧縮率の高いのがLayer-3で、CDクオリティの場合、元データの約1/10程度にまで圧縮することができる。
圧縮には展開すると元データとまったく同じになる可逆圧縮と、データの一部を加工することによって、元どおりには戻せない不可逆圧縮とがあるが、MP3の場合は、後者である。MP3の高音質圧縮は、人間の聴覚の特性である「聴覚心理」を利用して、聞き取りにくい情報を省略する「知覚符号化」によって実現されている。この聴覚心理は、「最小可聴限界」と「マスキング特性」と呼ばれる2つを利用している。最小可聴限界とは、耳で聞き取れる最小の音量のことで、周波数によって変わってくる。人間の耳は、1〜2kHzの音に対しては非常に敏感だが、反面、10kHz以上の高音や100kHz以下の低音はかなりの音圧でないと聞き取れない。これらの聞き取れない情報を全てカットすることにより、かなりのデータ量を省略することができる。もう一つのマスキング効果とは、音圧の異なる複数の音の影響を利用したものである。たとえば、深夜の部屋では、時計の秒針の音が聞こえるが、騒々しい昼間はまったく聞こえない。このような大きな音の影響により、小さい音が聞こえなくなることをマスキング効果と呼ぶ。MPEGオーディオでは、これらの耳の特性を生かした符号化が行われている。音が最小可聴限界よりも下にしか存在しない場合、サンプリングする必要はないので、省略される。逆に聞き取りやすい部分では、ビットの割り当てを増やして精度を上げ、データの劣化を防いでいる。この他にも、圧縮の定番技術であるMDCTや、ハフマン符号化を用いて圧縮効果を高めている。(この項は月刊アスキー'98年10月号を一部参考にしています)


戻る

次へ進む