MP3オーディオ形式はどのようにデータサイズを削減しますか?
1。精神音響モデル: これがMP3圧縮の中核です。 それは、人間の耳が音をどのように知覚するかに基づいています。 エンコーダーはオーディオ信号を分析し、より大きな音でマスクされる可能性が高い頻度とサウンドを識別したり、聴覚に対してあまり知覚できません。 これらのマスクされた周波数は、非常に圧縮されるか、完全に破棄されます。 たとえば、大音量の低周波サウンドで同時に再生される静かな高周波サウンドは完全に聞こえない可能性があるため、削除されます。
2。周波数変換: オーディオ信号は、時間ドメイン(時間の経過に伴う振幅)から周波数ドメイン(異なる周波数の振幅)に変換されます。これは通常、修正された個別のコサイン変換(MDCT)を使用して行われます。この表現により、個々の周波数を容易に識別して操作できます。
3。量子化: 周波数分析の後、各周波数成分の振幅値は量子化されます。 これは、それらが限られた数の値に丸められていることを意味します。 これにより、情報の喪失が発生しますが、それほど重要ではない頻度が特定され、削除される可能性があるか、激しく圧縮されているため、可聴衝撃が最小限に抑えられます。
4。 Huffman Coding: 最後に、量子化されたデータは、Huffman Codingと呼ばれる可変長コードを使用してエンコードされます。これにより、より短いコードをより頻繁なデータに割り当て、より頻繁なデータに長いコードを割り当て、さらなるデータ削減につながります。
本質的に、MP3は、人間の聴覚の欠陥と制限を利用して、許容可能なオーディオの品質を維持することを目指しながら、オーディオを表すために必要なデータの量を大幅に削減します。 圧縮のレベル(したがってサイズの削減)を調整することができ、さまざまなファイルサイズとオーディオ品質のさまざまなレベルになります。 圧縮比が高いと、ファイルが小さくなりますが、潜在的に顕著なアーティファクトまたは忠実度の損失につながります。