みなさん、音楽は好きですか?
最近ではCDなどではなく、ダウンロードやストリーミング再生で音楽を楽しんでいる人も多いかと思いますが、データとして保存されている音楽はいったいどんな形式になっているのでしょうか?
それぞれの形式の違い、メリット、デメリットを調べてみました。
音声圧縮の種類
音楽ファイル形式には
- 非圧縮
- 非可逆圧縮
- 可逆圧縮
ファイルベースでの圧縮によりファイルサイズを軽減し、ダウンロードによる時間や保存容量を減らすことができます。
非圧縮形式
その名の通り圧縮されていないファイル。 要はオリジナルのデータです。
よく使われるのは以下の形式です。
- WAV
- AIFF
メリットはデータの正確性。しかしそれゆえファイルサイズが大きいというデメリットもあり、1分の音声ファイルで約10MBも使用します。
Windowsだと「WAV」、Machintoshだと「AIFF」を使用するのが一般的です。
WAV (WAVE:ウエーブ)
マイクロソフト社とIBM社が規格制定した、Windows標準の音声ファイル形式で、WAVE形式とも呼ばれます。
通常は非圧縮で音質は良いですが、サイズが非常に大きなファイルです。
WAV形式のファイルは、iTunesに取り込むときにAAC形式/MP3形式に変換されます。 なお、WAVには圧縮を指定することも出来ますが、あまり利用例は無いようです。
AIFF (Audio Interchange File Format)
アップル社が規格制定した、Macintosh標準の音声ファイル形式です。 こちらもWAV同様非圧縮で音質は良いですが、サイズが非常に大きなファイルです。 非可逆圧縮機能をもたせた拡張フォーマット、AIFCもあります。
非可逆圧縮形式
この圧縮形式がみなさんがもっとも利用している形式でしょう。
- MP3
- AAC
- WMA
- Vorbis
このようなファイル形式です。
「人間の可聴域は20Hz~20000Hz」
このファイル形式は人間が聞くことが出来ない高域部分を切り捨てることで圧縮し、ある程度の音質を保ちながらもファイルサイズを抑えられるというメリットがあります。
それでもオリジナルのデータに比べると音質が劣るのがデメリットです。
中でも「MP3」は1番認知度の高いファイル形式で、その後継として、より高音質を実現させるために生まれた「AAC」の2つがよく使用されます。他にも「WMA」「Vorbis」などもこの形式です。
MP3 (MPEG-1 Audio Layer 3)
動画圧縮規格「MPEG-1」で使用される音声フォーマットの一つです。
広く普及している形式で、一般的なデジタルオーディオプレイヤーの多くがこの形式に対応しています。 この形式で圧縮しておけば、iPod以外でも多くのプレイヤーで再生できます。
MP3のビットレートは、一般的には192kbps以上を指定すれば、ほとんど元の音楽との区別がつかなくなるといわれています。
最近はプレイヤーの容量も大きくなってきたので、MP3の最高音質である320kbpsで取り込むのも良いと思います。
また、CBR(固定ビットレート)に対して、曲の中でビットレートを変えながら効率よく最適なデータにしていくVBR(可変ビットレート)という方法もあります。
ただし、VBRを使用すると、曲によっては部分的に必要以上に高ビットレートとなってしまい、プレイヤーによっては性能不足で音がとぎれるなどの不具合が発生する場合があります。
AAC(Advanced Audio Coding)
動画圧縮規格の「MPEG-2」「MPEG-4」で使用される音声フォーマットの一つです。
圧縮効率が高く、MP3に代わる優れたフォーマットとして、iTunesではこのAAC形式が標準の圧縮形式として選択されています。
ただ、過去に製品間での互換性が低い時代があり、まれに他社ソフトで作られたAACファイルがiPodで再生できないことがあります。 AAC形式を使う場合のビットレートは、128kbps以上、特に高音質を希望するなら256kbps以上が良いと思います。 iTunesストアで扱う楽曲もAAC形式で、拡張子が“.m4a”です。
WMA (Windows Media Audio)
マイクロソフト社がウインドウズOSのために開発した音楽圧縮形式です。
Windows系の多くの音楽配信ソフトやデジタルオーディオプレイヤーで採用されています。 同じ音質であれば、MP3の半分までファイルサイズを小さくできると言われています。 WMA形式のファイルは、iTunesに取り込むときにAAC形式/MP3形式に変換されます。
ただし、ダウンロード購入した、著作権保護(DRM)が付いた曲はAAC形式/MP3形式に変換することは不可能です。
可逆圧縮形式
この形式はオリジナルのデータを保ったまま圧縮します。
- FLAC
- ALAC
再生時は解凍され元の非圧縮形式に戻ることができるので、音質面ではオリジナルのデータと変わらないということになります。
非圧縮形式よりもファイルサイズは軽減できますが、それでも約半分程度なので、非可逆圧縮形式に比べるとファイルサイズは大きめで、エンコード・デコードの時間も要します。
また、現在主流の音楽配信サイトで扱われていないことが多く、再生出来る機器も非圧縮形式に比べると少ないです。この形式で最も一般的なのは「FLAC」、Appleでは「ALAC」という独自のフォーマットを採用しています。
FLAC (Free Lossless Audio Codec)
オープンソースとして開発されている、ロスレスオーディオコーデックです。
特許の制約を受けることはなく、どこかの会社の所有物というわけでもなく、使用にライセンス費用も発生しません。
また、サンプリング周波数は1Hz – 655.3kHz (655,350Hz)、量子化ビット数は4~32bitまで対応しているので、 いわゆるハイレゾ(人間の可聴音域を超えた周波数要素を含む)音楽もエンコードできます。 ただしロスレスのため圧縮率は低く、ファイルサイズはせいぜい半分程度にしかなりません。 iOS11でまずは「ファイル」アプリからの再生に対応しました。
ALAC(Apple Lossless:アップル ロスレス)
Apple Losslessは、アップル社がiPodのために開発した可逆圧縮フォーマットです。
音楽CDと同じ音質を維持することができますが、MP3などの非可逆圧縮フォーマットに比べて圧縮率は良くありません。 非可逆圧縮では音質の低下が目立ちやすい、クラシックなどに限定して利用すると良いかもしれません。
なお、このフォーマットは2011年10月27日にオープンソースとして公開されました。 無料のApacheライセンスの元、自由に利用できます。
ビット深度、サンプリングレート、ビットレートの関係
音楽データにはビット深度、サンプリングレートという1秒間の音楽データ量を示す数字が存在します。
そしてその2つを掛け合わせたものが「ビットレート」になるのです。
サンプリングレート
別名サンプリング周波数。1秒あたり何万分割して音を採取するかを示します。
大きければ大きいほど分割数は増え、滑らかな音となり音質は向上します。
ちなみにCDは44100Hzです。
ビット深度
別名量子化ビット数、ビッドデパス、サンプルビット数。
こちらは分割されたデータにどれだけの容量を与えるかを示します。
大きければ大きいほど音の細かさ、大小などが細かく表現され音質は向上します。
CDは16bit。
ビットレート
bpsと表示されるもので、1秒あたりのデータ量を示します。
先ほどの「サンプリングレート」と「ビット深度」を掛け合わせたものです。
ステレオファイルの場合音は2つなので、式にすると…
サンプリングレート(Hz) × ビット深度(bit) × 2 = ビットレート(bps)
ビットレートが大きいということは、「サンプリングレート」と「ビット深度」が大きいということになり、音質は良いということになります。
ちなみにCDの場合は
44100(Hz) × 16(bit) × 2 =1411200(bps)
となります。
なぜそんなに形式があるか
それぞれにメリット、デメリットがあり、うまく使い分けることでより良いデータ活用ができるのです。
例えば「データ量は気にしないから、このアルバムだけは1番良い音質で保存したい!」なんて場合は、「WAV」や「AIFF」で取り込み、なるべく大きいビットレートで保存。対応機器をお持ちの方ならストレージ節約のため「FLAC」や「ALAC」も選択肢に入りますね。
「音質は二の次!たくさんの曲をスマホに取り込みたい!」 そんな方は、「MP3」で取り込みなるべく低めのビットレート(128kbps以下は音楽ファイルとしてあまり利用されていませんが)で取り込むなど、自分のスタイルに合わせて音楽をデータにするといいかもしれませんね。
ちなみに僕が利用しているAppleMusicは「AAC」の256kbpsなので音質とデータ量の節約の両方のバランスを重視したフォーマットと言えるでしょう。