基本的なオーディオ入門[音源・DAC・ADC編]
基本的なオーディオ入門
はじめに
音楽をいい音で聞きたいなって思っている人向けの記事です。
身内向けでもあるのでかなり適当かも。
(にしてもTabでインデント開けれなれないの使いにくい)
(労災お兄ちゃんのブログ見てインデント消した)
音楽の基本
アナログの話
突然ですが、音質が一番いいと言われている媒体は何でしょうか
実はレコードなんです。
音の基本はアナログです。
例えば、口笛を吹いたとします。
そのときの入力は、唇の振動というアナログ信号であり、耳に入るものも音の波、アナログ信号です。
つまり素のものが、素のまま聞こえているわけですね。
レコードも同じです。
レコードの構造を簡単に説明すると、表面に音と同じ波を物理的に彫ります。
それをレコードプレイヤーの針でなぞります。レコードの針は一種の発電装置になっており、溝の形によって出力される電流値が変わります。それをアンプで増幅してスピーカーで出力します。
図にするとこんな感じですね
最初から最後までアナログ信号になっているのがわかると思います。
つまり、端的に言えば素の状態です。なので音質がいいと言われています。
レコードプレイヤーに、USBメモリ差してディジタル化みたいな機械売ってますけど、あれレコードのいいところ潰してないってなります。(これを全部読めば、理解できると思います。)
アナログをアナログのままだと損失がない
アナログからディジタルへ
それではいつも聞くCDやYoutube Musicなどで聞く曲はどうなんでしょうか?
ここにはいろんな工夫があります。
(ちょっと工学的な話になります。)
当然、レコードのようなものは溝に傷が入るとダメ、歪んでもダメ、持ち運び
には向かない、使いにくい、と利便性というものは無いに等しいです。
ここでアナログ信号をディジタル信号つまり01信号に落とし込むことで利便性を上げます。
アナログ信号をディジタル信号に変換するには符号化と量子化という工程が必要です。
-
標本化とは
横文字で書くとサンプリングです。
このような適当な波が入力されているとします。
ここにさらに周期4倍の波形を入力します。
黒色の点は重なったところの点です。
これが実のところ、これがサンプリングです。
黄色の信号がサンプリング信号といいます。
サンプリング信号の周波数を上げてみましょう。
点が増えましたね。
サンプリングというのはx軸上の点の位置を取ることです。また周波数を上げると点が増えるということもわかりました。
-
量子化とは
結論から書くと、高さを求めることです。標本化でのグラフとの交点を見てみましょう。y座標の位置はグラフに書かれているメモリを読み取って値を算出すると思います。簡単に言うと、これと同く縦の値を算出して2進数化します。
実際の動作をオシロスコープで観測するとこんな感じです。黄色の信号が変換した信号です。
タイミングチャートを観測すると以下のような図となります。
まとめると、標本化と量子化を用いることでアナログデータを、ディジタルデータに変換することができます。
またディジタル信号をアナログ信号にするときも、逆のことを行っているだけで本質的には同じです。
ディジタル信号→アナログ信号に変換する機械のことをDAC[digital to analog converter]
アナログ信号→ディジタル信号に変換する機械のことをADC[analog to digital converter]
といいます。
これは音声だけではなく、アナログ→ディジタルを行う場合は、すべて同じです。
例)スキャン、デジカメ等
-
標本化量子化による誤差
アナログをディジタル信号に置き換える時点で、いくつかの損失とその対策があります。
まず一つ目に、標本化の誤差です。
標本化のグラフを見て、気がついたかもしれませんが、サンプリング信号の周波数が高くなければ、入力信号は正しく変換されません。
例を紹介します。
(黄色がサンプリング信号、緑が入力信号をADCに入力した信号)
これは実際にディジタルアナログコンバータを結線して、オシロスコープで観測した結果です。
サンプリング信号の周波数が入力信号に対して十分高くなければ、綺麗な波を描くことができないということが見て取れます。
サンプリング信号は入力信号に対して2倍より高い周波数がなければ正しくサンプリングできません。(これを標本化定理という)これはフーリエを行えば、簡単に求めることができます。
正しくサンプリングを行えなかったものを折り返し誤差といい、これを防ぐために入力信号に対してローパスフィルタを用いて、折り返し誤差が入るような帯域の周波数信号をカットしています。
量子化による誤差もあります。
これはイメージすれば簡単で、もし8.5の高さの点が取れたとします。
このときグラフのメモリが1メモリ当たり0.5ならば、8.5という値が取れますが、1メモリあたり5ならば切り下げられて5という値になります。
簡単に言うと、電子化したデータはアナログのような緩やかな曲線は描けない。ということです。画像ファイルを拡大したらジャギー(ギザギザのノイズ)が現れるようなものです。
これが量子化誤差です。これの対策としては、メモリを増やす(bit数を増やす)ことが対策となります。また、このbitの数をbit深度といいます。
つまり、サンプリング周波数が高く、bit深度が深いほど高音質となります。
こうして生まれたのがハイレゾ音源となります。
ハイレゾの罠
じゃあ実際にハイレゾってどうなの?というお話です。
結論から言うと「無意味」です。
なぜ無意味か説明します。
人間の可聴領域、すなわちどの周波数までがよく聞き取れるかは、約20Hzから約20kHzまです。30kHzなどの高い周波数の音は、聞こえません。
標本化の際に説明した通り、サンプリング周波数は、サンプリング周波数に対して1/2までの信号を、正しくサンプリングします。
つまりサンプリング周波数がいくら高くても約40kHz以上は無駄ということです。
丁度CDがサンプリング周波数44.1kHzとなっています。
またbit深度は、24bitが最適といわれています。しかし、ディザリングを行えば、16bitでも十分です。
まとめるとCD最強ってことです。
参考
Youtubeの音はどうなの?
その前にビットレートについて、解説します。
ビットレートは一秒間に何bitの情報を持っているかの単位です。
例えばCD音源だと
44.1*10^3(サンプリング周波数)*16(bit深度)*2(左右2ch)となります。
計算すると、1,411,200となります。
これが最強と言われたCDのビットレートです。
ミュージック ビデオのエンコーディングの仕様 - YouTube ヘルプ
実はCD並みの音質は仕様として対応しています。
ただし大半は、AACという非可逆音声符号化規格(圧縮)を用いており、ビットレートは320kbpsのものが大半です。
圧縮とは
簡単に言うとファイルの容量を減らす方法です。代表的なものだとzipとかありますね。
非可逆は文字通り元に戻す。それに対して可逆は元に戻せる圧縮です。
例えば[FFFFFEFF]というデータがあります。
これを可逆圧縮のイメージで圧縮すると[F5EF2]となります。これで8個あったデータが5つまで減らすことができました。また元の[FFFFFEFF]というファイル形式に戻すことができます。
非可逆圧縮はどうでしょうか。
データを[FFFFFFF]にして[F8]とします。つまり間のEを近いとして、ないものとしました。当然元の状態である[FFFFFEFF]に戻すことは不可能です。そのため非可逆圧縮といいます。(元に戻せないため正確に言うと非可逆圧縮は圧縮ではありません。)
このため、音源を集めるときは可逆圧縮で集めるのが最適です。
正直なところ、CD音源を非可逆圧縮したところで、聞きわけられるか怪しいです。
ですが、将来的にもっとお金をかけるようになると、悲しくなるので可逆圧縮で集めるのをおすすめします。(実体験)
WMA(Windows Media Auido)でも簡単に設定できるので、変更をおすすめします。
Flacがおすすめです。
因みに下ではサンプリング周波数を変更できます。
まとめ
まとめとしてはAD変換、フォーマットそしてディジタル化したときの誤差について、理解してもらえたらありがたいです。
音源ですが、自分はオーディオに掛けるお金を10割だとしたら、
スピーカー(イヤホン、ヘッドホン) 5割
アンプ 3割
プレイヤー(CDプレイヤー、DACなど) 1.5割
音源 0.5割
だと思っているので、ハイエンド機を買うまでは音源にはあんまりお金をかけなくてもいいかなって思ってます。
しかし、まだまだサブスクを行っていないアーティストなどは沢山いるので、CDを買う、借りることは多いです。その時は、今日覚えた設定を参考にして、取り込みを行ってください。
ピュアオーディオに騙されず楽しいオーディオライフを!