音質とは、音や声の品質・性質のこと。質が高いものを「高音質」、質が低いものを「低音質」と呼称する。
概要
音質は、音を聞いた人物の主観的に基づいた良し悪しにより主に評価され、録音再生装置など機器での解像度などでも理論的な側面から評価を受けることがある(後述)。要するにその人が聞いてどう思うか、理論に基づいてその音がいいのか、悪いのかを判断する目安が音質である。
人間の聴覚的な「音質」の判断について
そもそも音とは、空気の振動であり、音の三大要素(高さ (周波数)、大きさ (dBなどで表現される大きさや音の圧感=音圧)、音色(周波数成分))で構成される。人間はこの3つの要素と明朗度や了解度、音楽の質(これを音質の良し悪しの基準という者もいる)を図る。音の創作などでは「音に正解はない」という言葉が頻出されるように、人間が感じる音質の良さというものは聴者本人の感覚によるもので、「この音がよい」というものはほとんどが感覚的なものであり、正解は存在しない。ただし、音の悪しを人間が判断する基準は大体決まっており、この判断できる材料から音質の評価が出来る。
一例として、下記などが挙げられる。
- 音源の趣旨とは異なる音声が入り込んでいる(外気ノイズや電気ノイズ、内容と関係ないしゃべり声などの騒音が入っている)
- 音源の音圧が過剰にかかっている(コンプレッサーなどのかかりすぎにより、音が割れていたり、聞き取りずらい状態になっている)
- 反響性が高い(部屋の中で広く響いたような音がして聞き取りにくい)
- 音に粗さが目立つ(ザラザラした音になっている)
- 音に角が立つ(音がシャープな状態)
- 音が濁ったように聞こえる(音がクリアではない)
心理音響評価量という測定法では、耳の構造や聴覚神経の働き、人間に聴感実験を行った結果から人間の聴覚的に音質が良いと思うか、悪いと思うかを数値化することが出来る。これらを心理音響技術といい、音響機器の設計などに役立てられている。
機器・電子的な「音質」ついて
音は前述では空気の振動であると記述したが、音はデジタルやアナログなどの電気信号に変換することができる。最も具体的な例では、マイクが挙げられる。マイクは空気の振動で磁石や金属板を震わせることで空気振動を電気信号として取り出すことを可能としている。マイクの良し悪しや収録した音源の良し悪しの判断には、原音から劣化がないか、透明性はどの程度か、音の自然さ、雑音や歪みの無さ、主観的印象を基にされる。マイク以外の機器においても同じような判断で機器の良し悪しが比べられるが、これらは電子信号の数値と聴感上を基とした判断となるため、人間の聴覚的な判断よりも理論的に判断できる要素は多い。
例えば、インピーダンス(Ω)という値では、我々一般家庭で使用する機械はこの値が高いものが使用されている(高いインピーダンスのことを「ハイインピーダンス」と呼称する。)。一方で、業務用と言われるプロオーディオといった製品、音質にこだわった用途のために開発された商品ではインピーダンスは低い(低いインピーダンスを「ローインピーダンス」と呼ぶ)。インピーダンスは低いほどノイズが入りにくく、音質が求められている顧客や現場はこのローインピーダンスである商品が使用される。
ヘッドホンにおいては、このインピーダンスに加え、「可聴周波数」という指数が使用される。これは「どこからどこまでの音の高さであればこのヘッドホンは聞くことが出来るか」を示すことが出来、音の解像度の良し悪しを判断することが出来る。この音の聞ける範囲によってそのヘッドホンの特色をある程度図ることが出来るが、ヘッドホンのようなリスニング用の商品では数値では表しにくい「音色」の要素が大切になってくる。聞くうえで低い音を特徴とするか、高い音を特徴とするか、様々な用途のニーズに合わせた商品が販売されている。これらも「この音は良い・悪い」という判断がされるため、音の性質という意味合いで音質という言葉が使用される。
民生用オーディオ機器の高音質を求める中で、ある程度の境地に達しているものを「ピュアオーディオ」と呼ぶ。ノイズを拒むがために、ノイズが遮断できるとされるケーブルを購入したり、素材にこだわったというターンテーブルを購入するなど信憑性のあるものから、実際に消費者庁から調査が入った紛い物まで様々な商品が存在する。また、この音質を求める中で「エージング」と呼ばれる同じ音源を延々と流し続け、イヤホンやヘッドホンなどの音響機器が音を鳴らすことを慣れさせ、音の出しを良くするなどといった行動をする者がいるが、これは研究機関により、プラシーボ効果と認められているため、実際には効果がない。
データ化したデジタル音源においての音質の定め方として、「サンプリング周波数」と「ビットレート」というものがある。サンプリング周波数は、データ化した音を1秒間にどれくらいの回数細かく刻んでデータ化をするかを決める指数で、CDなら4万4,100回=44.1KHz、テレビなら4万8千回=48KHzが使用される(あくまで一例)。ビットレートは、データ化した音1秒間にどれだけデータを載せるかを決める指数(一般的に16bit、24bitが使用される。)のこと。双方高ければ高いほどデータとしての音は質が高くなるが、データ量も増える。また、これらの数値をあげ、聞き比べたところで、どんな人間でも聞き分けることはほぼ困難である。
昨今「ハイレゾ」と呼ばれる商品が大量に商品棚に陳列されているが、これはこのサンプリング周波数とビットレートが「CDよりも数値的に解像度が高い音源」若しくはそれを再生できる機器を主に指す(日本オーディオ協会 掲示、「定義と運用」に詳細な定義の"一例"が掲示されている)。つまり、この法則でいけばテレビで流れる音源はすべてハイレゾであり、CD音源を数値を強制的に高く(アップコンバート)し、音源の内容はCDと同様なものの場合でもハイレゾと語れるため、音源や再生機器でもハイレゾという表示がある=高音質というわけではない。また、ハイレゾ音源を制作する各レコーディング会社の多くは「ハイレゾ音源を作る際には解像度が高い分、本物の音を聞かせたい」という意図からハイレゾ音源専用にマスタリング(音楽を作る最終工程)を行い、本来よりも音圧を低く設定する(音圧戦争を参照)場合もあるが、逆に意図は不明だが、ハイレゾ音源の方が音圧がかなり高く、せっかく解像度が高くなったのにも関わらず、ハイレゾ音源のみ音圧で音割れがしているなどの減少が起き、音質を下げる行為をする企業も存在していることは事実である。
デジタル音源では、「サンプリング周波数」と「ビットレート」を計算し、どれだけ音のデータの送信量がかかるかを示す値「bps」が使用される。音声のデジタルデータフォーマット、MP3の最高音質は320 kbps、CD(リニアPCMの場合)は1.4112 Mbpsが上限となっている。ここでいう音質は音が表現できるデータ量の幅のことを示すため、聴感上の音質は無視されている。つまり、いくら動画サイトで「この音源は○○kbpsでアップしているから音質がいい」という表記があったとしても、必ずしもその音源が聴感上で音質がいいと感じられるとは限らない。
動画共有サービスにおいての音質
動画共有サービスにおいて音質は画質と並んでその映像の良し悪しを決める大事な要素になっている。
2020年現在ではニコニコ動画の投稿可能な最高な解像度の値は、48KHz、192kbpsになっている。ニコニコ動画では現在、動画プレーヤー上で音圧や音量の聞こえ方を一定にする「音量の自動調整」機能がデフォルトでオンになっており、ラウドネス(-15LUFS)という指標を使っている(参考: ニコニコ動画のラウドネスノーマライゼーション(自動音量調整機能)について)。ユーザーはONとOFFでこの音量調整を切り替え、元の音質に近い音源を聞くことが可能である。
YouTubeでは、大きく分けて2つの仕様が存在する。一般的な動画の仕様では、96KHz、384 kbps(ステレオ)までが可能になっており、YouTubeでもニコニコ動画同様にラウドネスの基準を設けて自動的に調整を行っているのだが、YouTubeではこの自動調整を動画のサイトエンコード(投稿するサイトに合わせて動画を変換するシステム)の時点で勝手に音質を変化させてしまい、ある程度低い音や高い音は聞くことが出来なくなってしまう。そのため、クリエイターが表現したかった音をリスナーに伝えられない可能性がある。一方で一部の承認されたクリエイターのみが変換されるAV1というコーデックでは、非圧縮の形式でエンコードされるため、ニコニコ動画よりもかなり音質の高い音源が出力される。
関連動画
関連コミュニティ・チャンネル
関連項目
- 4
- 0pt