MQA 음원의 진실

온라인 음원 시장에서 고음질 코덱과 이것을 지원하는 오디오 기기들은 소비자를 현혹시키고 새로운 소비를 유발하는데 휼륭한 원동력이 됩니다.

FLAC(Free Lossless Audio Codec)처럼 누구나 자유롭고 무료로 사용할 수 있는 “무손실” 압축 코덱과 비교하면 MQA 코덱은 고음질 음원과 전용 디코딩 하드웨어라는 달콤한 유혹으로 얼마나 쉽게 소비자를 우롱하고 주머니를 털어갈 수 있는지 잘 보여주고 있는 사례라고 할 수 있습니다.

MQA 코덱의 실체를 잘 보여준 영상이 있습니다.

테스트 결과의 요약

  • MQA는 원본의 샘플레이트와 관계없이 무손실이 아니다.
  • 대부분의 MQA 음원이 44.1kHz 마스터(원본)를 인코딩한 것이고 고주파(나이퀴스트 한계 = 44.1kHz/2) 컨텐츠를 포함하고 있지 않다.
  • 원본 음원에 고주파 데이터가 존재할 경우 MQA에서는 이것이 상호 변조(intermodulation)에 의해 가청 주파수 영역 내의 왜곡이 된다(왜 이렇게 되는지는 링크 참고: 샘플 레이트는 높을수록 좋을까?).
  • MQA는 고주파 컨텐츠를 복원하지만 잡음과 artifact이 생기며 다이나믹 레인지가 줄어든다(위 세번째와 같은 이유).
  • 원본 트랙이 16bit/44.1kHz인 경우 Tidal은 더 이상 무손실 FLAC을 제공하지 않으며 “Master”와 “HiFi”는 차이가 없다.
  • 원본 트랙이 24bit이면 비트뎁스를 줄이고(= 다이나믹 레인지 감소) 샘플레이트가 44.1kHz가 아닌 경우에는 리샘플하므로 무손실이 아니다.
  • 원본의 비트뎁스/샘플레이트가 16bit/44.1kHz 보다 높은 경우에 MQA 인증(Authentication)은 더 이상 무결성을 보장하지 않는다.

추가 사항

테스트 결과로만 보면 영상에서 내린 결론이 대부분 맞다고 생각됩니다.

현재 반론으로는 원본의 샘플레이트가 16bit/44.1kHz인 것을 어떻게 알 수 있는가에 대한 것이 있습니다.

하지만 이것은 FLAC 파일에 기록되는 마스터 원본의 정보로 충분히 알 수 있는 것이기 때문에 논란의 여지는 그다지 없어보입니다.

캐나다의 싱어송라이터인 닐 영이 MQA 코덱의 불합리함을 인지하고 Tidal에서 본인의 앨범을 삭제하면서 남긴 글 중에 이런 것이 있습니다.

링크: https://neilyoungarchives.com/news/1/article?id=Tidal-Misleading-Listeners

“타이달의 마스터는 내가 만든 마스터 원본이 아니며 로열티를 받기 위한 수단이다. 그 로열티를 청취자가 내야하는 것에 나는 찬성하지 않는다.”

이 글은 내용을 추가/업데이트하겠습니다.

샘플 레이트는 높을수록 좋을까?

샘플 레이트는 높을수록 좋을까?

높은 샘플 레이트가 무조건 좋다거나 더 많은 샘플이 저장되니까 해상도가 높다거나 이런 소리는 디지털 오디오에 대한 이해가 전혀 없는 사람들이 그저 상상으로 만들어 낸 말일뿐이다.

샘플 레이트는 높을수록 좋을까? / 고음질 오디오 m4a (AAC LC, TVBR q127)

샘플레이트에 대한 오해

샘플레이트에 대한 오해를 만드는 대표적인 이미지(주로 마케팅에 사용됨)

192kHz 같은 높은 샘플레이트 음원이 하이 레졸루션 오디오 어쩌고 하면서 좋다는 오해는 위의 이미지와 같이 샘플을 직선으로 이어서 표현한 것에서 시작된 경우가 대부분일 것이다, 즉 낮은 샘플레이트에서는 거친 계단처럼 보이고 높은 샘플레이트에서는 아날로그 신호와 점점 흡사하게 보이므로 고음질이다라는 잘못된 정보를 주는 데 매우 성공적이고 교묘한 마케팅인 셈이다.

하지만 실제 오디오 파형은 위 이미지와 같이 1차원적인 직선이 아니다.

DAW마다 오디오 샘플을 보여주는 방식이 다를 뿐이다.

DAW(digital audio workstation)마다 오디오 샘플을 보여주는 방식이 다른데 예를 들어서 리퍼(Reaper)에서는 샘플을 직선으로 연결해서 보여주고 오디션(Adobe Audition)에서는 아날로그 원본과 같은 완만한 곡선으로 연결해서 보여준다(양쪽 다 재생하면 당연히 완벽한 사인파다. 같은 파일이니까).

8kHz 샘플레이트
192kHz 샘플레이트

위 이미지는 동일한 주파수 사인파를 8kHz와 192kHz 샘플레이트로 저장한 파일이다. 재생하면 두 가지 모두 동일한 사인파로 재생된다.

PCM 디지털 샘플이 오디오 신호로 변환되는 과정에는 정해진 규칙이 있기 때문에 위 이미지와 같이 A와 B 샘플이 아날로그 오디오 신호로 바뀔 때는 그 사이에 더 많은 샘플이 있다고 해서 더 좋은 아날로그 신호가 되는 것이 아니다!

상호 변조 왜곡(Intermodulation)

96kHz 이상의 높은 샘플레이트에서 발생할 수 있는 가청 주파수 내의 상호 변조 왜곡(자세한 것은 영상에서 설명하였음).

상호 변조 (intermodulation)

샘플레이트 정리

96kHz 이상의 높은 샘플레이트가 무조건 좋다? 아니다!

재생은 16bit/44.1kHz면 충분하고 그보다 높은 샘플레이트는 가청 주파수 한계인 20kHz 이하를 재생하는데 아무런 장점도 없고 오히려 상호 변조(intermodulation)에 의한 왜곡만 증가시킬 수 있다.

오디오를 녹음/편집하는 환경에서는 24bit/48kHz를 사용하는 것이 좋고 그보다 높은 샘플레이트는 비선형 처리(non-linear processes)에 도움이 될 수 있으나 전체 작업 환경을 높은 샘플레이트로 하기보다는 필요한 플러그인에서만 오버 샘플링하는 것이 효율적이다.

맺음말

10년 전쯤에 신문에서 오디오 전문 기자라는 사람이 어떤 dac 앰프를 소개하면서 쓴 글이 아직도 기억이 나는데 “CD를 리핑 한 원본(44.1kHz/16bit)을 192kHz/24bit DAC로 재생했더니 해상도가 너무 좋더라…”는 어질어질한 내용이었다.

고음질 음원 시장과 또 그것을 지원하는 오디오 기기를 위한 마케팅으로 인해 시작된 디지털 오디오에 대한 잘못된 정보는 예전이나 지금이나 어딜 가나 흘러넘친다.

정말 좋은 음악은 16/24bit 비트뎁스나 96, 192kHz 샘플레이트 같은 숫자 놀음이 아니다. 제대로 마스터링 된 44.1kHz/16bit 음원은 좋은 음악을 감상하는데 차고 넘친다.

비트뎁스/샘플레이트는 음원을 만드는 사람들이나 신경 써야 할 숫자일 뿐이라는 것을 알고 리스너 입장에서는 음악 자체를 즐겨야 할 것이다.

내 돈 써서 더 좋은(?) 음원에 더 고가의 DAC으로 “고음질”을 체험(플라시보 효과에 불과한)하고 있다면 계속 그렇게 하는 것도 말리지는 않는다. 그러나 본인이 만족하는 것에서 끝나야지 그것이 마치 사실인 것처럼 말하는 것은 본인의 무지를 드러낼 뿐이라는 것을 알아야한다.

관련 글/영상

디지털 오디오를 이해하는데 바이블 같은 영상, 6분 정도부터 보는 것을 추천

FLAC은 음질이 안 좋다? PCM 원본과 차이가 난다?

FLAC의 음질이 안 좋다? PCM 원본과 차이가 난다?

FLAC은 PCM 원본과 100% 동일하게 재생되는 코덱입니다. 압축 레벨에 따른 영향도 전혀 없는 무손실 압축 코덱입니다.

일반 파일을 zip으로 압축하면 크기만 줄어들고 다시 압축을 풀면 원본 파일과 동일한 것과 같습니다. 그래서 FLAC 파일을 zip으로 압축해 보면 크기가 거의 줄어들지 않습니다.

FLAC은 음질이 안 좋다? PCM 원본과 차이가 난다? / 고음질 오디오 24bit, FLAC

참고

  • 영상에서 사용한 마이크와 인터페이스: SM7b, Motu M4
  • 전체 오디오 레벨은 -14 LUFS로 노멀라이즈 했습니다.
  • 유튜브 자막을 지원합니다.

유튜브 DRC(dynamic range compression)?

2024 추가: 우려하던 일이 실제로 일어났습니다.
유튜브 DRC(dynamic range compression)?

이 글을 작성하는 시점(22년 9월)으로 약 한 달 전부터 유튜브 영상의 전문 통계를 보면 이렇게 DRC(dynamic range compression?)라고 표시되는 경우가 가끔 있습니다.

유튜브는 DRC 테스트하는 중?

동일 계정, 동일 영상에서도 랜덤하게 나올 때가 있고 아닐 때도 있는 것을 보면 아직 모든 플랫폼에 적용한 것도 아니고 테스트 단계인 것 같은데 실제로 컴프레션을 적용하는 것인지는 모르겠고 오디오 레벨에 차이가 있다는 것만 확인했습니다.

-14 LUFS 이하

그러니까 현재는 원본이 -14 LUFS 이하인 경우에 플레이어 볼륨을 100%로 하면 전문 통계에는 “Volume / Normalized 100% / 100%”로 표시되고 음량에 변화도 없습니다.

만약 -14 LUFS 이상으로 마스터링 한 것을 업로드하면 재생할 때 음량이 자동으로 줄어듭니다(아래 이미지 참고).

원본이 -14 LUFS 보다 큰 경우

여기까지가 현재 시점에서 유튜브가 오디오 레벨을 관리(?)하는 방식입니다.

그런데…

DRC가 표시되는 영상의 경우에는 원본보다 음량이 높아진 것을 확인했는데 추측으로는 원본의 오디오가 -14 LUFS 이하로 낮은 경우에는 음량을 자동으로 높여주려는 것이 아닌가 싶습니다.

그러니까 현재는 원본이 -14 LUFS 이하인 경우에는 변화가 없는데 유튜브가 이것(DRC?)을 실제로 적용하게 된다면 모든 영상의 오디오 레벨을 특정 수준(-14 LUFS?)과 비슷하게 맞춰주는 식으로 변화가 생길지도 모르겠습니다.

DRC가 적용되면 과연 좋을까?

물론 이렇게 될 경우에 시청자 입장에서는 편할 수도 있습니다. 현재는 영상마다 오디오 레벨이 다르기 때문에 차이가 클 경우 시청자가 플레이어의 볼륨을 조절해야 하는 불편함이 있습니다.

특히 공중파 방송본을 대충 편집해서 올린 영상을 보면 오디오가 방송 기준인 -23 LUFS라서 유튜브 기준인 -14 LUFS와 비교하면 볼륨이 아주 낮습니다(그리고 제발 뉴스 영상은 deinterlacing 좀 해서 업로드하세요. 옆으로 줄이 쭉쭉가는거 그냥 올리지 말고…).

그런데 유튜브가 알아서 모든 영상의 오디오 레벨을 비슷하게 맞춰서 스트리밍 해 준다면 이러한 불편함은 사라지겠죠.

하지만…

LUFS 기준으로 노멀라이즈를 한다는 것을 전제로 할 때 컴프레션이 함께 적용될 확률도 많아지는 것을 생각해 보면 영상/오디오를 업로드하는 사람 입장에서는 의도치 않은 컴프레션에 의해 다이나믹 레인지가 줄어들 수도 있다는 것을 의미하기 때문에 무조건 좋은 소식은 아닐 수도 있습니다.

물론 아직까지는 추측이며 정식으로 적용된 것이 아니기 때문에 뭔가 또 다른 변화, 소식이 있으면 다시 포스트 하겠습니다.