윈도우에서 애플 CoreAudio AAC 인코더 사용

윈도우에서 CoreAudio AAC 또는 ALAC으로 파일을 인코딩하려면 qaac 커맨드 라인 프론트엔드를 사용하면 된다.

필요한 것

  • QAAC (CLI QuickTime AAC/ALAC encoder)
  • CoreAudio AAC 인코더는 아이튠즈, 퀵타임을 인스톨해도 되고 필요없다면 링크에서 “iTunes64Setup.exe”를 받아 7zip 같은 압축 프로그램으로 풀어서 “AppleApplicationSupport64.msi”만 설치
더 보기 “윈도우에서 애플 CoreAudio AAC 인코더 사용”

16비트 보다 24비트 오디오가 해상도가 좋다? 오디오 미신

16bit vs 24bit 오디오 비트뎁스 (+32bit float?)

오디오 비트뎁스(Bit depth)는 무엇이고 음질에 어떤 영향을 줄까요? 레코딩 시에는 어떤 비트뎁스를 사용해야 할까요?

16bit vs 24bit 오디오 비트뎁스 / 고음질 오디오 m4a (AAC LC, TVBR q127)

비트뎁스(bit depth) 정리

  • 음원을 재생하는데는 CD 표준인 16비트의 다이나믹 레인지도 충분하다.
  • 16비트의 다이나믹 레인지는 96.3 dB, 24비트는 144.5dB이다(참고: 다이나믹 레인지가 아무리 넓은 음악이라고 할 지라도 5~60dB를 넘지 않는다).
  • 비트뎁스 차이는 다이나믹 레인지(dynamic range) 차이이며 소리의 해상도(?)와는 관계가 없다(해상도, 디테일이 어쩌구 하는 것은 도대체가 어디서 나온 환상인가요?).
  • 디지털 카메라 해상도와 오디오 비트뎁스를 비교할 수 없다.
  • 16/24비트는 노이즈 플로어 차이가 있을 수 있으나 대부분 느낄 수 없는 정도이며 있다 하더라도 청각 마스킹(Auditory Masking) 효과 때문에 들리지도 않는다.
  • 레코딩/편집 시에는 24비트를 사용하는 것이 좋다(노이즈 플로어와 증폭이 이유).
  • 32bit float을 지원하는 오디오 레코딩 기기는 16/24비트 (fixed-point) 와는 다르게 입력 신호가 0dBFS를 넘겨도 클립핑되지 않는다(아예 클립핑이 안되는 것은 아닌데 그 정도 수준이면 이미 아날로그 입력단에서 찌그러집니다).
  • 비트뎁스는 비압축 신호에서만 의미가 있으며 손실 압축 코덱(MP3, AAC)은 비트뎁스라는 것이 없습니다(예를 들어서 MP3 같은 압축 코덱은 오디오 신호를 비트뎁스의 시간 데이터 샘플로 표현하는 것이 아니라 주파수 샘플로 저장하기 때문).
16/24비트에서 샘플 간의 최소 amplitude값 차이

관련글

참고

  • 영상에서 사용한 마이크와 인터페이스: EjiMic v1(DIY), MixPre-3 II – Sound Devices
  • 전체 오디오 레벨은 -14 LUFS로 노멀라이즈 했습니다.
  • 유튜브 챕터와 자막을 지원합니다.

MQA 음원의 진실

온라인 음원 시장에서 고음질 코덱과 이것을 지원하는 오디오 기기들은 소비자를 현혹시키고 새로운 소비를 유발하는데 휼륭한 원동력이 됩니다.

FLAC(Free Lossless Audio Codec)처럼 누구나 자유롭고 무료로 사용할 수 있는 “무손실” 압축 코덱과 비교하면 MQA 코덱은 고음질 음원과 전용 디코딩 하드웨어라는 달콤한 유혹으로 얼마나 쉽게 소비자를 우롱하고 주머니를 털어갈 수 있는지 잘 보여주고 있는 사례라고 할 수 있습니다.

MQA 코덱의 실체를 잘 보여준 영상이 있습니다.

테스트 결과의 요약

  • MQA는 원본의 샘플레이트와 관계없이 무손실이 아니다.
  • 대부분의 MQA 음원이 44.1kHz 마스터(원본)를 인코딩한 것이고 고주파(나이퀴스트 한계 = 44.1kHz/2) 컨텐츠를 포함하고 있지 않다.
  • 원본 음원에 고주파 데이터가 존재할 경우 MQA에서는 이것이 상호 변조(intermodulation)에 의해 가청 주파수 영역 내의 왜곡이 된다(왜 이렇게 되는지는 링크 참고: 샘플 레이트는 높을수록 좋을까?).
  • MQA는 고주파 컨텐츠를 복원하지만 잡음과 artifact이 생기며 다이나믹 레인지가 줄어든다(위 세번째와 같은 이유).
  • 원본 트랙이 16bit/44.1kHz인 경우 Tidal은 더 이상 무손실 FLAC을 제공하지 않으며 “Master”와 “HiFi”는 차이가 없다.
  • 원본 트랙이 24bit이면 비트뎁스를 줄이고(= 다이나믹 레인지 감소) 샘플레이트가 44.1kHz가 아닌 경우에는 리샘플하므로 무손실이 아니다.
  • 원본의 비트뎁스/샘플레이트가 16bit/44.1kHz 보다 높은 경우에 MQA 인증(Authentication)은 더 이상 무결성을 보장하지 않는다.

추가 사항

테스트 결과로만 보면 영상에서 내린 결론이 대부분 맞다고 생각됩니다.

현재 반론으로는 원본의 샘플레이트가 16bit/44.1kHz인 것을 어떻게 알 수 있는가에 대한 것이 있습니다.

하지만 이것은 FLAC 파일에 기록되는 마스터 원본의 정보로 충분히 알 수 있는 것이기 때문에 논란의 여지는 그다지 없어보입니다.

캐나다의 싱어송라이터인 닐 영이 MQA 코덱의 불합리함을 인지하고 Tidal에서 본인의 앨범을 삭제하면서 남긴 글 중에 이런 것이 있습니다.

링크: https://neilyoungarchives.com/news/1/article?id=Tidal-Misleading-Listeners

“타이달의 마스터는 내가 만든 마스터 원본이 아니며 로열티를 받기 위한 수단이다. 그 로열티를 청취자가 내야하는 것에 나는 찬성하지 않는다.”

이 글은 내용을 추가/업데이트하겠습니다.

샘플 레이트는 높을수록 좋을까?

샘플 레이트는 높을수록 좋을까?

높은 샘플 레이트가 무조건 좋을까? 하이 레졸루션 오디오의 불편한 진실

샘플 레이트는 높을수록 좋을까? / 고음질 오디오 m4a (AAC LC, TVBR q127)

샘플레이트에 대한 오해

샘플레이트에 대한 오해를 만드는 대표적인 이미지(주로 마케팅에 사용됨)

192kHz 같은 높은 샘플레이트 음원이 하이 레졸루션 오디오 어쩌고 하면서 좋다는 오해는 위의 이미지와 같이 샘플을 직선으로 이어서 표현한 것에서 시작된 경우가 대부분일 것이다, 즉 낮은 샘플레이트에서는 거친 계단처럼 보이고 높은 샘플레이트에서는 아날로그 신호와 점점 흡사하게 보이므로 고음질이다라는 잘못된 정보를 주는 데 매우 성공적이고 교묘한 마케팅인 셈이다.

하지만 실제 오디오 파형은 위 이미지와 같이 1차원적인 직선이 아니다.

DAW마다 오디오 샘플을 보여주는 방식이 다를 뿐이다.

DAW(digital audio workstation)마다 오디오 샘플을 보여주는 방식이 다른데 예를 들어서 리퍼(Reaper)에서는 샘플을 직선으로 연결해서 보여주고 오디션(Adobe Audition)에서는 아날로그 원본과 같은 완만한 곡선으로 연결해서 보여준다(양쪽 다 재생하면 당연히 완벽한 사인파다. 같은 파일이니까).

8kHz 샘플레이트
192kHz 샘플레이트

위 이미지는 동일한 주파수 사인파를 8kHz와 192kHz 샘플레이트로 저장한 파일이다. 재생하면 두 가지 모두 동일한 사인파로 재생된다.

PCM 디지털 샘플이 오디오 신호로 변환되는 과정에는 정해진 규칙이 있기 때문에 위 이미지와 같이 A와 B 샘플이 아날로그 오디오 신호로 바뀔 때는 그 사이에 더 많은 샘플이 있다고 해서 더 좋은 아날로그 신호가 되는 것이 아니다!

상호 변조 왜곡(Intermodulation)

96kHz 이상의 높은 샘플레이트에서 발생할 수 있는 가청 주파수 내의 상호 변조 왜곡(자세한 것은 영상에서 설명하였음).

상호 변조 (intermodulation)

샘플레이트 정리

96kHz 이상의 높은 샘플레이트가 무조건 좋다? 아니다!

재생은 16bit/44.1kHz면 충분하고 그보다 높은 샘플레이트는 가청 주파수 한계인 20kHz 이하를 재생하는데 아무런 장점도 없고 오히려 상호 변조(intermodulation)에 의한 왜곡만 증가시킬 수 있다.

오디오를 녹음/편집하는 환경에서는 24bit/48kHz를 사용하는 것이 좋고 그보다 높은 샘플레이트는 비선형 처리(non-linear processes)에 도움이 될 수 있으나 전체 작업 환경을 높은 샘플레이트로 하기보다는 필요한 플러그인에서만 오버 샘플링하는 것이 효율적이다.

맺음말

10년 전쯤에 신문에서 오디오 전문 기자라는 사람이 어떤 dac 앰프를 소개하면서 쓴 글이 아직도 기억이 나는데 “CD를 리핑 한 원본(44.1kHz/16bit)을 192kHz/24bit DAC로 재생했더니 해상도가 너무 좋더라…”는 어질어질한 내용이었다.

고음질 음원 시장과 또 그것을 지원하는 오디오 기기를 위한 마케팅으로 인해 시작된 디지털 오디오에 대한 잘못된 정보는 예전이나 지금이나 어딜 가나 흘러넘친다.

정말 좋은 음악은 16/24bit 비트뎁스나 96, 192kHz 샘플레이트 같은 숫자 놀음이 아니다. 제대로 마스터링 된 44.1kHz/16bit 음원은 좋은 음악을 감상하는데 차고 넘친다.

비트뎁스/샘플레이트는 음원을 만드는 사람들이나 신경 써야 할 숫자일 뿐이라는 것을 알고 리스너 입장에서는 음악 자체를 즐겨야 할 것이다.

내 돈 써서 더 좋은(?) 음원에 더 고가의 DAC으로 “고음질”을 체험(플라시보 효과에 불과한)하고 있다면 계속 그렇게 하는 것도 말리지는 않는다. 그러나 본인이 만족하는 것에서 끝나야지 그것이 마치 사실인 것처럼 말하는 것은 본인의 무지를 드러낼 뿐이라는 것을 알아야한다.

관련 글/영상

디지털 오디오를 이해하는데 바이블 같은 영상, 6분 정도부터 보는 것을 추천