노멀라이즈가 무엇이고 왜 필요할까? (유튜브 영상을 위한 노멀라이즈)

노멀라이즈가 무엇이고 왜 필요할까? (유튜브 영상을 위한 노멀라이즈)

오디오 노멀라이즈가 무엇인가? 유튜브 영상을 제작할 때 LUFS 노멀라이즈가 왜 필요할까? 노멀라이즈에 대한 오해와 방법

고음질 오디오M4A (AAC LC VBR)

참고

  • 영상에서 사용한 마이크, 인터페이스 : MKE600, Sound Devices MixPre-3 II
  • 전체 오디오 레벨은 -15 LUFS로 노멀라이즈 했습니다.
  • 유튜브 챕터와 자막을 지원합니다.

⌚️ 타임라인
00:00 노멀라이즈가 무엇인가?
00:13 노멀라이즈는 게인과 다를까?
01:02 노멀라이즈는 컴프레션 (normalization vs dynamic compression)
01:37 노멀라이즈가 음질을 바꾼다?
01:56 유튜브 노멀라이즈?
02:26 노멀라이즈의 종류
02:48 피크(Peak) 노멀라이즈
03:49 라우드니스(Loudness) 노멀라이즈
03:59 RMS, LUFS (LKFS)
04:54 LUFS 노멀라이즈를 사용하는 이유
06:25 유튜브 영상과 오디오 노멀라이즈
06:50 노멀라이즈와 트루 피크 (True Peak)
07:50 LUFS 노멀라이즈 방법 – 어도비 오디션
08:18 LUFS 노멀라이즈 방법 – 다빈치 리졸브
09:03 LUFS 노멀라이즈 방법 – 리퍼(Reaper)
10:01 맺음말

피크(Peak), RMS, LUFS – 오디오 레벨의 이해

피크(Peak), RMS, LUFS – 오디오 레벨의 이해

오디오 레벨을 나타내는 피크(Peak), RMS, LUFS에 대해서 알아보고 컴프레서가 어떤 역할을 할 수 있는지에 대해서도 간단하게 설명했습니다.

참고

  • 영상에서 사용한 마이크와 인터페이스 : Electro-Voice RE20, Motu M4
  • 전체 오디오 레벨은 -14 LUFS로 노멀라이즈 했습니다.
  • 유튜브 챕터와 자막을 지원합니다.

타임라인

  • 00:00 오디오 레벨?
  • 00:32 피크(Peak)와 RMS
  • 00:38 피크(Peak) 레벨
  • 01:09 RMS(평균) 레벨
  • 01:34 피크 대 평균 비율 (Crest factor)
  • 01:48 피크와 컴프레서
  • 02:24 컴프레서가 소리를 크게 한다?
  • 02:44 LUFS가 무엇이고 왜 필요할까?
  • 04:02 LUFS 정의
  • 04:27 방송, 스트리밍 서비스와 LUFS
  • 05:12 맺음말

디더링(dithering)은 무엇이고 언제 필요한가?

디더링(dithering)은 무엇이고 언제 필요한가?

오디오에서 디더링(dithering)이 무엇이고 언제 필요할까요?

참고

  • 영상에서 사용한 마이크와 인터페이스: 르윗 LCT440, Sound Devices MixPre-3 II
  • 전체 오디오 레벨은 -14 LUFS로 노멀라이즈 했습니다.
  • 유튜브 챕터와 자막을 지원합니다.
디더링(dithering) / 고음질 오디오 M4A (AAC LC VBR)
더 보기 “디더링(dithering)은 무엇이고 언제 필요한가?”

16비트 보다 24비트 오디오가 해상도가 좋다? 오디오 미신

16bit vs 24bit 오디오 비트뎁스 (+32bit float?)

오디오 비트뎁스(Bit depth)는 무엇이고 음질에 어떤 영향을 줄까요? 레코딩 시에는 어떤 비트뎁스를 사용해야 할까요?

16bit vs 24bit 오디오 비트뎁스 / 고음질 오디오 m4a (AAC LC, TVBR q127)

비트뎁스(bit depth) 정리

  • 음원을 재생하는데는 CD 표준인 16비트의 다이나믹 레인지도 충분하다.
  • 16비트의 다이나믹 레인지는 96.3 dB, 24비트는 144.5dB이다(참고: 다이나믹 레인지가 아무리 넓은 음악이라고 할 지라도 5~60dB를 넘지 않는다).
  • 비트뎁스 차이는 다이나믹 레인지(dynamic range) 차이이며 소리의 해상도(?)와는 관계가 없다(해상도, 디테일이 어쩌구 하는 것은 도대체가 어디서 나온 환상인가요?).
  • 디지털 카메라 해상도와 오디오 비트뎁스를 비교할 수 없다.
  • 16/24비트는 노이즈 플로어 차이가 있을 수 있으나 대부분 느낄 수 없는 정도이며 있다 하더라도 청각 마스킹(Auditory Masking) 효과 때문에 들리지도 않는다.
  • 레코딩/편집 시에는 24비트를 사용하는 것이 좋다(노이즈 플로어와 증폭이 이유).
  • 32bit float을 지원하는 오디오 레코딩 기기는 16/24비트 (fixed-point) 와는 다르게 입력 신호가 0dBFS를 넘겨도 클립핑되지 않는다(아예 클립핑이 안되는 것은 아닌데 그 정도 수준이면 이미 아날로그 입력단에서 찌그러집니다).
  • 비트뎁스는 비압축 신호에서만 의미가 있으며 손실 압축 코덱(MP3, AAC)은 비트뎁스라는 것이 없습니다(예를 들어서 MP3 같은 압축 코덱은 오디오 신호를 비트뎁스의 시간 데이터 샘플로 표현하는 것이 아니라 주파수 샘플로 저장하기 때문).
16/24비트에서 샘플 간의 최소 amplitude값 차이

관련글

참고

  • 영상에서 사용한 마이크와 인터페이스: EjiMic v1(DIY), MixPre-3 II – Sound Devices
  • 전체 오디오 레벨은 -14 LUFS로 노멀라이즈 했습니다.
  • 유튜브 챕터와 자막을 지원합니다.

샘플 레이트는 높을수록 좋을까?

샘플 레이트는 높을수록 좋을까?

높은 샘플 레이트가 무조건 좋다거나 더 많은 샘플이 저장되니까 해상도가 높다거나 이런 소리는 디지털 오디오에 대한 이해가 전혀 없는 사람들이 그저 상상으로 만들어 낸 말일뿐이다.

샘플 레이트는 높을수록 좋을까? / 고음질 오디오 m4a (AAC LC, TVBR q127)

샘플레이트에 대한 오해

샘플레이트에 대한 오해를 만드는 대표적인 이미지(주로 마케팅에 사용됨)

192kHz 같은 높은 샘플레이트 음원이 하이 레졸루션 오디오 어쩌고 하면서 좋다는 오해는 위의 이미지와 같이 샘플을 직선으로 이어서 표현한 것에서 시작된 경우가 대부분일 것이다, 즉 낮은 샘플레이트에서는 거친 계단처럼 보이고 높은 샘플레이트에서는 아날로그 신호와 점점 흡사하게 보이므로 고음질이다라는 잘못된 정보를 주는 데 매우 성공적이고 교묘한 마케팅인 셈이다.

하지만 실제 오디오 파형은 위 이미지와 같이 1차원적인 직선이 아니다.

DAW마다 오디오 샘플을 보여주는 방식이 다를 뿐이다.

DAW(digital audio workstation)마다 오디오 샘플을 보여주는 방식이 다른데 예를 들어서 리퍼(Reaper)에서는 샘플을 직선으로 연결해서 보여주고 오디션(Adobe Audition)에서는 아날로그 원본과 같은 완만한 곡선으로 연결해서 보여준다(양쪽 다 재생하면 당연히 완벽한 사인파다. 같은 파일이니까).

8kHz 샘플레이트
192kHz 샘플레이트

위 이미지는 동일한 주파수 사인파를 8kHz와 192kHz 샘플레이트로 저장한 파일이다. 재생하면 두 가지 모두 동일한 사인파로 재생된다.

PCM 디지털 샘플이 오디오 신호로 변환되는 과정에는 정해진 규칙이 있기 때문에 위 이미지와 같이 A와 B 샘플이 아날로그 오디오 신호로 바뀔 때는 그 사이에 더 많은 샘플이 있다고 해서 더 좋은 아날로그 신호가 되는 것이 아니다!

상호 변조 왜곡(Intermodulation)

96kHz 이상의 높은 샘플레이트에서 발생할 수 있는 가청 주파수 내의 상호 변조 왜곡(자세한 것은 영상에서 설명하였음).

상호 변조 (intermodulation)

샘플레이트 정리

96kHz 이상의 높은 샘플레이트가 무조건 좋다? 아니다!

재생은 16bit/44.1kHz면 충분하고 그보다 높은 샘플레이트는 가청 주파수 한계인 20kHz 이하를 재생하는데 아무런 장점도 없고 오히려 상호 변조(intermodulation)에 의한 왜곡만 증가시킬 수 있다.

오디오를 녹음/편집하는 환경에서는 24bit/48kHz를 사용하는 것이 좋고 그보다 높은 샘플레이트는 비선형 처리(non-linear processes)에 도움이 될 수 있으나 전체 작업 환경을 높은 샘플레이트로 하기보다는 필요한 플러그인에서만 오버 샘플링하는 것이 효율적이다.

맺음말

10년 전쯤에 신문에서 오디오 전문 기자라는 사람이 어떤 dac 앰프를 소개하면서 쓴 글이 아직도 기억이 나는데 “CD를 리핑 한 원본(44.1kHz/16bit)을 192kHz/24bit DAC로 재생했더니 해상도가 너무 좋더라…”는 어질어질한 내용이었다.

고음질 음원 시장과 또 그것을 지원하는 오디오 기기를 위한 마케팅으로 인해 시작된 디지털 오디오에 대한 잘못된 정보는 예전이나 지금이나 어딜 가나 흘러넘친다.

정말 좋은 음악은 16/24bit 비트뎁스나 96, 192kHz 샘플레이트 같은 숫자 놀음이 아니다. 제대로 마스터링 된 44.1kHz/16bit 음원은 좋은 음악을 감상하는데 차고 넘친다.

비트뎁스/샘플레이트는 음원을 만드는 사람들이나 신경 써야 할 숫자일 뿐이라는 것을 알고 리스너 입장에서는 음악 자체를 즐겨야 할 것이다.

내 돈 써서 더 좋은(?) 음원에 더 고가의 DAC으로 “고음질”을 체험(플라시보 효과에 불과한)하고 있다면 계속 그렇게 하는 것도 말리지는 않는다. 그러나 본인이 만족하는 것에서 끝나야지 그것이 마치 사실인 것처럼 말하는 것은 본인의 무지를 드러낼 뿐이라는 것을 알아야한다.

관련 글/영상

디지털 오디오를 이해하는데 바이블 같은 영상, 6분 정도부터 보는 것을 추천