최근 수정 시각 : 2020-03-15 08:22:16

Direct Stream Digital

DSD에서 넘어옴
1. 개요2. 특징3. DSD의 전송과 재생
3.1. 하드웨어 & 소프트웨어 재생3.2. Native DSD3.3. DoP 전송3.4. 소프트웨어 재생
4. DSD 레코딩 작업5. DSD의 문제점6. DSD의 장점7. 파일 형식8. DSD 음원 마스터 종류9. 왜 황금귀들은 DSD 음원을 선호하는가?10. DSD 인코딩/변환 관련 팁11. 여담12. 관련 문서

파일:DSD Sony.png

1. 개요

Direct Stream Digital은 소니필립스SACD에 사용하기 위해 제작한 포맷으로 필립스의 비트스트림(Bitstream)[1] 방식을 응용한, 2.8224MHz 샘플링 주파수 및 1bit 인코딩 방식의 고음질 포맷이다.
파일:SACD Disc.jpg파일:SACDDisc2.jpg
이 포맷이 만들어진 이유는 CD의 대체 미디어로 DVD-Audio 진영과 대립하던 소니와 필립스[2]가 독자적 포맷으로 CD의 연장선상에 있는 SACD(Super Audio CD) 를 준비하였고, 이때 PCM과는 다른 새로운 오디오 인코딩 방식으로 DSD를 선택하게 되었다는 것이다. SACD의 경우 고음질을 지향하기는 하였으나, 탄생의 이유 자체가 특허료 수입의 연장[3]불법복제 방지이라는 다소 불순한 의도가 있었던 탓에 기존 CD PCM의 음질적인 개선 요소보다는 복사 방지의 보안에 지나치게 치중하였고, DSD의 경우 PCM 추종자들의 입장에서는 치명적으로 해석될 수 있는 음향적인 문제점을 드러내는 등, 끊임없이 논란의 떡밥을 제공한, 상업적 문제점을 보여준 대표적인 포맷이 되어버렸다.

2. 특징

파일:DSD Sorce.jpg
마케팅 측면에서 대개의 경우 CD-DA 포맷의 44.1kHz와 비교하며 64배의 샘플링 주파수를 담아 엄청나게 우월한 것처럼 광고를 띄우고 있는 것이 특징이다.

여기서 포인트는 1bit라는 것이다. 쉽게 생각해서 CD-DA 경우 아날로그화하였을 때 2x8=16bit라는 계산이라면 DSD는 1+1+1+1+1+1+1+1+1+1+1+1+1+1+1+1=16bit라는 식으로 하기에 어떻게 보면 가장 단순하고 무식한 방법으로 보일 수도 있는 방식이다. 1bit 방식으로 처리하다 보니 비트 정밀도가 매우 떨어지며 이것을 보완하기 위해 샘플링 주파수에 몰빵한 방식으로 이해하면 된다. 1Bit 방식이다보니 이러한 이유로 DSD는 변조가 불가능하며 음향효과등을 넣을 수 가 없다. 즉 재생된 대로 그대로 박제가 되는 아카이브 방식이라 할 수 있다. 이러한 이유로 DSD가 변조가 불가능하기에 어떤 음원보다도 가장 원음에 가까운 재생을 한다고 소니와 필립스가 광고를 하기도 했었다.

기존의 포맷이 AM변조라고 하면 DSD는 FM변조 같은 방식에 비유할 수 있다. 실제로는 PWM에 가깝지만..

즉 DSD를 Native/DoP로 재생할 경우 음향효과를 넣을 수 없으며 심지여 불륨조절도 할 수 없기에 말 그대로 DSD에 녹음된 그대로의 원본 음으로 재생되게 되어 있으며 이렇게 출력된 아날로그 음을 외부 앰프에서 제어하게 되어 있는 구조이다. 그야말로 디지털계의 오픈 릴 테입이라 할수 있다.

파일:PCM&DSD.gif
DSD는 디지털화(=부호화)가 △∑(델타 시그마) 방식으로 오버 샘플링하여 저장하는 방식이기에 복호화도 매우 단순해서 PCM에 비해 재생 시 거치는 과정이 매우 적기에 음질이 좋다고 알려져 있다. 그리고 PCM에 비해 임펄스 값이 매우 우수한 것으로 알려져 있으며 1-bit 방식에 2.8224MHz의 오버 샘플링이 더 아날로그에 가까운 파형을 낸다는 전문가의 소견주장[4]도 있다.

파일:dsd-pcm-impulse-response.gif
그리고 이론상 2.8224MHz로 최대 100kHz[5]까지 재생 가능하여 재생 주파수 범위가 최대 22.05kHz(이론적 수치)인 CD에 비해 크게 늘어나서 우월한 음질을 자랑하는 것도 특징이다. 이걸 비트레이트로 표기하면 5,644kbps의 용량을 가지고 있다. CD급 음질 PCM(16bit/44.1kHz)과 SACD급 음질인 DSD64[6]의 차이점을 비교하면 이렇다.


파일:DSD11.22.gif

PCM (CD 오디오)
  • 포맷 : 16bit
  • 샘플링 주파수 : 44.1kHz
  • 비트레이트 : 1,411.2kbps (2채널 기준)
  • 다이나믹 레인지 : 96dB
  • 재생 주파수 대역 : 20Hz~22kHz
  • 5.1 멀티 채널 서라운드 : 불가능 [7]


DSD64
  • 포맷 : 1bit
  • 샘플링 주파수 : 2.8224MHz
  • 비트레이트 : 5,644.8kbps (2채널 기준)
  • 다이나믹 레인지 : 120dB[8]
  • 재생 주파수 대역 : 20Hz~100kHz[9]
  • 멀티 채널 서라운드 : 가능 [10]

3. DSD의 전송과 재생

DSD가 오직 SACD 플레이어에서만 재생 가능했던 과거와 달리, 오늘날의 DSD 재생은 다양한 방법으로 가능하다. 특히 초창기 SACD 플레이어에서는 DSD 신호의 출력을 아날로그만 허용하였으나, 일부 메이커에서 i.Link(=IEEE1394)를 통해 DSD 신호의 raw data를 출력하면서부터 디바이스(소스 플레이어)에서 디바이스(외장 DAC나 AV 리시버)로의 DSD 출력 방법에 대한 시도가 이루어졌고, 결국 HDMI 1.2에서는 DSD native 전송이 가능해졌으며, HDMI 1.3에서는 DSD의 무손실 압축 포맷인 DST(Direct Stream Transfer) 신호의 전송도 가능해졌다. 하지만, HDMI 입력을 지원하는 DAC가 거의 없었던 탓에, HDMI를 통한 DSD의 전송은 그리 보편화가 되지 못했는데, 2011년 몇몇 회사들이 모여, USB Audio 2.0 프로토콜을 통한 "DSD over PCM standard 1.0"을 만들면서 PC 소프트웨어로 DSD 파일을 재생하여 외장형 USB DAC로 출력을 내는 컴퓨터 기반 오디오 시스템(PC-AUDIO)에서 DSD 전송과 재생이 활성화되기 시작하였다.

3.1. 하드웨어 & 소프트웨어 재생

DSD 재생은 하드웨어 재생 방식과 소프트웨어 재생 방식 두 가지[11]로 나누어진다. 하드웨어 재생 방식으로 Native DSDDoP(DSD over PCM)가 지원되는 DAC를 사용하거나, 혹은 DSD 신호를 받아 PCM 변환을 하여 재생하는 DSD 입력 지원의 PCM DAC를 사용하는 방법이 있으며, 소프트웨어 재생 방식은 일반적으로 프로그램의 자체 내장된 DSD 디코더를 가지고 PCM으로 변환하여 PC의 사운드 카드를 통해 재생하거나, 변환된 PCM을 옵티컬(=SPDIF)이나 USB 출력으로 외장형 DAC로 재생하는 방식이 있다.

사운드 카드 또는 DAC의 성능만 받쳐준다면 어느 쪽이든 별 차이는 없다고 보면 된다. 그리고 프로그램에 대해서도 별로 고민할 필요가 없는데 가장 널리 쓰이는 디코더인 FFmpeg가 DSD 디코딩을 지원해서 그냥팟플레이어로도 재생할수있다. 다만 소프트웨어적으로 디코딩할경우 DST압축된 DSD는 음악 파일 치고는 상당히 시스템 자원을 많이 요구하는 편이어서 성능이 낮은 기기에서는 음이 끈기는 문제가 생길 수 있다. 하지만 하드웨어 DSD 디코딩에 비해 PCM방식의 큰 장점은 음향효과를 넣어 줄 수 있고 불륨제어를 할 수 있다는 것이다.


요즘 나오는 DSD 하드웨어 디코딩 지원 DAC은 대부분 기본적으로 Native DSD와 DoP둘다 지원하지만 때론 DoP만 지원하는 경우도 있다. 어느 쪽을 사용하든 둘다 손실 없이 DSD를 디코딩 가능하다. DoP는 단지 급조로 제작된 규격이라는 것이라는 차이 정도이다. 이것을 지원한다고 꼽으면 바로 쓰는게 아니라 해당 스마트폰에서 전용앱으로 설정을 해줘야 하며 PC에 경우도 외부 소프트웨어에서 설정을 해줘야 이기능을 제대로 사용할 수 있다는 것을 알아둬야 한다.

하드웨어 재생 특히 Native DSD와 DoP로 재생한다면 음향효과를 넣을 수 가 없고 불륨조절을 할 수가 없다. 이것은 당연한 것인데 DSD의 특성상 음향효과를 넣을 수 없는 1Bit 방식이기 때문이다. 특히 만약 DSD를 재생했는데 음향효과를 넣을 수 있다면 그것은 소프트웨어 방식 즉 PCM 변환 방식을 사용했을 확률이 가장 높다. 참고로 DSD 하드웨어 재생시 불륨조절이 안되는 것도 이런 이유이다. 다만 이런 것을 고려해서 DSD를 위한 불륨조절을 할 수 있는 아날로그 출력 컨트롤러 또는 불륨 컨트롤러 칩등이 달려있는 경우가 있다.

3.2. Native DSD

DSD를 원본 그대로 전송 또는 재생하는 방법에 대해 Native DSD라는 용어를 쓴다. 즉, Native DSD 전송은 DSD raw data를 훼손시키지 않고 전송하는 것을 의미하고, 마찬가지로 Native DSD 재생은 DSD raw data를 그대로 아날로그 변환하여 재생하는 것을 의미한다. 그렇다면 Native DSD의 반대되는 의미도 있을 것 같은데, Native DSD의 반대는 DSD를 PCM으로 변환하는 것이 된다. 예를 들어, Native DSD를 지원하는 플레이어란 DSD 신호를 DAC 칩까지 어떠한 변환 없이 그대로 출력하는 플레이어를 말하고, Native DSD를 지원하지 못하는 플레이어란 DSD 신호를 PCM으로 바꿔 재생하는 것을 의미한다. 가끔은 뒤에 서술할 DoP를 DSD to PCM 변환으로 착각하여 Native DSD의 반대 의미로 오해하는 경우가 있는데, DoP란 DSD를 PCM data에 숨겨서(≒encryption) 전송하는 것을 의미하며 DSD의 raw data가 훼손되지는 않는다.

그리고 델타 시그마 기술을 사용하고 있는 DAC 칩이라도 내부적으로 1bit가 아닌 6bit 멀티 비트 델타 시그마 기술을 사용하는 경우라면, 100% Native DSD 재생이 되지는 않는다. [12] Native DSD 재생을 위해서는 원래대로라면 DSD 전용 1bit DAC 칩[13]을 사용해야 하겠지만, 이는 DAC 칩에서 여러가지 기능을 요구하는 요즘에 있어서는 효율성이 떨어지고 현실성이 없는 구조라, 최근 대부분의 DAC 칩은 DSD를 입력받더라도, 칩 내부에서는 이를 PCM으로 변환해서 재생하는 방법[14]을 사용하고 있다. 따라서 100% Pure Native DSD 재생[15]을 지원하는 기기나 DAC은 요즘은 스마트폰등의 DAC에 발전으로 요즘 나온 것은 대부분 지원한다.

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------

3.3. DoP 전송

파일:DSDWS.jpg
DSD 음원을 기존 PCM으로 변환해서 재생하게 하는 것을 알기 전에 먼저 DoP(DSD over PCM)라는 규격을 알아야 하는데, DoP는 DSD 음원을 24bit PCM의 형태로 변환하여 전송하는 방식[16]으로 24bit의 상위 8bit에 DSD Marker라는 구분자를 넣어서 이 시그널이 DSD임을 구분하고 하위 16bit에 1채널 DSD 데이터를 넣어 전송하는 원리이다. 상위 8bit Marker에는 버전에 따라 여러 종류가 있어서 과거 1.0 버전에서는 16진수로 0xAA 값을 가지는 Marker가 사용되었으며 1.1 규격에서는 0x05와 0xFA가 사용되고 있다.[17]

전송된 DoP 신호는 DAC에서 다시 DSD로 변환되어 재생된다. 문제는 DAC 기기가 이 신호가 DSD인지 PCM인지 구분하기 위해서는 규정상 최소 32개의 시그널을 분석해서 Maker가 연속되어 있는지 확인해야 한다는 것이다. 이 확인 루틴은 대부분이 DAC에서 매끄럽게 구현되어 있지 않기 때문에 PCM을 재생하다 DSD가 재생되면 노이즈가 발생할 수 있다.

또 다른 문제점으로 DoP 규격은 PCM 전송 방식이기이며 DSD 데이터를 전송하기 위해서 대충 규정된 것이기에 운영체제의 Mixer나 샘플레이터 자동 변환 루틴을 거치게 되면 데이터가 변형되어 DSD 데이터로 인식하지 못하기에 노이즈밖에 나지 않는 현상이 발생하는 점이다. 또한 소리 크기를 변경해도 데이터가 변형되므로 마찬가지로 노이즈만 재생된다. 반드시 bit-perfect 재생만이 제 소리를 낼 수 있기에 전용 재생 프로그램을 이용해야 하며 출력 방식은 ASIO 또는 WASAPI으로 해야 한다.[18]

DoP 규격으로는 DSD64가 24bit/176.4kHz로 전송되며 DSD128은 24bit/352.8kHz로 전송한다.

더 자세한 내용은 DoP Ver 1.1을 참고하자.

3.4. 소프트웨어 재생

소프트웨어 재생 방식이란, 소프트웨어 상에서 DSD를 PCM으로 변환하여 처리하는 방식을 말한다. 소프트웨어 재생 방식은 DSD DAC 같은 하드웨어를 필요로하지 않으므로 PC에서 사용할 때 장점이 극대화되는데, Native DSD를 지원하지 않는 일반적인 사운드 카드 등의 하드웨어 조건에서 사용 가능하다는 특징이 있다. 특히 기본 설정이 고정되어 있는 Native DSD와 다르게 사용자가 입맛대로 DSD 재생 설정이 가능한데, 사용 중인 사운드 장치의 하드웨어 성능에 따라 DSD의 정해진 스펙보다 더 높은 비트 정밀도와 샘플링 주파수로도 변환 재생도 가능하며, 출력이 낮은 DSD 음원에 대해서는 출력 보정 여부를 설정할 수도 있다. 또한, DSD to PCM 변환 과정에서 양자 노이즈에 의한 에일리어싱 현상[19]을 제거하기 위해 로우패스 필터가 필요한데, 이러한 필터의 특성을 지정할 수 있으며, 설정된 필터에 따라 미세하게 소리가 달라지는 성질을 활용하면 자기만의 음색 조정도 가능하게 된다.

하지만 스마트폰 앱의 경우 별다른 설정 메뉴가 없는 경우가 많고, 자체 기본 음악 앱이 아닌 다른 앱을 사용하면 16-bit/44.1&48kHz로 커널에서 재생이 제한되어 버리기에[20] Native DSD의 발끝도 못 따라가는 재생 문제점이 있다. 이걸 해결하려면 OTG를 지원하는 외장 DSD USB DAC를 사용해야 하는데 휴대성부터 편의성까지 여러모로 불편한 점이 많고 해당 지원 앱이 유료이기에 결제해야 하는 단점도 있다.

PCM과 달리 DSD의 경우 다이나믹 레인지를 유지하기 위해 컴프레싱 작업이 매우 적은 편이다. PCM의 경우, 0dBFS를 넘어서 클리핑이 되면 찌그러짐이 심하게 발생하나, DSD는 구조상 오버로드가 되어 클리핑이 발생하더라도 헤드룸이 있어 찌그러짐(디스토션)이 심하게 일어나지 않는다. 때문에 DSD 녹음 시 컴프레싱을 하지 않아도 음질적으로 문제가 발생하지 않는다.[21] 하지만 DSD를 PCM 변환하게 되면 DSD 만큼의 헤드룸을 확보하기 위해 출력을 기본 CD에 비해 6db 낮추어야 한다. 이때 낮추어진 출력을 보정하는 기능이 없다면 소리가 작게 들릴 것이므로, 상대적으로 출력이 센 기기 또는 앰프가 필요하게 된다. 요즘 나온 Native DSD DAC 기기들은 기본적으로 이런 출력 보정 기능[22]을 제공하고 있지만, 소프트웨어 디코딩을 한다면 해당 소프트웨어에서 출력 보정 기능이 없는 경우, 별도 앰프를 고려하는 게 좋다. 소프트웨어 디코딩시 출력 보정의 경우, 클리핑을 억제하는 기능이 없으면 자칫 클리핑이 일어난 소리를 들을 수 있으니 조심하자.

4. DSD 레코딩 작업

DSD 레코딩 장비는 보통 TASCAM에서 제작한 장비와 SONOMA32의 장비를 사용했다고 한다.
파일:DV-RA100HD.jpg
(TASCAM DSD & 24Bit 192kHz 레코딩 장비)


DSD는 특성상 1Bit이다보니 편집 작업이 불가능하다. 그래서 DSD 음원 편집 방식은 두가지로 나눠지는데 24Bit/96kHz(초창기) 또는 24Bit/176kHz(후기: DoP 스펙 규정)로 변환해서 편집후 다시 DSD레코딩을 하는 방식으로 가장 많이 쓰이는 방식이다.

파일:da-3000 dsd multirec.jpg
(TASCAM DSD 멀티트렉 레코딩 작업 당시 CPU가 딸리니 랙방식으로 분산해서 하였다.)

또 다른 방법으론 SONOMA32를 사용해 편집할 구간을 5Bit로 변환후 편집후 다시 1Bit로 변환하는 방식이다.
파일:sonoma32.jpg
(SONOMA32 Pure DSD레코딩 장비와 소프트웨어 레코딩 장비 설명 문서 저장장치는 RAID도 지원한다.)

이런 멀티 트렉 레코딩으로 인해 모든 트렉을 다 합친 최종적인 마스터링 본에서는 타임라인별로 트렉이 서로 겹치다보니 양자노이즈 마져도 겹쳐 기본 기준치보다 높은 좀더 높은 고르지 못한 양자노이즈가 생기는데 이걸 제대로 신경안쓰고 마스터링 한 경우 최종본은 불안정한 양자노이즈가 된 마스터본이 생기는 문제가 있다.

그래서 가장 많이 쓰이는 방식으로 PCM으로 변환해서 작업하는 방식과 또는 기존 PCM이나 오픈릴테이프로 작업후 오픈릴테이프로 녹음한 다음 이걸 다시 DSD로 변환하는 방식을 사용하고 있다.

파일:DSD_Pure.jpg
티어니 서튼의 Dancing in the Dark : I'll Be Around (순수 DSD 마스터)

5. DSD의 문제점

위의 내용을 보면 상당히 좋은 포맷 같지만, 문제점이 상당히 많은 음원이기도 하다. 먼저 1bit 방식이기에 이퀄라이저/DSP 등을 적용할 수 없으며 1bit의 정밀도로 디지털을 아날로그로 변환하는 작업 중 양자 노이즈가 엄청나게 증가하여 30kHz 주파수 이상에서는 스피커 트위터에 무리가 가 트위터가 손상되는 문제[23]가 있었고 실질적으로 CD-DA의 문제점이었던 지터 노이즈 등은 전혀 해결되지 못했다는 주장도 있다.

파일:Hi-ResDSD02.jpg
WHITE ALBUM2 VOCAL COLLECTION : さよならのこと 음원
스펙 : SACD 변환 DSD64(2.8Mhz)

특히 이 노이즈 쉐이핑 (Noise Shaping)라고 불리우기도 하는 양자 노이즈는 위 이미지에서도 볼 수 있듯 엄청난 노이즈띠를 가지고 있으며 소니에서도 이 문제를 인지하고 있기에 이걸 저역 통과 필터(LPF)로 노이즈를 제거하는 방식을 사용하였는데 이로 인해 초고역대마저 손실을 입어버리기에 소니는 대부분의 제품에 S-Master라는 독자적인 PWM 앰프를 사용하고 있는데, S-Master 앰프의 특성이 30kHz 이상을 재생하지 못한다. 때문에 소니에서는 DSD가 재생되는 제품이라 하더라도 S-Master 앰프가 사용된 경우 매뉴얼에 재생 대역을 30kHz로 표기하고 있다. 이로 인해 실제로 PCM에 24bit 96kHz 4600KB 비트레이트를 가지고 있는 스펙의 PCM과 비교하면 DSD는 용량도 너무 크고 그 초고음역대도 필터로 인해 제대로 사용하지 못한다는 문제점을 남겨버렸다.이걸 해결 하기 위해 DSD64를 더블 샘플링한 DSD128가 나왔지만 이건 50kHz에서부터 양자노이즈가 발생하는 문제가 있다. 특히 마스터링에 차이에 따라 양자노이즈 양도 천차만별일 정도로 차이가 심하다.

파일:DSD Sorce01.jpg

이런 상태에서 현대의 DSD 재생은 PCM으로 변환하는 과정을 사용하면서 DSD의 특징인 샘플링 주파수 MHz의 장점을 살리기 위해 32bit/352.8kHz 방식의 DXD가 등장했으며 다양한 DAC와 제조 회사마다 다른 LPF 필터 방식 등으로 인해 음색이 바뀌는 문제점이 있고 이걸 PCM & DSD 음원으로 변환하면 양자 노이즈의 특성 때문에 음질이 손실되며 이것을 스튜디오 음원 편집용으로 사용하자니 반복기록 편집시 음질 손실의 문제가 되었다. 즉 디지털 고음질 음원 답지 않게 반복 기록/ 변환 사용시 음질이 손실이 일어나는 상당히 아날로그 특성을 가진 희대의 결함 고음질 디지털 음원이다.
파일:Hi-ResDSDSorce02.jpg
밥 딜런 - Blonde on Blonde : Visions of Johanna 하이 레졸루션 오디오 음원 파형
스펙 : 24bit/96kHz

파일:Hi-ResDSDSorce01.jpg
밥 딜런 - Blonde on Blonde : Visions of Johanna [MFSL] SACD 음원 파형 (노이즈 쉐이핑 필터 안함)
스펙 : SACD 변환 16bit/176.4kHz
양자 노이즈로 파형이 불안정해진 것을 확인할 수 있다.

즉 DSD는 무손실 음원도 아닌 기록되는 순간부터 초고역 노이즈로 인해 손실 음원이 되며 이것을 다시 디코딩 하는 것부터 초고역 노이즈 필터를 적용하여 재생하기에 역시나 음질이 손실이 되어 디코딩된다고 보면 된다.

그리고 CD의 64배라는 것도 과장인데, 비트 정밀도가 낮은 DSD 1bit로 그보다 높은 정밀도를 가진 CD의 16bit를 동급으로 비교하는 것 자체가 억지며 실제 DSD와 CD를 비트레이트로 비교를 하면 CD의 4배라는 계산이 나온다. 즉, CD(44100×16×2=)=1411.2Kbps이기에 이걸 계산하면 1411.2×4=5644.8Kbps라는 DSD 비트레이트 값이 나온다. 다시 말해 DSD의 정식 스펙은 16bit/176.4kHz(176400×16×2=5644.8Kbps)와 동급 수준이다. 황금귀를 위해 스펙을 다시 정의하면 32bit/88.2kHz(88200×32×2=5644.8Kbps)라는 그럴듯한 스펙이 된다. 물론 상술했듯 양자화 노이즈도 고려하자

이 DSD 특유의 양자화 노이즈의 정체에 대해서 다시 생각해 볼 필요가 있다. 이 양자화 노이즈는 1bit 인코딩 시 사용되는 Noise Shape에 의해 발생되는 Shaped Noise이다. 전문적으로 설명한다면, 가청대역에서의 다이나믹 레인지를 확보하기 위해, 가청 대역의 노이즈를 가청 대역 밖으로 밀어낸 것이다. 수치적으로 16bit/176.4kHz PCM과 동등 비트레이트지만, 80kHz까지의 재생 대역에서에서 일정한 96dB의 다이나믹 레인지를 가지는 PCM이냐, 100kHz 까지 재생하면서 20kHz 이하의 가청 대역에서 120dB의 다이나믹 레인지를 가지는 대신 30kHz 이상에서는 Shaped Noise로 다이나믹 레인지가 떨어지는 DSD냐는 어디까지나 선택의 문제이다. 우연치 않게도, DSD의 Shaped Noise는 등청감 곡선 Equal Loudness Contour의 모양과 많이 비슷하며. Fletcher-Munson의 Equal Loudness Contour를 근거한다면, 20kHz 이상에서는 100dB 이상의 다이나믹 레인지를 인간이 느낄 가능성은 0에 수렴하지만, 20kHz 이하에서 100dB 이상의 다이나믹 레인지를 인간이 느낄 가능성은 충분히 존재한다. 무엇을 선택할 것인가는 어디까지나 청자의 지식 수준, 즉 기술에 대한 이해도의 문제로 귀결될 것이다.그냥 24bit/96kHz 음원을 사용하면 전 대역에서 이론상 144dB에 대역도 48kHz까지 나오니 더 좋은 선택이라 할 수 있다.

물론 이런 DSD 음원이나 변환 PCM을 재생하는데 양자 노이즈로 인한 스피커나 이어폰/헤드폰의 손실을 걱정은 안해도 된다. 요즘 나오는 DAP,DAC등은 기본적으로 LPF 필터가 적용되어 있고 측정 그래프에서도 볼 수 있듯 24kHz이상의 고음역대로 가면 점점 음역대가 약해지는 것을 확인 할 수 있다. 그렇기에 양자 노이즈로 인한 기기 손실은 걱정은 하지 않아도 된다.

DSD는 1Bit방식이다 보니 음원 편집불가와 디지털 음향효과를 적용할 수 없다는 단점이 있다. 이로 인해 SACD플레이어나 네이티브 DSD를 사용하는 휴대폰, DAP에서 음향효과를 적용할 수가 없으나 PCM으로 변환후에 적용해야 하는 단점이 있다.

이로 인해 DSD에 녹음된 음원은 실제 원본과는 다르게 변질되어 기록되는데, 원본 음원을 16-bit/44.1kHz를 DSD화 하고 다시 16-bit/44.1kHz로 변환하면 CRC 값이 다르다. 즉 음원 내용이 변질되었다는 것이다. 원본 지향이라면 절대 있을 수 없는 부분이라 할 수 있다.

6. DSD의 장점

DSD 음원의 불안정하고 독자적인 표준이었던 점은 오히려 장점이 되기도 하였는데 DSD 음원의 문제점은 어디까지나 황금귀/소비자에게만 한정될뿐이지 오히려 시장성으로 보면 음반사로서는 그나마 가장 합리적인 음원이었다.

SACD와 DVD-Audio가 경쟁했던 2000년 초에는 호환성이 높았던 DVD-Audio가 오히려 불리했던 시기였는데 DVD-Audio는 PC에서도 데이터를 읽을 수 있는 장점이 오히려 해커들에게 락이 풀리고 결국 불법복제가 되는 치명적인 문제가 있었던 반면 SACD는 오직 SACD 플레이어에서만 읽을 수 있었기에 불법복제가 어려웠으며 이런 점은 음반사에게는 매우 신뢰를 가지게 하는 장점이 되었다. 그리고 추후 PS3가 해킹으로 뚤리면서 커펌(2010년)이 되어 SACD가 DFF및 ISO로 불법복제가 가능해졌지만 DSD 음원을 재대로 재생할 DAC과 PC 소프트웨어가 없었기에 (DoP 재정은 2012년에야 이루어졌다.) 한동안은 큰 문제가 되지 않았다.

이런 신뢰성덕분에 여러 음반사에서 SACD로 앨범을 출시하였고 덕분에 2007년에 종료된 DVD-Audio보다 상당히 많은 앨범들을 보유하고 있었으며 그리고 2000년에 서라운드 음향에 인기가 높았던 시기라 5.1채널 음반들도 SACD에 많이 있기에 이런 상당량의 SACD음반덕분에 수요가 많아 2016년이 넘어도 아직도 SACD 앨범들이 나오고 있다. 더욱이 하이 레졸루션 오디오 음원으로는 공개가 안되고 오직 SACD로만 공개된 음반들도 상당수 많다.[24]

몇몇 스튜디오에서는 DSD 음원의 특유의 아날로그 틱한 음색과 1비트 방식으로 데이터 변질이 불가능하여 오리지날을 유지한다는 점을 높게 사서 아날로그 마스터 테입(오픈릴 테이프)에서 DSD마스터로 전향하는 사례도 있었다. [25] 이런 오픈 릴 테이프와 비슷한 음색으로 인해 지금도 많은 음반사에서 고전 락과 재즈등은 DSD판으로 따로 내놓아 판매도 하고 있다.

SACD가 등장했던 초기부터 DSD는 아날로그 마스터 테입으로 DSD 마스터하여 SACD로 판매하는 것이 관습이 되다보니 2010년 이후로도 발매되는 SACD는 아날로그 마스터 테입으로 제작하는 것을 원칙으로 제작을 하고 있다. 이런 제작 방식으로 인해 DSD 음원은 기존 고음질 PCM 음원과의 차별화가 되어 SACD와 DSD를 구입할 동기를 부여하게 되었다.[26] 물론 이미 고음질 PCM으로 마스터화 해서 원본 오픈릴 테이프가 없다면 이 고음질 PCM마스터로 DSD를 제작하는 사례가 조금은 있는 편이다.[27]

7. 파일 형식

파일로의 인코딩 방식은 세 가지로 나눠지는데 필립스 방식과 소니 방식, 1bit 오디오 컨소시엄 방식이 있으며 서로 호환은 되지 않는다.

필립스 방식의 포맷 명은 DFF(DSDIFF - Direct Stream Digital Interchange File Format)[28]이며 2000년 필립스에서 정한 규격으로 SACD에서 사용하는 규격이기도 하다. DSD를 지원하는 DAP, 스마트폰, 무선 스피커라도 이 포맷을 지원하지 않는 경우가 많으니 만약 DFF 포맷의 사용을 고려해서 음향기기를 구입한다면 꼭 DFF 확장자를 지원하는지 확인하자. 참고로 DFF를 지원해도 DST를 지원하지 않는 음향기기도 있으니 이것도 확인해야 한다.

DST(Direct Stream Transfer)는 DFF의 무손실 압축 파일 로 포맷명은 DFF와 동일하며 압축이 되어 있어 DST 사용 시 용량이 DSF보다 적은 장점이다. 이런 압축 기술을 사용하는 이유는 SACD 는 2채널과 5.1채널 음원을 동시에 최대 80분의 재생 시간 만큼 담을 수 있도록 되어 있는데, 산술적으로 약 13.5GB 의 용량(=80분 * 8채널 DSD)을 필요로 하게 된다. SACD는 물리적으로 DVD 디스크와 99% 동일한 포맷이며, 듀얼 레이어 SACD의 경우 DVD-9 포맷을 사용하는데, 이는 약 8.5GB의 용량에 해당되어 13.5GB의 음원을 담을 수 없으므로 압축이 필수로 요구된다. SACD는 각 층을 스테레오 채널와 멀티 채널 구역으로 나눌 수 있으며, 사용자가 플레이어 조작 시 스테레오 채널과 멀티 채널을 선택하여 감상하게 된다. 이때 스테레오 채널에 80분의 DSD 음원을 기록하게 되면 약 3.39GB(= 2,822,400bit ÷ 8bit × 2채널 × 60초 × 80분)에 해당하며 이는 4.7GB 싱글 레이어 디스크 내에 수록하는 데는 문제가 없다. 하지만 멀티 채널은 80분 음원이 약 10.16GB에 해당하여 4.7GB 디스크에 수록이 불가능하다.

때문에 초기 듀얼 레이어 SACD에 2채널과 5.1채널을 동시에 수록할 경우, 2채널 음원은 압축되지 않은 DSDIFF로, 5.1채널 음원은 DST로 압축된 DSTIFF 포멧으로 8.5GB 용량에 맞춰 수록하게 된다. 2채널 음원에 대해 DST 압축을 하지 않는 이유는 SACD 여명기에 멀티 채널 SACD 포맷과 DST 압축이 뒤늦게 추가된 스펙이라, SONY SCD-1 과 같이 초기에 나온 스테레오만 지원하는 SACD 플레이어에서는 DST 재생을 지원하지 않기 때문이다. 그리고 후에는 결국 2채널도 DST로 압축하여 같이 압축된 5.1채널도 SACD에 같이 수록하게 되었다. 만약 SACD에 2채널만 기록한다면 싱글 레이어에 최대 95분까지 기록할 수 있도록 표준이 되어 있다.

DST의 압축 기술은 Adaptive Prediction Filter를 사용하는 Arithmetic Coding 기술로 H.264에서 사용된 CABAC(Context-adaptive binary arithmetic coding)과 같이, 확률적으로 다음에 나타날 값을 예측하여 binary code를 re-allocation하는 방식을 사용, 저장에 필요한 용량을 약 40% 내지 50%의 크기로 줄여주게 된다. 통상 0과 1이 나타날 확률이 전체적으로는 50 대 50이지만, 이 비율이 시간에 따라 서서히 변화되고 있는 경우, 이러한 Adaptive Prediction Filter를 사용하는 Arithmetic Coding이 Entropy Coding에 매우 유용하다. 더 자세한 기술 내용은 이 위키 문서(일본어)를 참고하자. 거의 절반에 가까운 높은 압축률을 자랑한다.

하지만 실제 5.1채널이 들어 있는 SACD에 경우 2.0과 5.1채널이 DST로 압축된 경우가 있으며 2.0채널만 압축되거나 또는 반대로 5.1채널만 압축된 경우가 있다. 또 2.0채널이라도 DST로 압축된 경우가 있다. 대표적으로 대만에 한정판으로 판매된 앨범인 이츠와 마유미 - 好時代珍藏系列 回憶錄… 가 그런 경우이다. 그리고 무손실 압축이라고 하지만 이상하게 2채널에서는 22kHz 음역대가 잘리는 경우가 있다. 위에서도 서술했듯 DST는 무손실 압축 기술이기에 이런 손실이 없어야 하는데 의외로 많은 앨범들이 22kHz에서 잘리는 경우가 많다. 이런 문제는 초기 SACD에서 흔히 있는 경우인데 DSD에 양자 노이즈에 대한 문제를 잘 몰랐기에 스피커 트위터에 무리를 주는 이유는 오리지널 마스터 테이프에 불필요하게 녹음된 고음역 노이즈 문제로 보고 있었다. 그래서 이 문제를 줄이기 위해 SACD 플레이어에 자체 사용자 지정 필터기능도 내장했지만 음색변화가 있었기에 좀 더 실질적인 방법으로 아예 문제가 되는 고음역대를 22kHz로 잘라서 DSD에 넣어 SACD로 발매하는 방법이 등장하기도 했다.

이런 부분은 모든 SACD앨범이 그런건 아니다. 보통 2002년 초 앨범은 상당수 그런 앨범이 많으며 후에 발매된 앨범들에서도 은근히 적용된 앨범이 많다. 그리고 DSD압축 부분도 용량이 충분하더라도 DSD를 마스터하는 쪽의 어른들의 사정으로 압축의 여부가 결정된 경우가 많은데 결론으론 레코딩 제작사의 마음이다.

파일:Hi-ResDSD08.jpg
카펜터스 - single 1969-1981 : Goodbye to Love 음원
스펙 : SACD DST 2.0채널 압축 음원 변환 16Bit/176kHz [29]

파일:Hi-ResDSD21.jpg
제네시스 - The Lamb Lies Down on Broadway : it.
스펙 : SACD DST 2.0채널 압축 음원 변환 16Bit/176kHz

2채널 버전에서 용량압축을 극대화하려고 자른 것으로 보기에는 DST 음원중에는 잘리지 않는 것을 보면 충분한 압축률을 가지고 있기에 그런 것은 아닌 것 같으나 마스터링에서 문제가 있는 것인지 아니면 다른 문제가 있는 것인지는 알 수 없고 보통 2000년도 초에 발매된 SACD에 DST 2채널에서 이렇게 주파수가 잘린 경우가 많으며 2005년 후에 나온 앨범들에서는 제대로 나오는 경우가 많다. 이렇게 음역대가 잘린 것에 가설을 붙이면 소스 작업을 많이 쓰이던 스펙인 DVD-Audio의 스펙인 24Bit/44.1 & 48kHz에서 작업했다는 설이다. 둘 다 같은 소스를 사용하기 위해서라는 것과 아니면 당시 문제가 되었던 양자노이즈 문제를 발견하지 못하고 오히려 너무나도 높은 초 고음역대에 문제를 잡은 경우라는 것이다. 확실한건 레코드사에서 공개해야 알 수 있는 문제이다.

소니 방식은 DSF(DSD Stream File)이며 2005년[30]에 소니가 정한 규격으로 DST를 사용할 수 없기에 무압축이며 그렇기에 용량이 큰 편[31]이지만 ID3TAG를 사용하기에 태그 편집과 앨범 아트등을 넣을 수 있고 무엇보다 DSD를 지원하는 대부분은 DAP,스마트폰,무선 스피커등이 기본적으로 지원하는 포맷이며 DSD를 판매 유통하는 사이트들이 사용하는 포맷도 다 DSF이다.

WSD(Wideband Single-bit Data)는 1bit 오디오 컨소시엄 (와세다 대학, 샤프, 파이오니어의 공동 그룹)에서 개발한 포맷으로 채널 수와 샘플링 주파수 제한이 없으며 다양한 형식의 데이터에 대응할 수 있도록 설계되었으며 사양이 공개되었다고 한다. 하지만 DFF 보다 더 심하게 재생할 수 있는 기기가 매우 적은 게 단점이다.

DSD도 보통 64~512 외 다른 형태로도 불리고 있는데 DSD64는 그냥 DSD. DSD128은 더블 DSD, DSD256은 쿼드 DSD, DSD512는 옥타 DSD로 불리고 있으며 32Bit/384kHz는 DXD[32]로 불리고 있다. DSF로는 음원 압축이 안 되는 문제가 있고 쿼드 DSD 급은 용량이 비효율적으로 크기에 보통은 더블 DSD(DSD128)까지만 사용하고 있다.

파일:DSD64~256.png
DSD 샘플링별 양자 노이즈 시작 지점

DSD 자체가 단순한 구조로 되어있다 보니 업 샘플링 업그레이드 방식을 사용했는데 추후 SACD의 성공으로 후속 고용량 저장매체 미디어가 나왔을 때 업그레이드로 샘플링만 늘리는 방식으로 우려먹을 계획으로 보고 있다.

8. DSD 음원 마스터 종류

파일:HiResDSD.jpg

DSD 마스터(고음질 PCM)는 크게 5가지로 분류 할 수 있다.

DSD 마스터
스튜디오에 DSD레코딩 장비가 설비되어 DSD로 마스터한 경우이다. DSD 레코딩을 설비한 곳은 찾기가 어려울 정도로 매우 드물다. 대표적으로 일본의 F.I.X Records를 꼽을 수 있다.

DST 2.0 마스터
DST 마스터를 사용한 앨범은 2채널과 5.1채널을 동시에 담은 SACD 4.7G[33]에 꾹꾹 담아 넣기 위해 사용한다. 2003~2007년도의 5.1채널 SACD에 가장 많이 사용하였으며 드물게 2.0채널 SACD에도 사용하였다. DST자체가 무손실이나 22kHz 음역대가 잘린 앨범이 있는 편이다. 물론 무압축 DSD 마스터에서도 22kHz부분이 잘린 앨범도 있다.

DST 5.1 마스터
DST 2.0과 동일한 압축 기술을 사용했으며 채널이 5.1채널로 되어 있다. 그리고 안그래도 낮은 기존 2.0채널보다 더 출력이 낮지만 초 고음역대(22kHz이상)가 더 높은 것이 특징이다. 그리고 음도 기존 2.0채널과 다르게 5.1채널에 맞춰 리마스터했기에 음향효과등이 많이 낮은 편이다. 2.0과 5.1 둘 다 포함된 SACD의 경우 2.0에서 고음역대가 잘려도 5.1에서는 고음역대 주파수가 보존된 경우가 있다. 그러나 각 채널을 담다보니 이걸 2.0채널로 변환할 경우 모든 채널에 양자 노이즈가 겹치면서 가장 심한 양자 노이즈가 형성되는 단점이 있다. 2000년 중반까지 5.1채널 앨범이 잘나오다 효율성이 없어서[34] 결국 2000년 후반부터는 나오지 않게 되었다. 설령 나와도 DVD나 이전 SACD에서 쓰던걸 그대로 옮긴 경우가 대부분이다.

오픈 릴 테이프 마스터
오픈 릴 테이프를 그대로 DSD로 마스터한 앨범이다. 그렇기에 22kHz이상에서 노이즈가 많은 편이나 DSD를 마스터하는 스튜디오에 따라서는 하이 레졸루션 오디오보다 고음역대가 더 필터링된 경우도 있다. 때론 오픈 릴 테이프를 아예 DSD마스터하고 원본 오픈 릴 테이프를 폐기한 곳도 종종 있다. 이 경우 고음질 PCM으로 판매한 음원의 스펙트럼을 보면 DSD 양자노이즈가 있는데 원본 오픈릴 테이프가 없기에 기존 DSD 마스터를 고음질 PCM으로 변환해서 판매한 경우라 할 수 있다.

하이 레조 마스터
원본이 고음질 PCM이거나 또는 오픈 릴 테이프를 고음질 PCM으로 변환하고 원본 오픈 릴 테이프를 폐기한 경우이다. 기존 PCM과 차이가 없거나 때론 초 고음역대 노이즈가 없는 경우로 구분 가능하나 어지간해서는 스펙트럼으로도 구분이 안된다. 이건 SACD의 앨범커버와 DSD를 판매한 곳에서 기재를 하지 않는 이상 구분은 불가능에 가깝다.

SACD 커버 예제: 로드 스튜어트 Every Picture Tells A Story 앨범 SACD SHM-CD 커버 내용
파일:SACDROD.jpg
커버 내용을 번역하면 다음과 같다.

런던 오리지널 아날로그 마스터 테이프(오픈릴 테이프)를 도쿄 유니버셜 뮤직 스튜디오에서 DSD 마스터한 후 24Bit/176.4kHz(하이 레졸루션 음원)로 변환한 다음 빅터 크리에이티브 미디어에서 하이 레졸루션 음원을 커팅한 후 다시 유니버셜 뮤직 스튜디오에서 DSD로 변환하였다는 내용이다.

오픈릴 테이프에서 DSD 마스터하고 하이 레졸루션으로 변환해서 편집후 DSD로 마스터링 되었다는 복잡한 절차에 대한 이해가 어려울 것이다. 이 내용은 역시 하이 레졸루션 오디오와 DSD 문서를 자세히 읽지 않았다면 이해하기 힘든 부분일텐데, 대략 이해가 가능한 부분으로 해석하면 다음과 같다.

런던에서 오리지날 마스터 테이프를 받아 도쿄 유니버셜 뮤직 스튜디오에서 DSD 마스터화 했더니 문제는 DSD 마스터한 음이 너무 밋밋하여 요즘 취향에 맞는 음향작업, 즉 리마스터 작업이 필요하게 되었는데, 문제는 DSD 음원이 1Bit 방식이라 음향 작업이 불가능해서 음향 작업을 할 수 있는 PCM 음원으로 변환할 필요가 있었다. DSD 원본과 동일한 PCM 규격인 DoP 기준으로 24Bit/176.4kHz PCM 변환을 한 다음 하이 레졸루션 레코딩 장비가 있는 빅터 크리에이티브 미디어에서 리마스터 작업을 거친 후, 이 리마스터된 음원을 다시 도쿄 유니버셜 뮤직 스튜디오에서 DSD로 변환하였다.

파일:DSDHelp02.jpg
더 후 The Singles SHM-SACD 커버내용
트랙별로 *표기하여 어떤 레코드사와 어떤 소스를 사용했는지를 제대로 넣어준 예이다. 물론 1950년도 앨범의 경우 마스터 테이프가 없거나 마스터 LP[35]로 DSD 마스터링한 경우도 있다.

실질적으로는 음원에 양심적으로 스펙을 기재되지 않는 이상 구분하기 힘들다는 것이 문제이다. 다행이도 SACD를 발매하는 레코드사들은 이런 기재를 정확하게 하고 있는 편이지만 정체불명의 불법 DSD 음원 파일은 이런 부분의 기재가 없기에 정품을 구입하도록 하자.

9.황금귀들은 DSD 음원을 선호하는가?

2001년 Stanley Lipshitz과 John Vanderkooy는 1비트 변환은 음질이 많이 왜곡 되기에 하이 레졸루션 오디오에는 적합하지 않다고 했으며[36] 2007년에 발표된 CD와 SACD와의 같은 불륨에서 청음상 음질은 차이가 없다는 논문이 있으면서도 더욱이 황금귀들은 CD보다 매우 우수한 하이 레졸루션 오디오음원 보다 DSD 음원을 선호하는 경우가 많은데 대표적인 이유로 저음이 더 두텁고 풍부하며 전체적 음의 정보량이 많으며 더 부드럽고 따뜻한 아날로그 스러운 음색이 마치 원본 마스터인 오픈릴 테이프로 감상한듯한 음에 가깝다는 이유가 대부분이다. 이들 황금귀에 주장은 틀린 말은 아니다. 하이 레졸 음원과 DSD 음원이 이러한 음질과 음색의 차이가 나는 이유는 바로 하이 레졸루션 오디오와 DSD의 마스터링 차이에서 나는 것이다.

일단 이러한 언급을 하기 전 SACD가 나왔던 시기로 돌아가서 황금귀들 사이에서는 CD 오디오(이른바 'PCM 음원')에 대해서 매우 부정적인 의견을 많이 가지고 있었는데 CD 오디오 음질은 딱딱하고 날카롭다는 평이였다. CD 오디오가 처음 나왔던 시기엔 LP의 문제점이었던 노이즈와 전체적 음역대 표현력을 해결한 획기적인 음향기기였기에 어둡고 탁한 음색의 LP와는 다르게 컴프레싱[37] 작업 시 맑고 선명한 음을 내도록 마스터링되었다. 문제는 이런 음색 조정으로 인해 중, 고음이 올라가다 보니 저음도 밝은 성향으로 되고 중, 고음에 치찰음이 심해지는 문제가 있었는데 이런 음색으로 인해 다시 LP를 선호하는 빈티지 황금귀들이 등장하기 시작했으며 1993년부터 LP가 다시 부활하는 계기가 되었으며 특히 2000년 초엔 미국내 LP 판매량이 140만장이 넘을 정도 였었다.

그래서 소니와 필립스는 가장 근본적인 부분으로 접근을 시도하게 되었는데 바로 원본 아날로그 마스터 테입이였다. 황금귀 사이에서는 아날로그 음질의 1순위는 오픈릴 테이프를 최고로 인식하고 있었는데 LP는 근본적으로 먼지등에 의해 음이 튀거나 노이즈가 생기는 문제가 있었지만 오픈릴 테이프는 그런 문제가 없었고 그 자체가 원본이었기 때문이었다.

그래서 DSD의 마스터링은 컴프레싱을 거치지 않은 그리고 아날로그의 두텁고 따뜻한 음색으로 마스터링되게 하는 DSD 레코딩 장비를 만들게 되었는데 이게 희한하게도 양자노이즈의 덕분인지 DSD 레코딩의 성능 덕인지 오픈릴 테이프뿐만 아니라 PCM음원도 이 DSD로 변환하면 음색이 부드럽고 따뜻한 음색으로 변하는 특성을 가지게 되었다. DSD 초기엔 양자 노이즈에 대한 정체를 몰랐기에 DSD의 음색은 그야말로 오픈릴 테이프의 음색 특성을 그대로 지닌 새로운 마스터링 음원으로 각방받아 선호하는 아티스트들이 늘어나면서 수많은 앨범들이 DSD로 재 마스터링되는 경우가 많아졌다.[38]

그리고 이 당시의 프로듀서들이 DSD의 음색을 최대한 살린 신들린 마스터링을 하면서 이런 초,중반의 SACD 앨범들이 2010년 중반에 다시 PCM으로 발매할때는 따로 마스터링은 하지 않고 DSD를 PCM으로 변환해서 발매할정도로 이다. 그리고 초기도 그렇지만 후기에 나오는 요즘 SACD도 마스터 오픈릴 테이프를 DSD로 그대로 마스터링하여 오픈릴 테이프의 음색을 그대로 박제하듯이 녹음되어 있어서 이런 음색때문에 오히려 하이 레조 PCM버전보다 선호하는 이들도 늘어나게 되었다.


그렇기에 원본을 소장한 스튜디오에서 직접 디지털 마스터링하고 컴프레셔로 출력 조정까지 거친 하이 레졸루션 오디오 음원이 기존 CD에서 업그레이드된 부드럽고 섬세하고 풍부한 밝은 음색이라면 그와 반대로 아날로그 마스터 테입을 기반으로 제작한 DSD는 LP오픈릴 테이프 쪽에 가까운 음색이라 할 수 있는데 DSD는 하이 레졸루션 오디오에 비해 분리도와 정확도에서는 떨어지지만 저음이 많고 음이 따뜻한 성향이며 음선이 두텁고 차분한 성향을 가지고 있다.


물론 하이 레졸루션 오디오나 DSD 둘다 스튜디오에서 직접 제작했기에 가수와 프로듀서의 의견이 반영된 리마스터이기도 하고 특히나 하이 레졸루션 오디오는 손실이 매우 적기에 원본에 근접하며 측정 스펙트럼으로 봐도 DSD보다 초고역대 노이즈도 없고 품질도 우수하다. 그리고 청음상으로도 분리도와 섬세함에서도 하이 레졸루션 오디오가 객관적으로는 분명 좋으나 DSD에 박제된 아날로그 테입 음색은 황금귀들이 가장 선호하는 음색이라 할 수 있다. 물론 하이 레졸루션 오디오에서도 아날로그 테입을 동일하게 박제하기도 하지만 DSD의 레코딩 장비의 특성때문인지 그 특유에 아날로그스러운 음색은 DSD에서만 감상이 가능하다. 이런 점때문에 원본 버전이 있으면서도 DSD버전으로 판매하는 경우도 많고 이걸 하이 레졸루션 오디오로 변환한 음원을 파는 경우도 많다. 물론 PCM으로 변환해도 DSD 음색은 그대로 가져올 수 있기 때문이다.

파일:Hi-Ressorce01.jpg
크리던스 클리어워터 리바이벌 - Green River : Tombstone Shadow
(하이 레졸루션 오디오 음원보다 초고역대가 살아 있는 SACD 버전 하지만 그 반대로 하이 레졸루션 오디오쪽이 더 좋은 경우가 더 많다.)


하지만 문제는 SACD 앨범에 경우 리마스터가 아니더라도 각 음반사마다 재 발매한 앨범은 아날로그 테입을 기반으로 하는 것도 있지만 레코딩회사의 장비에 특성을 음질과 음색이 매우 다르다 것이다. 이런 문제는 리마스터가 아닌 이상 같은 소스를 제공하는 하이 레조 음원에 비해 일관성이 없는 음질과 음색을 지니고 있으며 무엇보다 가수와 프로듀서가 의도했던 음과 틀릴 수 도 있다는 문제를 가지고 있다 예를 들어 리마스터링이 가장 많이 된 앨범인 에릭 클랩튼의 461 Ocean Boulevard 앨범도 꼽을 수 있는데 그중 I Shot the Sheriff를 기준으로 DSD마다 음색 차이는 이렇다.

24bit/192kHz 461 Ocean Boulevard : 저음이 많고 중, 고음이 적당함
SACD 461 Ocean Boulevard 2004 : 저음이 약간 적고 중, 고음도 낮음
SACD 461 Ocean Boulevard 2010 SHM-CD 일본 한정판 : 저음이 약간 적고 중, 고음이 약간 맑음
SACD Timepieces: The Best of Eric Clapton 2014 Audio Fidelity : 저음이 더 적고 중, 고음이 맑고 더 명료함

그리고 펫 사운즈도 MFSL과 AP,SHM-CD의 SACD와 하이 레졸 음원과의 음색 차이가 다른데 하이 레졸 음원이 전체적으로 음이 맑고 공간감이 좋다면 MFSL은 음이 차분하고 보컬이 뒤로 밀려 공간감을 높였으나 음의 맑기가 낮고 AP/SHM-SACD판은 전체적으로 불륨을 올려서 출력이 높고 고음이 맑은편이나 보컬이 강조가 높아 거리감 적고 전체음도 강조가 심해 공간감이 떨어지고 음이 뭉치는 듯한 분리도가 낮은 음색을 낸다. 이로 인해 구매자가 원하는 음질, 수집성때문에 다시 앨범을 재 구매해야 하는 금전적부담에 상업성이 너무 높은 단점이 있다.[39]

그리고 DSD의 문제점에서 상술한 대로 DSD는 자체가 내부적으로 불안정한 구조를 가진 까다로운 음원이기에 이로 인해 DAC 성능에 의한 음색차가 심한 편이기에 각 DAC에서 어떤 필터를 적용하고 어떤 범위까지 DoP를 적용하였는지 샘플링은 어떻게 하였는지 등으로 인해 음색이 많이 달라지며[40] 특히 소프트웨어 튜닝으로 인한 것까지 포함하면 그 다양하고 방대한(!?) 조합 방식으로 인해 다양한 음색이 구현 가능하기에 자신들만이 좋아하는 음색으로 튜닝이 다양하게 가능하기에 황금귀들로서는 매우 매력적인 요소로 적용된 점도 있다.

그리고 2014년으로 가면서 DAC의 발전이 스튜디오 시설을 능가할 정도로 빠르게 기이한 발전을 하였는데 이 덕분에 DAC에 모든 스펙을 재생할 음원이 매우 부족한 시기가 되었다. 그래서 DAC제작사와 황금귀들은 DSD에 과도하게 높은 샘플링 주파수를 주목하고 새로운 대안으로 사용하게 되었는데 고성능 DAC에서 오버비트/샘플링으로 재생하여 고성능 DAC을 활용하는 쪽으로 활용하게 된 것이다.

DFF와 DSF 간에 음질이 차이가 난다는 황금귀의 주장이 있는데, DFF이던 DSF이던 최종적으로 DAC에 전달되는 스트림은 동일한 내용이어야 한다. PC에서 파일을 알집으로 압축하던 pkzip으로 압축하던 rar로 압축을 하던 원본과 달라질 리가 없는 것과 마찬가지이다. DSF 파일은 압축되지 않은 DFF나 혹은 DST로 압축된 DFF 포맷을 디코드한 후 DSF 포맷에 맞게 다시 인코드한 것 뿐이어야 한다. 하지만 실제 PC에서 동작하는 많은 변환 툴이 DFF 디코더와 DSF 인코더를 조합한 조악한 성능의 프로그램으로서, DSD(=DFF) 가 중간에 PCM으로 변환되었다가 다시 DSD(=DSF)로 인코딩되는 경우가 있다. 이는 DSD 의 개념을 이해하지 못한 프로그램 설계자가 돌아다니는 오픈 소스를 가지고 프로그램하다가 만든 병크로 중간 변환된 PCM의 샘플레이트가 44.1kHz로 설정되어 있으면 결과적으로 재생 대역이 22kHz로 줄어들게 된다.

10. DSD 인코딩/변환 관련 팁


DSD 인코딩
PCM을 DSD로 인코딩하여 DSD 재생을 지원하는 DAC이나 DAP로[41] 감상하는 비효율적 위키러에게 팁을 준다면 만약 변환해서 감상할 경우 DSD64보다는 DSD128을 권장하며 변환 재생 소프트웨어가 DSD256도 지원한다면 DSD256으로 해도 괜찮다. 위에도 상술 했듯 DSD의 샘플링 주파수가 높을 수록 용량이 엄청나게 커지지만 그만큼 초 고음역대 노이즈 구간 범위가 높아지기에 원본 PCM 음원의 손실도가 줄어든다. 그렇기에 매우 단순하게 생각해서 DSD를 지원하는 DAC에 스펙에 맞춰 DSD인코딩 음질 스펙을 최고로 올리면 된다. (...)

그래도 효율성을 따진다면 비트 정밀도 상관없이 샘플링 주파수 기준으로 44,48kHz는 DSD64를 88,96kHz는 DSD128을 176,192kHz는 DSD256이 좋으며 체배 수 샘플링을고려해서 44/88/176kHz 샘플링이 재 변환을 안해도 되기에 음질적에서는 이 주파수대가 DSD 변환에서 최적의 음질을 낸다고 보면 된다.

여기서 24Bit/88.2&176.4kHz와 24Bit/96&192kHz의 변환 파일중 가장 DSD 원음에 가까운 것은 24Bit/88.2&176.4kHz이다 DSD의 특성상 2.8Mhz는 44.1Khz계열의 계산법이 들어가기에 여기쪽으로 하면 어려운 계산 없이 거의 정확하게 원본에 가깝게 나온다. 그래서 DoP스펙을 24Bit/176.4kHz로 잡은 것도 이런 이유다. 그러나 반대로 24Bit/96&192kHz는 계산법이 다르기에 추론방식 계산이 들어간다. 그래서 음질은 떨어졌으면 떨어졌지 좋아지지는 않기에 44/88/176kHz를 사용하라는 것이다.


DSD PCM 변환
대부분의 무선 스피커나 네트워크 플레이어등에서는 DSD를 지원하지 않기에 변환은 필수 라고 할 수 있다.

DSD에서 PCM으로 변환하는 것은 용량이나 효율면에서 의미가 있으나, 그 반대로 PCM을 DSD로 변환하는 것은 아무런 장점이 없으며 오히려 음질이 나빠질 수도 있고 압축이 안 돼서 용량이 쓸데없이 커지기에 권하지 않는 편이다. 일부 황금귀 양반들이 PCM을 DSD로 변환하여 음질이 더 좋아지는 경험을 했다고 말하는 경우가 있는데, 이는 플라시보 효과이거나 PCM을 DSD로 변환시 달라진 노이즈 특성에 귀가 반응하거나 (가끔 나이드신 분들은 적당한 고역 노이즈에 대해 뽀사시 느낌을 받는다), 그게 아니라면 가지고 있는 시스템의 DAC 회로가 DSD 입력 때와 PCM 입력 때 다른 특성을 보이는 경우였을 확률이 크다.

SACD를 DSD로 변환하면 첫 1번 트랙이 3~4초(공백) 정도 늘어나는데 다른 변환 프로그램을 사용해도 마찬가지. 물론 PCM 변환도 똑같이 3~4초 정도 늘어난다. 다만 SACD 자체에서 재생하면 시간은 제대로 나온다.

DSD64를 PCM 음원으로 변환하려면 24bit/88.2kHz와 24bit/176kHz 두 가지 스펙을 권하고 있는데 DSD스펙에 비해 오버스펙으로 샘플링한 것을 알 수 있다. 16bit/176kHz가 동일 비트레이트 스펙이지만 DoP 규격 기준은 24bit/176kHz PCM을 기본으로 하고 있으며 그리고 대부분의 인코더도 이에 맞춰 24bit/176kHz로 하고 있거나 또는 오버해서 24bit/352kHz로 하는 경우가 있다. 이런 오버스펙은 위에 상술했듯 DSD의 샘플링 주파수때문인 것이다. 그래서 대부분의 음원판매 사이트에서도 DSD를 PCM으로 변환한 음원은 24bit/88.2kHz와 24bit/176kHz으로 변환해서 공급하고 있다.

48kHz/192kHz를 사용하지 않는 이유는 48~192kHz가 DSD의 샘플링 주파수 2.8224MHz의 체배주파수가 아니기 때문이다. 즉, 176.4kHz는 2.8224MHz의 1/16 이고, 88.2kHz는 2.8224MHz의 1/32 이기 때문에, DSD를 PCM으로 변환 시 쉽게 구현 가능하지만, 48이나 96, 192kHz의 샘플링 주파수는 비동기 샘플레이트 변환이 필요하며, 이때 자칫하면 음질 손실이 발생할 수 있다. 하지만 이걸 PCM 변환해 판매하는 곳은 24bit/88.2kHz와 24bit/176kHz 뿐만 아니라 24bit/96kHz로 해서 판매하는 곳도 있는데 대표적으로 아쿠아플러스 음악을 독점으로 레코딩하는 F.I.X. RECORDS가 대표적이다.

그렇기에 DSD를 PCM으로 인코딩할때 이 두스펙(24bit/88.2kHz, 24bit/176kHz)에서 선택해야 하는데 어렵게 선택을 고민할 필요는 없다.

파일:Hi-ResDSD07.jpg
가장 원본에 가깝게 하려고 한다면 24Bit/176kHz로 하면된다. 이부분은 DSD에 특성상 높은 샘플링 주파수를 위해서 양자노이즈에 포함된 고주파수를 살리는 것에 의의가 있다. 트위터에 무리가 갈 수 있으나 요즘은 대부분 DAC에서 해당 음역대를 잘라버리는 경우가 있고 그리고 어지간한 싼 트위터가 아니고선 무리가 안간다는 의견이 많다.[42] 그래도 걱정되면 30kHz LPF 필터를 해주면 된다. 참고로 DSD 마스터를 PCM으로 변환해서 판매하는 음원 사이트에서는 아예 안하는 경우도 있다. 특히 마이클 잭슨 Thriller, 사운드가든 Superunknown 앨범이 대표적인 예이다.

파일:Hi-ResDSDSorce03.jpg
현실적인 선택을 한다면 24bit/88.2kHz가 최적이다. 이 설정을 하면 용량도 줄일 수 있을 뿐더러 양자 노이즈도 필터를 안해도 될만큼 44.1kHz부분에서 잘라버리며 그리고 어지간한 올드팝,락등에서는 30kHz를 돌파하는 주파수가 드물기에 용량과 효율과 필터부분에서도 상당히 효율적인 부분이다. 청음상에서도 24Bit/176kHz와 구분하기 매우 어려울 정도로 유사한 음질을 들려준다.


DSD를 PCM으로 변환할때 LPF설정을 잘 해야 하는데 이게 프로그램마다 달라서 명확한 기준을 잡기가 힘들지만 보통 3가지 기준으로 나뉜다. 24kHz, 30kHz, 50kHz로 필터 기준을 정할 수 있는데 너무 낮게 잡으면 고역의 다이나믹 레인지가 손실되어 버리고(어차피 가청 영역 이상 범위라 상관없지만) 너무 높게 잡으면 고주파 노이즈가 많이 남게 된다. 설정에 따라 미세하지만 음질적 차이가 발생하니 들어보고 본인의 취향대로 설정하면 된다. 하지만 대부분 요즘 스마트폰, DAP플레이어는 로우패스로 대역을 잘라버리기에 어느 쪽이든 그다지 크게 문제될 것은 없다. 다만 문제는 PCM 재생시에는 기본적으로 DSD와 다르게 대역 필터가 없기에 왠만하면 해주는 것이 좋다. 만약 이 과정을 거치지 않을 시 40kHz 이상을 제대로 재생하는 고성능 DAC로 재생하면 스피커 트위터 무리가 갈 수 있으니 주의하자.

SACD 중 멀티 채널(5.1채널)의 경우 2채널과 5.1채널이 같이 들어 있는데 이걸 DSF나 PCM 음원으로 변환한다면 원본과 동일한 음색은 2채널을 권하고 높은 음역대와 담백한 색다른 음색을 찾는다면 5.1채널을 권한다. 먼저 2채널의 경우 위에도 DST에도 상술 했듯 CD와 동일하게 22kHz에서 잘려 있으며 5.1채널은 24kHz이상의 주파수를 가지고 있다. 하지만 5.1채널용으로 제작되다 보니 원본 음악과는 약간은 다른 음색을 가질 수 있으니 주의하자.[43] 그리고 DST로 압축된 SACD를 DFF로 변환하면 DST 압축 그대로 유지되기에 용량을 많이 줄이긴 하지만 DSF나 또는 PCM으로 변환하면 용량이 엄청나게 커진다. (최대 9GB 이상) 합리적인 용량으로 스마트폰 & DAP로 감상하려면 5.1채널을 2채널 PCM 으로 재변환해서 용량을 줄이고 추가로 6db정도 볼륨을 뻥튀기시키는 것을 권한다. 불륨 뻥튀기를 해야 하는 이유는 2채널 DSD보다 5.1채널 DSD는 볼륨이 더 작기 때문이다. 하지만 이런 조절 방식은 높은 볼륨으로 인해 클립핑이 일어나서 음이 찌그러지는 잡음 문제가 있으나 스마트폰 특성상 볼륨이 제한되어 있기에 이 방법을 사용해야 한다. 그래서 클리핑이 최소화된 볼륨을 6db로 잡은 것이다.

DSD로 인코딩한다면 DSF 포멧이 테그 편집과 앨범아트 삽입이 가능하기에 가장 권하는 포멧이지만 DSF는 인코딩 과정에서 중간에 거처가는 과정 (특히 DST에 경우 압축 풀어 제 DSF 인코딩)이 있기에 DST 압축등을 고려해서 가장 SACD원본에 가까운 포멧은 DFF이다. DFF에 경우 테그 편집과 앨범아트를 넣을 수 없는 문제가 있지만 무엇보다. 황금귀들은 DFF 쪽이 음이 좀더 힘있고 풍부하다고 해서 DFF를 더 선호하는 경우도 있다. (중간에 PCM 변환하는 인코더를 사용했나?) 해당 미니기기가 CUE를 지원한다면 가장 SACD 원본에 가까운 이상적인 음원이라는 장점도 있긴 하지만 지원되지 않는 재생기기도 있고 DST압축을 지원하지 않는 기기등도 있기에 별로 권하지 않는다.

제대로 만들어진 변환 툴이라면 무손실 변환을 하고 있으니, 이를 잘 찾아 사용하기 바란다. 무손실 변환이 확인된 툴로는 TASCAM이 제공하는 Hi-Res Editor가 있다.

11. 여담

SACD가 실패한 이유는 일단 플레이어가 너무 크고 무거우며 (기본 30kg) 가격이 고가에 형성되어 있다 보니, 특히 한국에는 음반이 매우 적었으며 더욱이 제대로 된 SACD/DSD 음원은 그 레코드 회사가 DSD 기반으로 시설을 갖춰야 했기 때문이다. 이런 환경이 갖춰지지 못한 회사는 PCM 음원을 그대로 DSD로 변환해서 제대로 된 성능을 살리지 못하는 문제점이 있다.[44] 현재 DSD 레코드 시설을 갖춘 대표적인 회사는 일본의 F.I.X. RECORDS[45]로, 이 곳에서는 모든 것을 DSD로 하고 있으며 PCM 버전으로 판매한 것도 DSD를 변환해서 한 거라 30kHz 이상에서는 특유의 양자 노이즈가 있다. 최근에 나온 티아라 투 티어즈2 보컬 앨범은 부분을 많이 필터링해서 제거하였지만 그래도 약간은 남아 있다.

DSD를 PCM으로 재생하는 방식의 재생 플레이어나 DAC 들은 스펙 규격이 DAC의 성능에 따라 다르겠지만 24Bit~32Bit 192kHz~352kHz 또는 384kHz로 엄청 넓게 주파수를 잡고 재생하는 비 효률적인 DSD → PCM 변환 방식을 사용하기도 하는데 아마도 DSD의 2.8224MHz로 인한 임펄스 값을 살리기 위해 Anti-aliasing filter를 가급적 slow-slope의 Filter로 필터링하기 위해 이렇게 오버 샘플링을 잡아서 재생하는 듯하다. 이러한 DSD to PCM 변환시, PCM 샘플링 주파수의 선택과 Anti-aliasing filter의 방식(=IIR filter 차수 또는 FIR filter의 tap 수)에 따라 배터리 소모량이 달라 재생시간이 많이 줄어드는 비 효율적인 문제를 야기할 수 있다. 이 처럼 DSD 자체가 워낙 엽기적인 스펙이기에 그만큼 DSD to PCM 변환 DAC은 그 자체 성능 즉 DAC의 로우 패스 지점과 필터, 성능 등의 차이가 DSD 변환 재생에 영향이 많이 받는 편이다. 만약 DSD to PCM 변환하여 재생을 하는 DAC을 찾는다면 32Bit/352&384kHz를 지원하는 DAC을 고려하자.

스마트폰 중 Native DSD를 재생 가능한 제품은 LG V10으로 새롭게 바뀌어서 탑재된 ESS 9028C2M DAC 덕분에 DSD의 하드웨어 재생을 지원하게 되었다. 최대 DSD128까지 지원하며 DSF로 되어 있어야 한다. V20에서도 재생이 가능하며 여기다가는 무려 4개의 DAC를 때려넣었다!

팟플레이어 스킨 확장자인 DSF와 동일하기에 재생되는 줄 알고 클릭하면 재생이 안 되고 스킨을 추가하겠냐고 물어보니 주의하자.

DSD 음원을 감상하는 사람을 무조건 무시해서는 안 된다. 왜냐 하면 고음질 음원중 DSD로만 나온 앨범이 많기 때문에 SACD로만 감상할 수 있는 앨범이 많은데 예를 들어 하마사키 아유미의 최후의 밀리언셀러 앨범인 MY STORY의 고음질 & 5.1채널 음원은 오직 SACD로만 나왔으며 노라 존스의 Come Away with Me의 5.1채널 음원은 오직 SACD에만 수록되었고 야마구치 모모에, Suara 등의 앨범도 상당수 SACD로만 출시 되었으며 그리고 DSD 마스터만의 리마스터링된 음색이 있기 때문이다.

PCM으로 레코딩된 음원을 DSD로 변환 후 SACD로 발매하는 일이 많아 이것을 비난하는 경우가 있는데 이것이 사실 비난의 여지가 될 수는 없다. 레코드 회사에서는 당연히 수익성이 높고 그나마 보급이 된 쪽으로 해당 앨범을 내는 것이 당연한데 이것이 문제라면 레코드 회사보고 망하라는 말과 같으며 오픈 릴 테이프로 마스터링 된 음반은 CD로 내면 안 되고 오직 테이프와 LP로만 출시하라는 억지나 다름 없다.


같은 앨범의 하이 레졸루션 오디오 버전과 DSD 버전을 같이 파는 사이트 대부분은 DSD를 더 비싸게 파는 경우가 있는데 일본 쪽은 그나마 둘 다 같은 가격으로 판매하지만 외국과 국내는 좀더 값을 쳐서 판다. 더욱이 복제율과 DSD특성상 음원 변조가 안된 다는 점 때문에 SACD로 리마스터링 출시하는 앨범이 2016년이 넘어도 계속 나오고 있다.


2000년대 초에는 혁신(!?)의 기술인데다 소니와 필립스[46]의 과대광고 마케팅과 DSD 특유에 음색에 넘어간 나머지 많은 레코딩 회사에서 오픈릴 테이프를 DSD 마스터한 경우가 많았다. 예를 들어 롤링 스톤즈의 모든 앨범을 DSD 마스터[47]를 하였고 비치 보이스에 펫사운드를 제외한 거의 대부분의 앨범을 역시 DSD마스터를 하였으며 그리고 마이클 잭슨의 최고 명반 Thriller도 DSD 마스터하는 업적을 이루기도 했다. 하지만 DSD의 문제점을 알고 다시금 PCM으로 재 마스터링되었지만 이미 삽입되어버린 양자노이즈는 제거하지 못하였다.

SACD에 경우 2000년 초기와 후기로 나눠지는데 초기에 나온 SACD음반은 오픈릴 테이프 기반이지만 후기에 나온 것은 오픈릴 테이프를 하이 레졸루션 오디오로 복원하고 다시 DSD로 변환한 음원인 경우가 많다. 2010의 일본 한정판으로 나온 앨범들은 오픈 릴 테이프를 기반으로 한 앨범도 있지만 더 자세한 건 SACD 커버 표지에 잘 기재되어 있으니 커버 표지를 참고하면 된다.

Mobile Fidelity Sound Lab Inc.에서 출시하는 SACD는 이전에 초창기 선 발매된 SACD와 그리고 후에 디지털 복원 발매된 하이 레졸루션 오디오 음원과는 다르게 원본 오픈 릴 테이프을 리마스터링 한 후 새로 레코딩하여 복원한 DSD인데 얼마나 다르냐면 밥 딜런 - Highway 61 Revisited SACD와 후에 출시된 하이 레졸루션 오디오 음원에서는 거의 동일하게 노이즈가 있는 반면 Mobile Fidelity Sound Lab Inc.에서 발매된 SACD에 경우 이런 노이즈가 제거 되고 이런 노이즈 제거로 인한 음원 손실이 최소화되고 매우 깔끔하게 복원된 스펙드럼을 확인할 수 있다. 그렇기에 리마스터링이긴 해도 2010년 후반 오픈 릴 테이프 복원 음원을 감상하고 싶다면 MFSL에서 출시한 SACD 앨범을 구입하면 된다. 참고로 한정 판매한다. 하이 레졸루션 오디오로 공개 안된 앨범도 은근히 많이 있다.

DSD 음원의 경우 출처 신경을 많이 써야 한다. 왜냐면 가짜 DSD도 있기 때문이다. 예를 들어 ClariS에 DSD64~256 까지 나온 カラフル, コネクト, ルミナス의 DFF 음원의 경우 100% 가짜다. 출처 자체도 없고 거기에 ClariS에 음원에 경우 음원 종류에서도 볼 수 있듯 원래 부터 소니 뮤직에서 디지털 마스터링 한 음원이기에 이걸 그대로 DFF로 변환한 것이기 때문이다. 이미 원본은 하이 레졸루션 오디오 음원으로 판매중이기에 괜히 용량 낭비하는 쓸대 없는 짓 하지 말자. 그리고 레드 제플린 SACD도 발매한적이 없는 앨범이며 기존 하이 레졸루션 오디오를 DSD로 변환해서 제작한 해적판 SACD 이미지이다.

모든 트위터가 무리가 가는 것은 아니다 저렴한 트위터는 작살이 날 지도 모르겠지만, 30kHz 이상의 대역에 실려있는 Shaped Noise는 약 RMS level 로 환산시 -23.5dBFS 정도로 볼륨을 너무 높이지만 않는다면 정상적으로 트위터를 망가뜨릴 수준은 아니다(-23.5dB의 수치는 "Resolution Magazine"의 2004년 7/8월호에 실린 Mikael Vest 의 "The advantages of DXD for SACD"에서 설명되어 있다. DSD 변환시 100kHz 이하에서 발생하는 Shaped Noise의 RMS 값은 전대역의 약 1/15(=100kHz/1.4112MHz)에 해당되는데, 이를 데시벨로 계산해보면 유사한 값을 얻게 된다). 하지만 저렴한 트위터의 경우 내구성이 좋지 않다 보니 장시간 Shaped Noise 에 노출될 경우 보이스 코일의 발열에 의해 열파괴가 일어날 가능성이 충분히 있다.

DSD에 지터에 경우 DSD는 오히려 샘플링 주파수가 CD보다 높기 때문에, 이론상 지터가 감소한다. 하지만 플레이어의 하드웨어를 구현함에 있어 시스템의 구조에 따라 지터가 CD보다 더 심할 수도 있고 아닐 수도 있다. CD의 경우 정해진 시스템 클럭에 100% 동기화된 시스템이었으나, SACD 플레이어나 DVD-Audio 지원의 유니버설 플레이어는 그렇지 않으며 때문에 하드웨어 설계자의 노하우에 따라 지터 성능이 떨어질 수 있다.

소니에서 LPF를 사용하는 이유는 양자 노이즈를 제거 하기 위해서 아니라 디지털 불륨 기능을 사용하기 위해 어쩔 수 없이 PCM 변환을 해야 하고 그 과정을 LPF를 사용하고 있는 것이라는 SACD 개발자의 주장도 있다.

가끔 DSF의 경우 레코딩 회사에서 SACD 용으로 직접 레코딩한 다이렉트 레코딩이거나 원본 아날로그 음원에서 리마스터링한 음원이기에 DSF가 기존 판매된 SACD와 차이가 없을 것이니 음질이 더 좋은 것이라고 생각하는 사용자들도 있다. 하지만 실제 판매되는 DSD 음원은 DSD 레코딩 시설을 갖춘 곳에서는 그대로 원본을 빼서 넣기에 차이가 없거나 리마스터링해서 더 나을 수 도 있다. 그러나 귀차니즘으로 그냥 SACD의 DFF 포맷을 뽑아서 DSF로 변환하여 파는 망할 레코딩 회사도 있다. 첫 트랙에 앞 부분이 원본과 다르게 2~3초 공백 트랙이 있다면 100% SACD에서 뽑아다가 변환한 거다.

12. 관련 문서


[1] PDM(pulse-density modulation) 기술에 기초한 방식으로 CD 플레이어용 DAC 구현에 활용되었다.[2] 당시 1982년 CD 개발 이후 벌어먹던 라이센스가 만기되어서 이에 대한 대안으로 새로운 미디어가 고려되고 있었다.[3] CD의 탄생이 1982년이므로, 특허 기간 20년을 기준하여 2000년대 초가 되면 CD의 특허는 만료될 예정이었다.[4] PCM 이론의 가장 큰 맹점은 나이퀴스트 이론에 근거하여 에일리어싱이 일어나지 않도록 기록 재생 가능한 주파수 대역을 샘플링 주파수의 절반으로 제한해야 한다는 점이다. 이 때문에 CD에서는 brick-wall filter라 하여, 20kHz 이상의 대역을 칼로 자르듯 급격히 필터링해야 했는데, 그것이 음질적으로 매우 나쁜 결과를 초래한다는 주장이 있다. 이는 하이 레졸루션 PCM에서도 그대로 이어지는데, 192kHz 샘플링 주파수를 사용해도 90kHz 이상의 대역을 필터링해야 한다. 하지만 델타 시그마 변환을 하는 DSD의 경우, 샘플링 주파수가 상대적으로 높아 에일리어싱 현상을 무시해도 되며, 따라서 brick-wall filter에 의한 음질 열화를 피할 수 있어, 아날로그에 가까운 특성을 재생한다는 주장이 가능하다.[5] 델타 시그마의 이론에서는 100kHz 이상의 대역도 기록 재생이 가능하다. 하지만 필립스와 소니가 공개한 초기 SACD 공식 문서(Super Audio CD - A Technical Overview)에서는 재생 대역을 100kHz까지로 정의하고 있으며, 실제 필립스가 제작한 SACD 테스트 디스크에도 100kHz까지 신호가 기록되어 있다.[6] 64의 뜻은 CD 샘플링 주파수의 64배라는 뜻이다.[7] 실제로는 손실 압축으로 멀티 채널 기록이 가능하다. 드물긴 하지만, 돌비 디지털이나 DTS가 CD로 발매된 바 있으며, 그러한 디스크를 재생하여 SPDIF 연결로 AV 리시버 등의 기기를 통해 재생하면 멀티 채널을 감상할 수 있다.[8] 델타 시그마 변환 시 다이나믹레인지는 Noise Shape Filter의 차수에 따라 달라지며, 통상 DSD의 표준으로 제안하는 5차 내지 7차의 Noise Shape Filter를 사용하는 경우 120dB의 다이나믹 레인지를 얻을 수 있다.[9] 양자 노이즈로 인해 30kHz정도 유효 재생 범위다.[10] 멀티 채널 SACD 디스크는 5채널 혹은 5.1채널까지 지원되며, 통상의 경우 2채널 음원도 같이 포함되어 있다. 용량이 크기에 대부분 DST압축을 사용한다.[11] DSD 신호라 하더라도 최종적으로는 아날로그로 변환되어 앰프와 스피커를 통해 소리가 나야 하므로 어떻게 DSD를 아날로그로 변환할 것이냐는 문제인데, 첫째, DSD를 직접 아날로그로 바꾸거나, 둘째, DSD를 PCM으로 바꾸어 다시 PCM을 아날로그로 바꾸는 방법을 생각해볼 수 있다. 하드웨어 재생 방식으로는 이 두 방법이 모두 가능하며, 소프트웨어 재생 방식은 오직 두 번째 방법만 가능하다고 이해하면 된다.[12] 꼭 그런 것은 아니다. AKM에서 나오는 DAC 칩은 아직까지도 DSD 입력을 지원할 경우 Native DSD로 재생할 수 있는 옵션을 제공한다. 다만 Native DSD 재생 옵션에서는 볼륨 처리 등의 다양한 기능을 사용하지 못하는 제약이 발생하게 된다. 이와는 달리 최근의 ESS Sabre DAC 칩의 경우, Native DSD 재생의 옵션이 아예 없으며 입력된 DSD를 내부에서 PCM 변환 처리한다(실제로 ESS Sabre 칩에 의해 재생되는 신호를 분석해보면 이를 확인해볼 수 있다. 믿거나 말거나...).[13] SACD 초창기의 DAC 칩은 대부분 Native DSD를 재생할 수 있는 옵션을 제공하였었다. 예를 들어 울프슨 마이크로일렉트로닉스(지금은 시러스로직에 인수되었다.)의 WM8741 DAC에는 Direct DSD 모드와 PCM-coverted 모드를 모두 지원한다.[14] 실제로는 이를 다시 델타 시그마 방식으로 PWM 처리하여 재생한다. 사실 최근의 DSD 입력 DAC 칩은 DSD 입력을 받아 PCM으로 변환하는 것 외에는 PCM DAC와 구조적으로 큰 차이가 없다.[15] 100% Pure Native DSD 재생을 위해서는 아날로그 방식의 볼륨 처리가 반드시 필요하다. DSD 신호는 PCM으로 변환하지 않는 한, 디지털적으로는 볼륨 처리가 불가능에 가깝다. 예를 들어, Native DSD DAC이라 잘못 소문난 ESS Sabre 9018도 볼륨 제어를 위해 DSD 신호를 내부에서 PCM 변환 후, 다시 수십 MHz의 매우 높은 샘플링 주파수의 멀티 비트 PWM으로 재양자화하여 처리한다. 이런 칩 내부의 구조를 모르고 DAC 칩이 DSD 입력만 받을 수 있으면 무조건 Native DSD DAC이고 음질이 좋은 것이다라고 설레발치는 황금귀들의 얘기는 그냥 흘려 듣기 바란다.[16] DSD 신호를 PCM처럼 구성하여 전송하는 방식은 DoP 이전에 DSD over AES/EBU 라는 소니가 제안한 전송 방식이 있었으나 이는 스튜디오용 프로 장비에서 사용되었으며 일반 소비자 제품에서 활용되어지지는 않았다.[17] Marker 값이 변경된 이유는, DoP를 지원하지 않은 DAC에서 오동작 발생 시, 기존 1.0에서 사용한 0xAA 값은 굉장히 큰 소음을 유발하거나 직류를 발생하여 제품의 고장을 일으킬 수 있었기 때문이다. 1.1 규격에서 사용한 0x05 및 0xFA는 DAC가 오인식하더라도, 발생하는 소음이 88kHz/-34dBFS 수준의 초고주파 잡음이라 소비자 문제가 우려되지는 않는다.[18] 원래 DoP 규격이 만들어진 배경은 PC 때문이 아니라 Mac OS 때문이다. PC의 경우, Windows 환경에서 ASIO를 통해 상위 어플리케이션 레벨에서 하드웨어 레벨로 오디오 신호를 bit-perfect 전송할 수 있으며, ASIO 2.1부터는 native DSD를 지원하여 전용 ASIO 드라이버만 있으면 DSD 재생에 크게 문제가 없었다. 하지만, PC Windows 환경보다 음질이 좋다고 알려진 Mac OS X는 ASIO 드라이버 없이 Native로 PCM만 지원하여, DSD를 Native로 처리할 수 있는 마땅한 방법이 없었다. 그래서 만들어진 것이 DoP라는 처리 구조이다.[19] DSD 신호에는 가청대역 이상에서 Noise Shaper에 의해 발생한 Shaped Noise라는 노이즈가 존재한다. PCM 변환시 이 Shaped Noise를 충분히 제거하지 않으면, 샘플링 이론에 따른 에일리어싱 현상(1/2 샘플링 주파수을 넘어서는 주파수가 1/2 샘플링 주파수 이하의 대역으로 간섭-transition-되는 현상)에 의해 가청 대역 상에 노이즈가 발생하게 된다.[20] 이유는 사운드 칩을 제공하는 곳과 안드로이드 커널에서 자체적으로 제한을 걸어버리기에 앱에서 대부분이 제한되어 있다. 기본적으로 안드로이드는 96kHz 이상의 PCM 신호를 처리하기에 적합한 OS가 아니다. 안드로이드의 커널에는 PC Windows의 KMixer 와 같이 Audioflinger라 하여 모든 오디오 신호를 48kHz로 변환하여 처리하는 부분이 있는데, 이 역시 PC의 ASIO와 같이 우회하는 방법 없이는 96kHz 이상의 오디오 신호를 온전히 처리할 수 없다. 삼성 갤럭시 스마트폰의 경우 UHQ Upscaler 기능을 켜면 모든 앱에서 24-bit/192KHz 음질로 재생할 수 있다(왜곡을 방지하려면 '비트 향상'만 선택하는 것을 권장).[21] 이와 관련하여 SACD의 표준 문서(Scarlet Book)에서는 0dB SACD 기준으로 +3.1dB의 헤드룸을 가지고 있는 것으로 기술하고 있다.[22] Native 방식으로 DSD를 아날로그 변환하게 되면, 출력 보정이 필요 없으나 대부분의 DAC는 중간에 레벨링 등을 위해 PCM 변환하는 경우가 많으며, 이 경우 클리핑에 의한 찌그러짐을 방지하기 위해 PCM 변환 시 레벨을 낮추게 되며, 이를 다시 아날로그 단에서 보정하게 된다. 자칫 DAC의 아날로그 단이나 DAC 바로 뒤 아날로그 단에서의 전원 전압이 충분히 높지 않은 경우(예를 들어 +/-3.3V 를 사용하는 경우)에도 찌그러짐이 심하게 발생할 수 있는데, 잘 설계된 DAC라면 이러한 점들을 고려해서 충분한 헤드룸의 아날로그 단이 설계되어 있을 것이다.[23] 소니 첫 SACD플레이어인 SCD-1을 사용하다 고가의 장비(앰프)와 스피커가 고장났다는 사례가 있다.[24] 핑크플로이드, 제네시스(밴드), 홀엔오츠등.... 이것 때문에 뒷목잡고 있을 황금귀들이 많으리라...[25] 예로 밥 딜런의 몇몇 앨범과 비치 보이스와 롤링 스톤스의 대부분의 앨범이 DSD 마스터가 되었다.[26] 거기에 년도마다 SACD음반 제작 4대 음반사가 내놓은 한정판 앨범은 황금귀에 뒷목을 또 잡게 만든다.[27] (퀸, 존 레논 앨범) 이렇게 아날로그 마스터 테입으로 제작하다보니 아날로그 테입의 특성인 장비에 따른 음색에 변화가 있어 음반사마다 발매되는 SACD에 음색이 많이 다른 문제가 있다.[28] 원래 DST로 압축된 데이터에 대해 DSTIFF(DST Encoded Audio Data) 라는 이름을 쓰고, DST 압축이 되지 않은 raw DSD 데이터의 경우 DSDIFF라 하는데, 파일 확장자를 두 개 모두 DFF(3문자 제한)로 사용하다 보니, 일반인들은 두 포맷을 혼동하여 모두 DFF 파일이라 부르고 있다.[29] 추후 하이 레조버전으로 발매되었는데 여기선 고음역대가 제대로 되어 있다. 하지만 청음으로 비교한 레코딩 수준은 음역대가 잘려도 DSD가 더 좋다는 평이 앞도적이다.[30] 원래는 2000년대 초반부터 VAIO 등 소니 제품에서 DSD 파일을 지원하기 위한 포맷으로 고안되었다. 2005년에 정식으로 V1.0 및 1.1 spec 을 공개하게 되었는데, 이는 DSF를 MPEG-4 Audio standard에 포함하기 위한 이유가 있었다.[31] 특히 5.1채널 SACD 앨범을 립핑하면 DFF는 3.7기가인 것이 DSF는 9기가 이상으로 커진다.[32] Digital eXtreme Definitiond. Pyramix 에서 DSD 의 편집 환경을 만들기 위해 고안된 포맷[33] 고용량 듀얼 레이어를 사용하면 자연히 SACD가격도 올라가기에 가격을 맞추기 위해서이다. 즉 원가절감[34] 초기엔 다채널에 대해서 관심이 많았지만 설치 공간과 불편함의 문제와 채널수가 많다 보니 각 스피커마다 사운드 음향이 원본과 다른 점도 문제가 되었다.[35] 초기 LP 생산의 1~100번 안에 드는 퍼스트 생산 원본. 이 마스터 LP로 양산형 LP를 찍어낸다. 이 방식을 사용한 대표적인 SACD 앨범은 엘라 피츠제럴드의 Ella and Louis 이다.[36] 그리고 필립스는 이에 반박하며 자료를 들었고 그리고 이 둘은 DSD에 재생방식도 결국 음이 왜곡된다고 주장하고 PCM은 멀티비트와 디지털 컨버터로 왜곡을 줄일 수 있다고 했으며 Robert Stuart는 DSD는 왜곡이 심하기에 고급 레코딩및 음원 분석에서는 사용해서는 안된다고 했다. 결국 독일 Thienhaus 연구소에서 DSD와 PCM의 차이를 구분하는 테스트를 했는데 둘의 차이를 구분하기 어렵다는 결론으로 결국 DSD 음질 논란은 종료된다.[37] 이 작업을 안 하면 CD 볼륨이 매우 작아진다.[38] 디지털 마스터링은 아날로그 마스터에 음색과 차이가 나서 LP매니아나 제작자도 디지털 마스터링으로 만든 LP는 아날로그 특유에 음색을 살리지 못한다고 해서 일부로 오픈 릴 테입을 사용한 과거의 아날로그 레코딩을 하는 뮤지션도 늘었다. 예를 들면 푸 파이터에 Wasting Light앨범이 그렇다. 다만 아날로그 레코딩 작업을 하는 곳도 적고 비용도 많이 든다고 한다.[39] 심한경우 1년 단위로 레코딩사마다 같은 앨범을 다른 음색으로 재 발매한다. 보통 리마스터 음원이 5~10년후에 한번씩하는 것에 비하면 SACD는 도대체 어느 앨범이 공식 원본에 음색인지도 감이 안잡히는 수준이다.[40] 오죽하면 이 음원을 만든 소니도 NW-ZX2에 DSD 재생 음색을 두 종류로 나눠버렸을 정도이다.[41] 보통 DSD를 재생할 수준의 DAC이나 DAP면 PCM도 대부분의 스펙은 다 커버되지만 그래도 DSD를 선호하는 사람들이 은근히 많다.[42] 실제로 소니 무선 스피커나 네임의 뮤조도 그렇고 스펙상 40kHz 재생이나 20~25kHz에서 노이즈 쉐이핑을 필터해버려서 재생이 25~27kHz 빢에 안되는 경우가 있다. 이유는 하이 레조 음원중에서도 고전 음악은 고음역대가 노이즈가 양자 노이즈를 빰치는 빡신 노이즈가 있는 앨범도 있어서 이것 때문에 트위터를 보호하기 위해서 이다.[43] 원본에는 코러스가 들어가는데 5.1버전은 코러스가 빠지기도 하며 전체적으로 음향 효과가 빠져서 음이 담백하다 할 정도로 단순해진 경우도 있다.[44] 대표적으로 유니버설에서 나온 SACD가 그렇다.[45] 투하트, 화이트 앨범2등의 아쿠아플러스 음악을 독점적으로 레코드하고 있는 회사이다. Suara의 음원도 이 곳 담당.[46] 소니의 소니뮤직의 레코딩 기술과 필립스의 첨단 기술등의 브랜드 이미지도 한목했다.[47] 최상급 마스터링을 위해 녹음시 극저온 케이블도 사용했다고 기제 되어 있다.