최근 수정 시각 : 2024-11-20 15:08:35

Suno

Suno AI에서 넘어옴
생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · o1 · LLaMA · Gemma · Claude · Phi · Exaone
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오/소리 [[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
멀티모달 모델 기반
대화형
+이미지
Exaone 3.0 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini
+에이전트
Galaxy AI · Claude 3.5 Sonnet
행위/동작 [[지능형 에이전트|
에이전트
]] Apple Intelligence · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}
Suno
파일:Suno 로고 블랙.svg파일:Suno 로고.svg
<colbgcolor=#000><colcolor=#fff> 출시일 2023년 12월 20일 (웹앱 기준)
기능 음악 인공지능
지원 언어 영어, 한국어 등
사용처 자체 웹앱, Microsoft Copilot, Discord
라이선스 Proprietary SW
링크 파일:홈페이지 아이콘.svg 파일:디스코드 아이콘.svg
파일:홈페이지 아이콘.svg 소개 페이지 파일:디스코드 아이콘.svg 파일:X Corp 아이콘(블랙).svg 파일:인스타그램 아이콘.svg

1. 개요2. 특징3. 요금제4. 사용처5. 사용 사례6. 논란 및 사건 사고
6.1. 음원 무단 학습 소송 사건
7. 기타

[clearfix]

1. 개요

간단한 프롬프트 입력만으로 음악을 만들 수 있는 음악 작곡 · 생성 인공지능이다.

2. 특징

  • 다른 음악 생성 인공지능과 달리 보컬을 매우 정확하게 생성해낸다. 오디오 품질만 빼면 거의 사람이 직접 부르는 것처럼 느껴진다.
  • 이미 있던 음악에 목소리만 바꾸는 것이 아니라 세상에 없던 새로운 음악을 만들어 낼 수 있다.
  • Custom 모드를 껐을 때는 곡에 대한 전체적인 설명 입력 만으로 생성이 가능하고, 켰을 때는 직접 가사와 스타일, 제목을 지정할 수 있다.
  • 한번 작업할 때마다 10 크레딧을 소모하여 2곡씩 생성된다. 생성할 시 가사에 따라 적당한 AI 커버 아트가 자동으로 그려진다.[1]
  • 모델 버전을 지정할 수 있으며, 버전별로 생성할 수 있는 최대 곡 길이가 다르다.[2]
    • v2: 빈티지 모델. 최대 1.3분
    • v3: 폭 넓고 다재다능한 모델. 최대 2분
    • v3.5: 더 나은 곡 구성 가능한 모델. 최대 4분
    • v4: 최신 모델. 최고의 보컬 품질과 곡 구조로 구성. 최대 4분
    • 기존 모델들을 v4 모델로 리마스터가 가능하다. 하루 한 번 무료로 가능하며, 그 이후에는 유료 플랜을 사용해야 하며 생성당 10 크레딧이 소모된다.
    • 더 긴 노래로 연장하고자 할 경우 "Extend" 기능을 활용하여 추가로 생성하고[3] 하나로 합치면(Get Whole Song) 된다.
  • 가사에 메타태그를 써서 좀 더 세밀한 제어를 할 수 있다. 메타태그는 대괄호([ ])를 이용하여 쓸 수 있으며, 일반적인 메타태그로 [Intro], [Outro][4], [Verse], [Chorus]가 있다. 그 외 메타태그 예시 목록
    • [Verse 1], [Verse 2] 같은 방식으로 구간 구분을 만들 수 있다.
    • 메타태그는 AI 모델이 음악 생성시 참고용으로만 사용하므로 경우에 따라 구간 구분을 해도 지정한 구간이 두번 이상 반복되는등 메타태그를 무시한 결과물이 나올 수 있다.
    • 모든 메타태그는 예시일 뿐 정해진 것은 아니다. 즉, 이 외에도 메타태그 2개 이상을 조합해보거나 직접 적합하다 생각하는 단어를 메타태그로 써 볼 수도 있다. 물론 실제로 잘 될지는 여러 시행착오가 필요할 수도 있다.(예: [Fast], [Outro Beautiful Slow Piano], [Catchy Chorus] 등.)
  • 자신이 만든 악곡은 mp3, wav, mp4 파일로 다운받을 수 있다.
    • wav 파일은 별도의 변환과정 처리중이라는 안내가 뜬 후에 다운로드가 진행된다.
    • mp3와 wav는 제목이나 커버 아트를 포함한 태그 메타데이터가 작성되어있지 않다. 필요하다면 별도로 직접 삽입해주는 과정이 필요하다.
    • mp4는 커버 아트, 제목, 장르, 가사가 적힌 512x768 크기의 동영상으로 나온다. 가사는 자동으로 넘어가지만 싱크가 안 맞을 수 있다. 커버 아트와 제목을 수정해도 첫 생성시점 기준으로 만들어지기에 필요하면 '동영상 재생성(Regenerate Video)' 기능을 사용해야 한다.
  • 오디오 인풋 기능으로 원하는 오디오 파일(6~120초)을 업로드하여 음악 생성에 쓸 수 있다. 단, 사용하기에 앞서 별도의 약관[5]에 동의해야 하며, 해당 오디오에 대한 저작권 검사도 진행한다. 또한 업로드한 오디오에 보컬이 감지된다면 공개 기능을 활성화할 수 없게 된다.

3. 요금제

기본적으로 무료 요금제인 베이직 플랜을 제공해주며, 유료 요금제는 프로 플랜과 프리미어 플랜 2가지가 있다.

프로 플랜은 월 10달러, 프리미어 플랜은 월 30달러이며, 연간 구독시 20% 할인 혜택을 준다. (각각 월 8/24달러)
  • 베이직 플랜 이용 시 하루에 50 크레딧(10곡)을 주며, 추가 충전은 할 수 없다.
  • 프로/프리미어 플랜 이용 시 다음과 같은 기능을 제공해준다. 업데이트로 프로/프리미어 전용 기능이 추가될 때도 있다.
    • 더 많은 크레딧 제공 및 추가 크레딧 충전 가능: 프로는 월 2500 크레딧(500곡), 프리미어는 월 10000 크레딧(2000곡)을 준다.
      • 추가 크레딧은 500 크레딧에 4달러이며, 4000크레딧 구입시 2달러가 할인된다.
      • 월간 크레딧을 전부 사용한 경우 다음 결제일 전까지는 베이직 플랜처럼 매일 50 크레딧을 지급해 준다.
    • 우선순위 생성 큐를 사용, 동시에 할 수 있는 작업이 2곡에서 10곡으로 증가[6]
    • 신규 기능 얼리 엑세스: 앞으로 업데이트할 예정인 기능을 먼저 이용해볼 수 있게 해줄 때도 있다.
      • Exclude Style: 원하지 않는 프롬프트를 입력하여 나오지 않게 할 수 있다.
      • Cover Song: 노래의 가사를 개사하는 기능을 이용할 수 있다.
      • Make Persona: 원하는 노래의 보컬을 추출해서 사용이 가능하다.
      • Replace Section: 구간을 정하여 해당 구간의 가사만 변경할 수 있다.
    • 커버 아트 커스텀: 원하는 이미지 파일을 업로드하거나 특정 단어를 입력하여 AI 그림을 다시 생성할 수 있다. 추가적으로 플레이리스트 폴더 그림과 프로필 사진도 동일한 방식으로 변경할 수 있게 된다.
    • 보컬/Inst 분리: 만들어진 악곡의 보컬과 반주를 분리할 수 있다. 다만 보컬 트랙을 따로 나누는 방식이 아닌 MR 제거와 같은 원리라서 그런지 때때로 불완전하게 나뉘어질 때도 있다.[7]
    • 상업적 이용 가능: 수익을 창출할 수 있는 모든 행위가 포함된다. 자세한 건 관련 FAQ, 이용약관 참조.

4. 사용처

4.1. Microsoft Copilot

Microsoft와의 협업을 통해 Microsoft Copilot에서 대화 형식으로 음악 생성이 가능해졌다. Microsoft Copilot에서 Suno AI 플러그인을 켠 후 "~한 느낌의 ○○장르의 느낌의 노래 만들어라"와 같이 입력하면 노래가 생성된다.

2024년 기준 하루 최대 5회까지만 생성이 가능하다.

4.2. Discord

Suno AI 웹앱이 개발되기 전부터 Discord에서 음악 생성이 가능했다. Suno AI 디스코드 가입 후 Generate 분류에 속해있는 아무 서버에나 들어가 원하는 노래를 입력하기만 하면 된다.

5. 사용 사례

파일:상세 내용 아이콘.svg   자세한 내용은 Suno/사용 사례 문서
번 문단을
부분을
참고하십시오.

6. 논란 및 사건 사고

6.1. 음원 무단 학습 소송 사건

2024년 6월 24일 유니버설 뮤직 그룹, 소니 뮤직 엔터테인먼트, 워너 레코드 등 미국 주요 음반사 그룹이 음악 생성 AI 스타트업 수노와 유디오를 상대로 소송을 제기했다. 음반사들은 수노와 유디오가 AI 모델을 훈련하기 위해 막대한 양의 자사 음반을 무단으로 사용했다고 주장했다. 이들은 "AI가 저작권이 있는 자료를 사용해 학습하면, AI가 생성한 음악이 인간 아티스트의 작품의 가치를 떨어뜨릴 수 있다"라고 문제를 제기했다.

이에 따라 학습에 사용된 곡 한개당 최대 15만 달러(약 2억 1,000만 원)의 법적 손해배상을 요구했다. 수노가 662곡을 복사했고 유디오가 1670곡을 복사, 손해배상 청구액은 최대 9,930만 달러(약 1,400억 원)와 2억 50,000만 달러(약 3,500억 원)에 달할 수 있게 되었다. 일부에서는 이번 소송 결과에 따라 음악 생성 모델을 만드는 데 사용되는 모든 음악 학습 데이터에 대한 라이선스를 기업에 요구하는 등 향후 창작 분야의 AI 개발에 큰 영향을 미칠 수 있다는 지적이 나왔다. #

7. 기타

  • 생성모델 자체는 한국어를 잘 구사하고 사이트도 공식적으로 한국어를 지원하긴 하는데, 사이트는 그냥 번역기를 어설프게 돌린 수준이라 체면치레 정도이다. dc app 단어를 그대로 읽어 '디캡'이라 출력되며, 버그를 정말 '벌레'라고 번역한다든지, 라이브러리를 '도서관'이라고 번역하는 등 퀄리티는 썩 좋지 않다.
  • 생성모델의 구조적 한계로, 가끔 원본 음원과 같은 음원을 생성하기도 한다.#


[1] 가사를 작성하지 않았거나 'Instrumental' 옵션을 켜고 생성했을 경우 기본적으로 새가 그려진 커버아트가 나온다. 가끔 손이 달린 새가 기타를 치고있는 약간 기괴한게 튀어나올 때도...[2] 가사를 충분히 작성해야 최대 길이에 가까운 곡 길이가 나온다. Custom 모드를 껐을 경우 얼마나 나올지는 랜덤이다.[3] 역시 10 크레딧에 2곡이 나온다.[4] Custom 모드에서 노래가사만 적어놓다보면 가끔 마무리는 커녕 뭔가 계속되려다 마는 듯한 결과물이 나올 때도 있는데, 가사를 쓸때부터 [Outro\]를 말미에 적어두거나, Extend로 [Outro\] 하나만 적어놓은 악곡을 이어붙이면 마무리 파트를 생성할 수 있다.[5] 올리고자 하는 콘텐츠(오디오)에 대해 모든 권리를 소유하고 있거나 독점적으로 통제할 수 있어야 하며, 만약 그럴 수 없는 콘텐츠임에도 업로드를 해서 문제가 발생할 경우 Suno와의 계약 파기는 물론 다양한 법적 책임을 지게 될 수 있다.[6] 노래 10개가 바로 생성된다는 의미가 아닌, 5회 분의 작업(2곡x5회)을 동시에 실행할 수 있다는 의미이다.[7] 특히 기계음이 섞인 보컬이 들어간 경우 잘 안될 확률이 크다. 보컬 쪽이 안나오거나 Inst 부분에 보컬 일부가 섞여 들어가는 등...