생성형 인공지능 | ||
{{{#!wiki style="margin:-0px -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all" | 텍스트 | [[소설| 소설 ]] NovelAI · AI Dungeon · AI 노벨리스트 |
대화형 | [[챗봇| 챗봇 ]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI | |
[[언어 모델| 언어모델 ]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · | ||
코드 | [[코드#컴퓨터 소프트웨어| 코드 ]] GitHub Copilot · Devin | |
그림/영상 | [[그림 인공지능| 그림 ]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · Gaugan2 · Dream by WOMBO · Adobe Firefly | |
[[영상| 영상 ]] Stable Video · Sora · Lumiere · Runway AI | ||
[[모델링| 모델링 ]] LATTE3D | ||
오디오/소리 | [[음성| 음성 ]] A.I.VOICE · DeepVocal · Voice Engine | |
[[음악| 음악 ]] Suno AI · Stable Audio · Udio · AIVA · SOUNDRAW · Mix.audio · vio.dio | ||
멀티모달 | [[멀티모달 모델| 멀티모달 ]] 삼성 가우스 · Gemini | |
행위/동작 | [[인공지능 로봇| 로봇 ]] Robot Operating Syetem(ROS) · Google RT-X · 피규어 01 · 프로젝트 그루트 | }}}}}}}}} |
스테이블 오디오 Stable Audio | |
<colbgcolor=#ddd,#010101> 분류 | 음악 생성 인공지능 |
개발사 | Stability AI |
출시일 | 1.0 2023년 9월 14일2.0 2024년 3월 3일 |
버전 | 2.0 |
라이선스 | Proprietary SW[1] |
링크 | | |
[clearfix]
1. 개요
Stability AI에서 개발한 음악 생성 인공지능. 최대 3분 길이의 음악을 생성할 수 있다.
2. 특징
텍스트를 입력하거나 오디오를 업로드 한 후 해당 오디오를 바탕으로 원하는 음악을 생성할 수 있다.트랜스포머 아키텍처와 잠재 확산 모델(LDM)을 적절히 조합하여 효율적으로 학습되었다.
[1] 2.0 모델 기준, 향후 오픈소스 모델도 공개될 예정이다.