최근 수정 시각 : 2024-12-31 01:01:52

OpenAI o1


파일:나무위키+유도.png  
o1은(는) 여기로 연결됩니다.
사와노 히로유키의 앨범에 대한 내용은 o1(사와노 히로유키) 문서
번 문단을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
, 에 대한 내용은 문서
번 문단을
번 문단을
부분을
부분을
참고하십시오.
파일:OpenAI 로고.svg파일:OpenAI 로고 화이트.svg
{{{#!wiki style="margin:0 -10px -5px"
{{{#000,#fff {{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
{{{#000,#e5e5e5
제품군
<bgcolor=#000> 서비스 ChatGPT, OpenAI(인공지능)
모델 GPT-1, GPT-2, GPT-3(GPT-3.5), GPT-4(GPT-4 Turbo, GPT-4o, GPT-4o mini), GPT-5(개발 중)
o1(o1-preview, o1-mini, o1 pro mode), o3(o3-mini)
DALL·E, Codex, CLIP, Whisper, Voice Engine, Sora, SearchGPT
관련 인물
일론 머스크, 샘 올트먼, 미라 무라티, 일리야 수츠케버, 안드레 카파시, 그렉 브록만, 다리오 아모데이
관련 기업
마이크로소프트
}}}}}}}}}}}}}}} ||
생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
<colkeepall> 텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist · GPTRPG
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok · Xtion AI(액션 AI)
[[언어 모델|
언어모델
]] GPT-1 · GPT-2 · GPT-3 · GPT-4 · LLaMA · Gemma · Claude · Phi · Exaone · OpenELM
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly · Deep Dream Generator
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Luma Dream Machine · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오
소리
[[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA · SOUNDRAW · keeneat · Mix.audio · vio.dio
[[효과음|
효과음
]] OptimizerAI
멀티모달 모델 기반
대화형
+이미지
Exaone 3.0 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini · o1 · o3
+에이전트
Galaxy AI · Claude 3.5 Sonnet
행위
동작
[[지능형 에이전트|
에이전트
]] Apple Intelligence · Project Astra · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}

OpenAI o1
출시일 2024년 9월 12일
개발사 OpenAI
기능 추론 특화 멀티모달 모델
하드웨어 NVIDIA H100
라이선스 Proprietary Software
링크 파일:홈페이지 아이콘.svg

1. 개요2. 상세3. 모델
3.1. o1-mini3.2. o1-preview3.3. o13.4. o1 pro mode
4. 요금제5. 평가

[clearfix]

1. 개요

OpenAI가 개발한 추론형 멀티모달 모델. 코드명은 스트로베리였다.

2. 상세

반응하기 전 생각하는 데에 더 많은 시간을 할애하도록 설계되어 복잡한 작업을 논리적으로 추론하는 능력이 크게 향상되었다. 따라서 과학, 코딩, 수학 분야의 더 어려운 문제를 특히 더 잘 해결할 수 있다. 그 밖의 이공계 분야가 아닌 학문이나 취미 분야라도 논리적인 요소가 필요한 부분, 예를 들면 필요한 글의 핵심을 찾아서 정리하는 능력, 언어의 문법을 자료대로 탐구하는 부분이나 논리적인 언어 유희에 반응하는 능력, 주어진 자료를 고려한 게임 공략 도출의 능력까지도 크게 좋아졌고, 다른 부분도 비약적으로 향상되었다.

o1 시리즈는 물리학, 화학, 생물학 등 까다로운 벤치마크 과제에서 박사 과정 학생과 비슷한 수준을 보였으며, 국제 수학 올림피아드(IMO) 예선 시험에서 83%의 성적을 받아, 이전 모델인 'GPT-4o'의 13%를 크게 넘어섰다. 코딩 능력을 가리는 코드포스에서는 89번째 백분위에 올랐으며, 백준의 일부 다이아몬드 5 문제도 잘 풀이하는 모습을 보여주었다.

테스트-시간 계산(test-time computation)' 학습법을 도입했다. 이는 강화 학습(훈련 시간 컴퓨팅)이 더 많아지고 사고에 더 많은 시간을 할애할수록(테스트 시간 컴퓨팅) 지속적으로 향상된다는 개념이다.

또 '생각의 흐름(CoT)'을 사용해 생각하는 방법을 향상했다. 이에 따라 사용자가 별도의 프롬프트 엔지니어링을 사용하지 않아도, 모델이 스스로 문제를 분석할 수 있다.

3. 모델

3.1. o1-mini

GPT-4o때부터 생긴 o1의 경량화 모델이다. o1-preview에 비해 약 80% 저렴하며 코딩에 특화되어 있다. o1 시리즈 중에선 성능이 가장 후달리지만 이 모델 또한 GPT-4o에 비교해본다면 추론 능력이 훨씬 더 좋은 편이며, 논리나 수학적 사고가 요구되는 분야의 성능이 4o에 비해 크게 향상되었다. 추론 시간이 짧게 있는 대신 추론 후 출력 속도도 GPT-4o를 능가할 정도로 꽤 빠르다.

위의 preview와 함께 풀어본 수능 국어에서는 78점을 얻어 평가대상 중 2위를 차지했다, 다만 97점을 획득한 preview와는 19점 가까이 차이가 났다.

3.2. o1-preview

GPT-4o때부터 생긴 o1의 미리보기 모델이다. Competition Math에서 50점을, Competition Code에서 62점을, PhD-Level Science Question에서 74점을, Software Engineering에서 41.3점을 기록했다.

2024년 9월, 수능의 경우 수학 영역에서 확률과 통계를 택한 경우 원점수 92점으로 수학 1등급 94점에 근접한 점수가 나왔다.# 수능 국어는 백분위 97 정도로 1등급을 달성했다.#
일본 입시에서도 2024년도 도쿄대 이과 수학시험에서 55/120점을 기록하여 합격 커트라인을 달성하는 등#, 이전 AI들은 풀기 어려워했던 시험 문제들도 상당히 잘 푸는 모습을 보여주었다.

당시 기존의 어떤 AI 모델도 아이큐 100을 넘지 못했는데, 사상 최초로 인간 평균 아이큐인 100을 넘어선 120을 기록했다.#

3.3. o1

2024년 12월 06일 샌프란시스코 기준 시각 9시에 발표되었다. 프리뷰에 비해 응답 속도가 60% 빨라졌으며 오류는 34% 감소하였다.
Competition Math에서 78점을, Competition Code에서 89점을, PhD-Level Science Question에서 76점을, Software Engineering에서 48.9점을 기록했다.

3.4. o1 pro mode

기존의 o1에서 성능이 더욱 향상된 고급 모델이다.
추론 과정에 더 많은 시간과 컴퓨팅 자원을 할애하였으며 프로는 전문가들을 위한 연구기관 용으로 프로 요금제(월 200달러)만 사용이 가능하다.

4. 요금제

ChatGPT Plus(유료) 가입자들을 대상으로 우선 공개되었다.

5. 평가

기존 생성형 인공지능으로 해결이 어려웠던 논리적인 문제를 추론을 통해 돌파구를 마련했다는 평이 있다. 다만 작문 등 문학적인 부분의 답변 품질은 종전과 비슷하다.

한국에서는 preview 수준만 놓고 보아도 수능, 회계사 시험 문제, PSAT 등에서 종전 GPT 대비 성과가 매우 뛰어나다는 평이다. 문제를 이미지로 첨부하면 종종 풀린다.[1]이공계 학문을 중심으로 답변의 품질이 좋아졌다는 평이 있다. 특히 수능을 푸는 성능이 완벽은 아니어도 종전에 비해서는 상당히 좋아진 상황이라 이 속도로 인공지능의 성능 개선이 지속된다면 교육계에도 어떤 영향이 있을 것이라는 평도 있다.


[1] preview 버전에선 이미지 추가가 되지 않아 수식을 직접 LaTex로 변환을 해야 했으나 정식 버전 이후론 이미지 첨부가 가능해 굳이 변환을 하지 않아도 된다.