인텔 코어 Ultra 시리즈/2세대

Intel® Core™ Ultra 시리즈 및 마이크로아키텍처
Optimization 최적화	Process · Optimization 공정 미세화 · 최적화	Process · Architecture 공정 미세화 · 마이크로아키텍처 변경
Intel 7	Intel 4 + TSMC N5 · N6	TSMC N3B · N6
인텔 코어 i 시리즈 참조	1세대 [L] ● Meteor Lake 메테오 레이크 (2023) ^{(Redwood Cove 레드우드 코브 + Crestmont 크레스트몬트)}	2세대 [L] ● Lunar Lake 루나 레이크 (2024) ^{(Lion Cove 라이언 코브 + Skymont 스카이몬트)}
Process · Architecture 공정 미세화 · 마이크로아키텍처 변경
TSMC N3B · N5 · N6	Intel 18A[A] + TSMC[A]
2세대 [D] ● Arrow Lake 애로우 레이크 (2024) ^{(Lion Cove 라이언 코브 + Skymont 스카이몬트)} 3세대 [D] ● Arrow Lake R 애로우 레이크 R (2025) ^{(Lion Cove 라이언 코브 + Skymont 스카이몬트)}	3세대 [L] ● Panther Lake 팬서 레이크 (2025) ^{(Panther Cove 팬서 코브(가칭) + Darkmont 다크몬트(가칭))}
사용 모델은 ●으로 표시
[ 각주 ] [L] 저전력 노트북 모델 한정[L] [A] 미확정[A] [D] 데스크톱/고전력 노트북 한정[D] [L]

1. 개요2. 공통3. 모바일 저전력용: 루나 레이크

3.1. 제품3.2. 성능 및 전성비 분석

3.2.1. CPU3.2.2. GPU3.2.3. 전력 소모 및 배터리 효율

3.3. 평가

3.3.1. 긍정적 평가3.3.2. 부정적 평가3.3.3. 복합적 평가

4. 데스크탑용: 애로우 레이크-S

4.1. 제품4.2. 성능 분석

4.2.1. 작업 및 AI4.2.2. 게임4.2.3. 오버클럭 마진, 온도 및 전력

4.3. 평가(애로우 레이크-S)

4.3.1. 긍정적 평가4.3.2. 부정적 평가4.3.3. 복합적 평가

4.4. 인텔의 성능 개선 공언4.5. 기타

5. 모바일 저·중·고전력용: 애로우 레이크-U/H/HX

5.1. 출시 전 정보5.2. 제품5.3. 상세

5.3.1. 작업 및 AI5.3.2. 게임5.3.3. 전력 소모 및 배터리 효율

5.4. 평가(애로우 레이크-H/HX)

5.4.1. 긍정적 평가5.4.2. 부정적 평가5.4.3. 복합적 평가

1. 개요

인텔 코어 Ultra 시리즈의 시리즈 2 CPU 버전이다.

데스크탑 코어 i 시리즈 네이밍의 연장선으로 인텔 15세대라고도 불린다.

코어 Ultra 시리즈 최초로 데스크탑 제품군 CPU 모델이 출시된다.[1]

2. 공통

코어 울트라 2세대는 대상 플랫폼에 따라 루나 레이크와 애로우 레이크로 나뉜다. 공통적으로 이 두 제품군은 같은 CPU 아키텍처인 라이언 코브와 스카이몬트 아키텍처가 들어가게 된다.

P-코어로 활용이 되는 라이언 코브 아키텍처는 명령어 디코더가 6-Wide 에서 8-Wide로 확장이 되며, 그 외에도 백엔드에 위치한 정수, 부동소숫점 등의 유닛이 확장이 되어 메테오 레이크에 탑재된 레드우드 코브에 비해 IPC +14%의 성능 향상폭을 가진다. 해당 아키텍처에 관한 자세한 설명은 다음 항목으로.

E-코어로 활용이 되는 스카이몬트 아키텍처는 명령어 디코더가 6-Wide에서 무려 9(3×3)-Wide로 확장되었으며[2] 비순차 처리 규모의 대폭 확장, 2배 가량의 백엔드 연산유닛 확장으로 인해 (기존 LP-E 코어와 비교 시) 정수 IPC +38%, 부동소숫점 IPC +68%라는 성능 향상을 이뤄냈다. 이는 13세대 인텔 CPU의 빅코어로 들어가던 랩터 코브와 비교시 정수, 부동소숫점 모두 +2% 향상된 수준의 IPC라고 한다. 해당 아키텍처에 관한 자세한 설명은 다음 항목으로.

하이퍼스레딩이 빠졌고, 스케줄러의 변경으로 E-코어 우선적인 작업 배분이 이뤄진다. SMT를 빼고 공간을 활용하여 높은 IPC를 구현하는 것이 현대의 CPU 설계 기조라서[3] 얼핏 보면 인텔이 최신 트렌드를 충실히 따라가는 것으로 보일지 모르나 이는 표면상의 이유일 뿐, 실제로는 기획 단계에서부터 의도하고 뺀 것이 아니라 개발 과정에서 문제가 생겨 뺀 것이라는 루머가 파다하다.

3. 모바일 저전력용: 루나 레이크

===# 출시 전 정보 #===
루나 레이크는 저전력 모바일용으로 설계된 제품군이다. 정격전력 8~17W[4]로, 메테오 레이크-U 라인업을 대체하는 것에 골자를 두고 있다.

CPU
CPU 면에서 봤을때 전작인 메테오 레이크-U와 비교하면 2개의 성능 코어 + 8개의 효율 코어 + 2개의 LPE 코어(12코어 14스레드)에서 4개의 성능 코어 + 4개의 효율 코어(8코어 8스레드)로 코어 수로만 비교하면 성능이 줄어든 것 처럼 보이는 착시효과가 존재한다. 그러나 실제 성능과 관련이 있는 성능 코어는 2개에서 4개로 증가했다는 점[5], 효율 코어의 개수는 절반으로 줄어들었으나 개별 코어의 IPC가 랩터 코브와 유사한 수준으로 늘어났다는 점[6], 그리고 인텔 메테오레이크의 LPE 코어는 아예 별도의 다이에 위치하여 idle 환경이 아니면 아예 켜지지도 않는다는 점을 감안하면 오히려 업그레이드 되었다는 평이 중론.

코어 수의 차이로 인해 AMD의 스트릭스 포인트나 6개의 P-코어를 탑재한 Core Ultra 7 1세대(28W)를 잡기는 어렵고, 대략적으로 AMD의 크라켄 포인트나 4개의 P-코어를 탑재한 Core Ultra 5 1세대(28W)와 유사한 멀티코어 성능을 가지며, 이 제품들이 경쟁 상대가 될 것으로 예상이 된다. 실제로 유출된 벤치마크 결과를 보면 Geekbench 6.2 기준으로 멀티코어 성능이 11400점인것으로 나오는 상황이다. 이 점수는 Core Ultra 5 1세대의 성능과 정확히 일치한다.

통합 메모리 구조와 E코어 아키텍처·공정 일신으로 인해 루나 레이크는 특히 극저전력 구간에서의 전성비를 크게 높이는데 성공했으며, 인텔은 루나 레이크가 ARM이 더 전성비가 좋다는 관념을 깨뜨릴 것을 자신하고 있다.[7]

인텔의 2024년 8월 Hot Chips 발표 자료에 따르면 P-LP(E) 코어 간 레이턴시 및 LP E 코어 클러스트 내 코어 간 레이턴시가 극적으로 개선되었다고 한다. [8]

GPU

내장 GPU는 베틀메이지 아키텍처 2세대 X^e 코어 8개가 들어간다.[9] 코어 1개당 들어가는 EU의 갯수가 알케미스트 기반 1세대 X^e 코어 대비 16개에서 8개로 감소했으나, 대신 1개의 EU당 들어있는 연산유닛의 수가 8개에서 16개로 늘어나 결과적으로는 동일한 체급이다. 하나의 FP32 연산유닛은 ADD + MUL 2 ops를 수행하므로 X^e2 코어는 한 사이클당 256 ops의 FP32 연산을 수행한다.

1024개의 SP는 전작인 메테오 레이크-H에 들어가는 8 X^e 코어와 동일한 수준이며, 메테오 레이크-U에 들어가는 4 X^e 코어 GPU에 비교하면 2배 가량의 성능향상폭을 가진다. 인텔 측에서는 전작 대비 50%의 성능 향상이 이뤄졌다고 주장하고 있지만, 실질적으로 GPU의 TOPS 수를 통해 클럭을 역산하면 최대 2.04GHz가 나오고[10], 이는 메테오 레이크-H보다 오히려 떨어지는 수준이다.

따라서 결론적으로는 최대 성능 자체는 8 X^e 코어가 들어간 메테오 레이크-H와 비교시 비슷하지만, 전력 소모를 비교하면 60fps로 3DMark를 구동 시 메테오 레이크는 25~29W를 소비하는 반면 루나 레이크는 같은 인터포저 상에 적층된 메모리까지 포함해서 14~18W를 소비한다고 한다. 인텔 측의 50% 성능 향상 또한 최대 성능 향상폭이 아닌 동일 전력대에서의 향상폭일 가능성이 매우 높다.[11]

그리고 실제로 유출된 Time Spy Graphic Score 또한 3000점대 후반의 점수를 보이며 메테오 레이크-H GPU의 1.5배가 아닌 소폭 향상에 그치는 모습을 보여주고 있다. 루나 레이크는 PL1 17W, PL2 30W의 스펙을 가지고 있으며, 제품의 컨셉상 기존의 U 라인업의 전력을 소모하며 H 라인업 급의 성능을 보여주는 것을 목표로 만들어진 CPU이기 때문에 최대 60W까지 집어먹는 메테오 레이크-H 라인업 대비 1.5배 수준의 성능 향상은 애초에 불가능했다.

전력효율은 충분히 상승한 셈이나, 스트릭스 포인트나 크라켄 포인트와 경쟁하며 핸드헬드 게이밍 PC에 활용되기 위해서는 3DMark 점수가 잘 나온 만큼 게임도 잘 돌릴 수 있어야 하는데, 게임 최적화가 얼마나 잘 진행될지에 관해서는 출시가 되어야 알 수 있을 듯 하다.

NPU
NPU는 인텔의 4세대 NPU가 탑재된다. Core Ultra 7 기준으로 6개의 타일이 들어가며, 각 타일은 8비트 정수 연산을 기준으로 2048 MAC per cycle을 수행하며 16비트 부동 소숫점 연산을 1024 MAC per cycle을 수행할 수 있는 512-Wide MAC Array가 탑재된다. 인텔측의 설명에 따르면 전작인 메테오레이크에 들어간 3세대 NPU에 비해 4배의 성능인 48TOPs의 성능을 낼 수 있다고 하며, CPU와 GPU 내의 XMX, 그리고 NPU를 모두 조합하면 총 120TOPs의 AI 연산 성능을 낼 수 있다고 홍보하고 있다.

생산공정 및 출시일정
일반적인 사용과는 별로 관련이 없는 NPU를 제외하면 가장 큰 변화가 있었던 부분은 생산공정 분야이다. 2개의 타일이 전량 TSMC 제로 주문이 되었으며 연산을 담당하는 파트의 다이는 TSMC의 3nm 공정인 N3B, 그리고 IO를 담당하는 다이는 TSMC N6으로 생산이 이뤄졌다. 전작인 메테오레이크의 CPU가 인텔 4, GPU가 TSMC N5였던 점을 감안하면 공정 면에서 일신이 이뤄진 셈이다.

루나 레이크의 출시가 지연된다는 루머가 있었으나, 인텔은 부인했다. 2024년 9월 3일에 공식 출시되는 것으로 확정되었다. 이로써 출시가 지연된다는 루머는 거짓인 것으로 드러났다.

3.1. 제품

자세한 내용은 인텔 코브 마이크로아키텍처/사용 모델 문서

의 루나 레이크 부분을

참고하십시오.

3.2. 성능 및 전성비 분석

루나 레이크의 CPU 성능 및 전성비는 ‘어떤 벤치마크로 분석을 했는지’, ‘어떤 웹진에서 측정했는지’, ‘싱글코어인지 멀티코어인지’, ‘실사용에서의 전력 효율은 어떠한지’에 따라서 평가가 크게 갈리는 상황이다.

Arc V140 GPU의 성능도 ‘벤치마크 기준인지 게임 기준인지’, ‘게임 성능은 누가 측정했는지’에 따라서 구도가 판이하게 나뉜다. 이에 본 문단에서는 신뢰할 수 있는 다양한 자료를 첨부하였으니 참조.

3.2.1. CPU

싱글코어 성능 및 전성비 [ 펼치기 · 접기 ]

||<width=50%>


루나 레이크 CPU 성능 지표

Core Ultra 7 258V의 시네벤치 2024 싱글코어 점수는 120점으로, 102점인 Core Ultra 7 155H와 113.6점인 Ryzen AI 9 370 HX를 모두 앞지르는 결과를 보여준다. Geekbench 6에서는 Core Ultra 9 185H 대비 우위, HX 370대비 열위로 조금 다른 양상을 보인다.

시네벤치 2024 멀티코어는 절전 모드 406점, 표준 모드 497점, 최대 성능 모드에서 602점의 성능을 보여주며 529점인 Ultra 7 165U 보다는 앞서지만 882점, 912점의 점수를 내는 Ultra 7 155H와 8840HS에 비해서는 더 낮다. Geekbench 6에서 역시 메테오레이크-U 대비는 우위, 메테오 레이크-H나 AMD의 8코어 라인업과 비교해서는 열세이다.


시네벤치 2024 기준 루나 레이크 CPU 전력 대비 효율

시네벤치 2024 싱글코어 기준 루나 레이크 P코어의 라이언 코브는 x86-64 계열 내에서는 최고의 전성비를 발휘한다. 시네벤치의 특성상 부동소숫점 연산을 주로 사용하며, 본 데이터는 단일 코어 피크치 전력을 기준으로 전성비를 산출했기 때문에 퀄컴의 ARM 기반 Oryon 에는 미치지 못한다. 아키텍처적인 발전과 TSMC N3B 공정이 효율 개선의 쌍두마차가 되었다.



SPEC 2017 기준 루나 레이크 CPU 성능 및 IPC

SPEC 2017 기준 라이언 코브의 IPC는 칩스 앤 치즈의 첫 번째 자료에 따르면 전작 레드우드 코브 대비 정수 연산 IPC 및 성능[12] +23.2%, 부동 소숫점 +15.8% 상승했으며, 두 번째 자료에 따르면 정수 연산 IPC는 12%, 부동 소숫점 IPC는 16% 향상되었다. SPEC 수치는 OS 환경, 메모리 구성에 따라 측정치가 달라질 수 있으며, 칩스 앤 치즈 측에 따르면 GCC 컴파일러의 최적화 옵션을 어떻게 설정하는가에 따라서 성능이 달라진다고 밝혔다.

칩스 앤 치즈 측의 자료에 따르면 Zen 5와 비교시 IPC는 우세, 클럭을 감안한 총 성능은 동등하며, 두 번째의 자료에 다르면 Zen 5와 비교시 IPC는 동등, 클럭을 감안하면 소폭 열세이다. 특이사항이라면 E 코어인 스카이몬트 아키텍처의 정수 연산 IPC가 Zen 4와 거의 비슷하며, 부동 소숫점 연산 IPC는 이전 세대의 P코어인 레드우드 코브와 거의 비슷하다는 점이다.

Geekerwan 측의 측정 자료에 제시된 IPC의 향상폭은 이전의 데이터와 비교하면 다소 보수적이다. Geekerwan 측에 따르면 라이언 코브의 IPC 향상 폭은 정수 +15.3%, 부동소숫점은 +4.6%에 불과하다. 그리고 스카이몬트의 IPC는 인텔의 공식 자료에 제시되었던 것 처럼 급격한 상승이 보여지지 않으며, Zen 4 보다도 더 낮은 IPC를 보인다고 한다.

Geekerwan의 영상에 따르면 원인은 루나 레이크의 E 코어가 L3에 직접적으로 접근할 수 없는 LPE 코어나 다름없기 때문이라고 설명하고 있다. 루나 레이크의 E 코어인 스카이몬트는 4개의 코어가 합해져 하나의 클러스터를 이루는데, 이 쿼드 코어 클러스터가 공유하는 L2 캐시의 용량이 4MB이다. 따라서 메모리 액세스 지연시간을 측정하면 4MB 까지는 P 코어와 E 코어간의 액세스 시간 차이가 얼마 나지 않으나, 4MB를 넘어가게 되면 L3에 접근하지 못해 SLC 캐시에 접근해야 하는 스카이몬트의 지연 시간이 최소 3배 이상으로 벌어진다. 이로 인해 스카이몬트의 성능이 제한되었다고 한다.

	파일:50ce4cef8ccf395163c898841a4e5f9d.jpg


루나 레이크 CPU 단일 코어 전성비 3, 4번째 자료는 SoC을 통한 전력 측정이 기준이며 5, 6번째 자료는 리눅스 기반 마더보드 전력 측정이 기준이다.

SPEC 2017 기준 코어 전성비는 P코어와 E코어 모두 메테오레이크 대비 대폭 향상되었다. 첫 번째로 제시된 데이터에 따르면 Zen 5와 비교하더라도 라이언 코브가 소폭 높으며, 전성비 격차가 점점 벌어진다. Zen 5c와 스카이몬트의 격차도 매우 큰 수준으로, E-코어 간의 전력효율 격차로 인해 인텔이 초저부하 및 Idle 환경에서의 우위를 가져가는 그림이다.

두 번째로 제시된 데이터는 퀄컴 측이 발표한 단일 코어 전성비 곡선이다. 퀄컴 측의 발표에 따르면 Oryon이 가장 전성비가 좋고 그 뒤로 라이언 코브, Zen 5, Zen 4, 레드우드 코브 순서로 전성비가 좋다고 발표했다.

3, 4번째로 제시된 데이터는 Geekerwan이 측정한 전성비 곡선인데, Geekerwan 측에 따르면 SPEC 2017 기준 정수, 부동소숫점 모두 라이언 코브가 자신이 동작하는 모든 전력 범위 내에서 Zen 5에 비해 큰 폭의 우위를 점한다. 3, 4번째 자료는 SoC을 통한 전력 측정이 기준이기 때문에 리눅스 기반 마더보드 전력 측정으로 데이터를 얻어낸 5, 6번째 자료에 비해 정확하지만 Oryon과의 비교 자료는 결여되어 있다는 점을 참고하자.

5, 6번째의 데이터는 리눅스 상에서 측정된 데이터이다. 퀄컴 스냅드래곤 X Elite에 내장된 Oryon과의 비교를 위해 4, 5번째의 데이터를 참고해야 하는데, 윈도우 상에서는 0.62W의 유휴전력을 보이는 루나 레이크는 리눅스 커널 상에는 완전한 최적화가 이뤄지지 않아서 3W를 소모한다. 이를 감안하고 보더라도 정수 연산의 경우 퀄컴의 Oryon과 비교시 모든 전력 범위 내에서 우위를 점하며, 부동 소숫점에 한해 7W를 넘어가는 고전력에서는 Oryon에게 추월을 허용한다. 리눅스에서의 전력 관리 문제가 조정된다면, 부동 소숫점에서 라이언 코브와 Oryon이 교차하는 지점이 뒤로 더 밀릴 수도 있다.[13]

멀티코어 성능 및 전성비 [ 펼치기 · 접기 ]

||||

멀티코어에서는 낮은 코어 수[14]와 하이퍼스레딩 부재로 인해 라이젠 AI 300 시리즈 대비 전성비가 떨어진다. Notebookcheck의 벤치마크 결과에 따르면 라이젠 대비 전 구간에서 밀리고, 루나레이크의 주력 전력대인 30W 미만에서 전 세대의 상위 체급인 Ultra 7 155H보다는 앞선다. 출처에 따라 전성비가 상이한 상황인데, 같은 시네벤치 2024도 결과가 출처별로 달라 추가적인 검증이 필요하다.



시네벤치 R23 기준 루나 레이크 CPU 전력 대비 효율

한 중화권 유튜버의 자료에 따르면 시네벤치 R23에서는 10W 이하 구간에서는 258V의 전성비가 가장 앞서나, 10W 초과 구간에서는 라이젠에게, 18W 초과 구간에서는 185H에 역전을 허용한다. 허나 또 다른 자료에서는 155H가 258V를 역전하는 시점이 24W 근처로 결과가 상이하다. 마지막으로 퀄컴 측의 자료에 따르면 10W 아래에서도 Zen 5가 들어간 스트릭스 포인트에 비해 밀리며, 155H가 258V를 역전하는 시점은 30W 근처인 것으로 측정이 되고 있다.

출처별 편차가 있긴 하지만 이상의 결과를 종합할 경우, 루나레이크는 10W 미만 구간에서 타 제품 대비 전성비 우위를 보이며, 10W 초과 구간에서는 라이젠에게, 18 ~ 30W 구간 사이 어딘가에서는 메테오레이크-H에게 역전을 허용한다고 볼 수 있다. 물론 루나레이크가 28W가 아닌 15W급의 대체제라는 것을 감안하면 중전력 구간에서 메테오레이크-H 대비 열위를 보이는 것은 그다지 의미를 부여하긴 힘들다.

CPU 실사용 성능 및 전성비 [ 펼치기 · 접기 ]

||||||

||||||



PCMark 기준 루나 레이크 CPU 전력소모

좌측 이미지의 PCMark 테스트 상에는 x86-64 계열 CPU 중 가장 전력효율이 뛰어난 모습을 보인다. AMD의 스트릭스 포인트 HX370, 그리고 이전 세대의 H 라인업 CPU인 Ultra 7 155H가 각각 평균 14W, 16W를 소모할 때 루나 레이크는 8.782W만을 소모했다. 오피스 환경에서의 전력효율이 우수하다는 사실은 우측 자료로 교차검증이 가능한데, 메테오 레이크가 12.5W를 소모할 때 루나 레이크는 3.6W를 소모하며 비슷한 성능을 낸다.

그리고 그 외에도 동일한 30W로 전력제한을 걸어두고 Office, 어도비, 다빈치 리졸브와 같은 작업 프로그램을 구동할 때에 루나 레이크가 Apple M3 11W에 버금가는 성능을 보여주었다.

실사용 시의 전력 효율이 높아진 이유는 고성능, 저전력의 E코어 덕택이다. 루나 레이크는 별도의 LP-E코어가 존재하지 않고 P코어와 E코어가 붙은 CPU타일만 있어 표면상으로는 LP-E코어가 포기된 것처럼 보이지만, 인텔에 따르면 둘이 합쳐진 것에 가깝다고 한다. 하나의 다이에 실장되어 있지만 각각의 전력공급 계통(파워레일)을 가지고 있어 P코어에는 전력이 차단된 상태로 E코어만 구동이 가능한 구조를 가지고 있다고. 하지만 P코어와 E코어가 CPU 타일에 하나로 붙어있기 때문에 코어간 버스를 통한 통신 레이턴시는 스트릭스 포인트처럼 그리 느리지는 않다.

3.2.2. GPU

3DMark 벤치마크 결과 [ 펼치기 · 접기 ]

||<width=50%> (3DMark Fire Strike(그래픽 스코어)) ||<width=50%>


루나 레이크 GPU API별 벤치마크 성능

3DMark Time Spy 기준 종합점수 4300점대, 그래픽 점수 4118점이라는 점수를 보여주며 GTX 1060에 준하는 수준으로 성능이 향상되었다. 동급의 x86 노트북용 내장그래픽 중 가장 높은 성능이다.

게임 성능 측정 결과 [ 펼치기 · 접기 ]

||<width=50%>

||<width=50%>

루나 레이크 GPU 실제 게임 성능

실사용환경에서는 각 게임과 자료출처에 따라 성능 우열 관계가 판이하게 다르다. 위의 자료에서는 루나 레이크의 Arc 140V가 스트릭스 포인트의 890M을 앞지르는 결과를 보여준다. Adreno X1과 비교시 2배의 격차를 벌린다.



네이티브 해상도 측정 결과. FSR 및 FG 적용 결과는 출처 링크 참고

톰스 하드웨어의 측정 결과는 윗 문단의 측정 결과와 비교하면 상대적으로 비관적이다. Black Myth: Wukong 720p 기준 Arc 140V는 메테오 레이크-H 의 Arc 8코어보다 11% 앞서지만, 라이젠의 890M에 비해서는 10% 뒤쳐진다. FSR3 + FG 적용시에는 Arc 140V가 오히려 가장 낮은 성능을 보이는데, 아직 Frame Generation 사용에 있어서 문제가 있는 것으로 보인다.

Cyberpunk 2077도 마찬가지로 Arc 140V는 메테오레이크-H 대비 32% 우위를 점하지만, 890M과 비교시에는 18% 쳐진다. FSR3/XeSS를 켜면 Arc 140V가 890M을 거의 따라 잡지만, FSR3 프레임 생성 기능을 키면 140V가 가장 저열한 것을 또다시 확인 가능하다.

Shadow of the Tomb Raider 720p에서 Arc 140V는 메테오레이크-H 대비 25%, 890M 대비 6% 우위를 점한다. 1080p에서도 메테오레이크-H 대비 21%, 890M대비 13% 앞선다. XeSS 품질 모드가 활성화된 상태에서는 25% 성능 우위를 점한다.

톰스하드웨어의 게임 벤치마크를 요약하면, 네이티브로 게임을 했을 때의 성능 기준에는 Arc 140V가 HX370의 890M에 비해 소폭 뒤쳐지고, FSR3나 XeSS를 켜면 Arc 140V이 890M과 거의 동일하지만, 프레임 생성 기능에서는 프레임 생성으로 인한 이점을 하나도 보지 못하는 상황이 보여진다는 것으로 요약할 수 있다.



네이티브 해상도 측정 결과. 27종 평균 성능, 각 게임의 성능은 출처 링크 참고

그러나 톰스하드웨어의 후속 벤치마크에 따르면 네이티브 해상도(720p, 1080p)에서 이전의 벤치마크보다 훨씬 많은 27종의 게임을 바탕으로 테스트한 결과 720p에서는 루나 레이크의 Arc 140V가 7% 앞서며, 1080p 해상도에서도 5% 앞서는 결과를 보여주었다.

해당 벤치마크는 AMD Radeon 890M, Arc 140V와 메테오 레이크의 Arc 1세대 8-Core GPU를 테스트한 결과이며 28W의 전력 제한이 걸린 결과이다. 전력 제한으로 인하여 AMD Radeon 890M 측의 클럭이 2032 MHz로 제한이 걸려 있다는 점을 감안해야 하지만, 적어도 30W대의 동일 전력에서는 890M보다 140V가 더 좋은 성능을 보여준다는게 확실해졌다. 물론 192 GB/s의 전용 메모리 대역폭을 가지고 더 많은 전력을 소모하는 RTX 3050Ti가 40~60% 더 앞서는 성능을 보여주지만, 인텔의 내장그래픽도 충분히 본궤도에 올랐다는 것을 의미한다.

AMD에서 공식적으로 발표한 벤치마크도 오히려 Arc 140V가 본궤도에 올랐음을 간접적으로 증명한다. FSR 및 프레임 생성을 통한 보간 기술을 활용하면 AMD Radeon 890M이 게임 성능 면에서 75% 우위를 가진다고 홍보하고 있지만, 네이티브 해상도 측정 결과를 보면 오히려 열세일 것이라고 예측되었던 Arc 140V가 AMD Radeon 890M와 백중세를 보이고 있다. 다만 앞선 벤치마크처럼 프레임 생성 기능에서는 프레임 생성으로 인한 이점을 하나도 보지 못하는 상황이 보여진다는 점은 보완이 필요할 것이다.

한편 또다른 게임 테스트에서는 Arc 140V가 30W 기준 Ryzen 9 AI 365의 880M에 비해 앞선다. 물론 880M은 30W를 넘어서는 전력을 인가받으면 성능이 계속 오르기 때문에 가용한 TDP를 모두 사용한다면 성능 우열은 다시 880M 측으로 역전될 것이다. 메테오레이크의 내장그래픽보다는 확실히 더 낫고, 스냅드래곤 X Elite의 Adreno X1과 비교시 X1보다 소모전력은 25%(10W) 나 더 낮으면서도 도타 2를 제외한 다른 게임에서는 2배 더 나은 성능을 보인다.[15]

그 외에도 Notebookcheck 측정 자료와 같이 Arc 140V가 8종 게임 종합성능, 게임 전력효율 면에서 큰 향상을 이뤄내 890M을 앞지른다는 벤치마크도 존재하며, 반대로 3, 4번째 자료처럼 루나 레이크의 Arc 140V가 HX370은 물론이고 이전 세대인 메테오 레이크-H 보다도 게임 성능이 뒤쳐진다고 평가하는 벤치마크 결과 또한 상존한다.



Jarrod, Geekerwan의 15W, 30W, 전력제한 해제 순

Jarrod's Tech의 측정 결과에 따르면 HX370 내의 Radeon 890M이 루나 레이크의 Arc 140V에 비해 게임 성능 측면에서 11.14%의 우위를 가진다. Core Ultra 7 258V보다 GPU의 클럭이 약 5% 높은 Core Ultra 9 288V를 들고 온다고 가정하더라도 열세 구도는 변하지 않는다.

그리고 Geekerwan의 자료에 따르면 15W, 30W로 전력 제한이 걸리는 상황에는 Arc 140V가 메테오 레이크 Core Ultra 9 185H, AI 9 HX370에 비해 큰 폭의 우위를 가져가지만, 전력 제한이 아예 해제하여 Core Ultra 9 185H의 GPU가 90W, AI 9 HX370의 GPU가 80W까지 인가하는 상황에는 기하평균 기준으로 루나 레이크가 55.3fps의 성능을 낼 때, 54.3fps의 성능을 내는 메테오 레이크한테 거의 따라잡히며, 61.1fps의 성능을 내는 스트릭스 포인트에는 추월을 허용한다.

GPU 전성비 측정 결과 [ 펼치기 · 접기 ]


루나 레이크 GPU 전력 대비 효율 그래프

전성비 관점에서 루나 레이크의 GPU인 Arc 140V는 비슷한 제품군에 속하는 다른 모든 iGPU를 앞지른다. 첫 번째 사진과 세 번째 사진은 각각 다른 출처에서 측정이 된 3DMark Time Spy 전성비 그래프이며, 네 번째 사진은 표기는 Time Spy라고 적혀있지만 이는 오타이며, 사이버펑크 2077 게임을 구동 했을 때의 GPU 전성비 그래프이다.

루나레이크의 내장그래픽은 TSMC N3B의 수혜를 받아 거대한 전성비 향상폭을 달성했으며, 17W급으로 기존 28W급의 성능을 능가한다는 개발목표를 충실히 달성했다.[16] 전력 대비 효율 그래프를 참고하면 3DMark와 같은 벤치마크 상에서는 무조건 HX370의 890M을 앞지르며, 게임 구동시에도 20W 극후반대 이하에서는 HX370의 890M를 소폭 상회하며 엎치락뒤치락 하는 성능을 보인다. 스냅드래곤을 상대로는 더블 스코어로 격차를 벌리며 2배 이상의 전성비 우위를 점한다.

가장 인상적인 점은 바로 드라이버로, 드라이버의 한계로 인해 벤치마크상에서 나타나던 성능 포텐을 실사용환경에 이끌어내지 못하는 문제에 큰 진전을 보였다는 것이다. 벤치점수와 실성능간의 괴리는 HD 내장그래픽 시절부터 인텔 GPU들을 고질적으로 괴롭히던 문제였는데, 루나레이크의 성능 지표는 인텔이 소위 말하는 '드라이버 리스크'를 극복해내기 시작했다는 신호로 볼 수 있다.

결과적으로 루나 레이크의 내장그래픽은 대성공이라고 볼 수 있으며, 향후 행보에 따라 인텔 GPU에 대한 이미지가 바뀌는 신호탄이 될 수도 있다.

3.2.3. 전력 소모 및 배터리 효율

기존 U, H 라인업과의 비교 [ 펼치기 · 접기 ]

||||||<width=50%>

||||||<width=50%>


U 라인업 CPU 전력 소모 지표

루나 레이크는 SKU 상으로 메테오 레이크-U 라인업을 계승한다. 이는 표기 상의 TDP와 전력 소모 지표를 보면 알 수 있다. 표기 상의 TDP를 보면 루나 레이크는 9 라인업을 제외하면 17W의 TDP를 가지는데 U 라인업의 TDP가 15W, H 라인업의 TDP가 28W라는 사실과, 2W 추가된 TDP가 같은 인터포저 상에 올라가 하나의 패키징으로 묶인 LPDDR DRAM 두 개를 포함한다는 사실을 감안하면 루나 레이크가 실질적으로 메테오 레이크-U를 계승했음을 알 수 있다. 그 이상의 라인업은 아랫 문단에 서술될 애로우 레이크가 담당할 것이다.

실제 노트북에 적용된 루나 레이크의 CPU 전력 제한은 최대 40W, 평균 30W에 걸려있다. 스펙시트 상으로 루나 레이크의 최대 전력 소모 한계인 PL2가 37W임을 감안하면, 스펙 시트 상의 전력 제한 한도를 따라가는 셈이다. 자료에 따라 상이하지만 독일 사이트인 Computerbase에 따르면 루나 레이크의 CPU 전력은 평균 30W, Notebookcheck에 따르면 53W를 소모한다. 전작인 메테오 레이크-U 라인업의 PL2가 57W로 걸려있고, 7840U도 비슷한 전력을 소모하는 것을 보면 루나 레이크의 CPU 전력 소모는 U 라인업에 훨씬 가까움을 알 수 있다.


H 라인업 CPU 전력 소모 지표

한편 인텔 및 AMD의 H 라인업이 소비하는 CPU 전력은 그 이상이다. 특히 인텔 메테오 레이크-H는 PL1이 최대 64W, PL2가 115W에 달하기 때문에 노트북 기종에 따라 다르지만, 쿨링 솔루션 및 자체적으로 걸어놓은 전력 제한 수치에 따라서 60W 근처 혹은 110W 근처에 수렴하는 경향성을 보이고 있다.



루나 레이크 GPU 전력 소모 지표(상단) U 라인업 및 H 라인업 GPU 전력 소모 지표(하단)

GPU에서도 마찬가지의 경향성이 보여진다. 루나 레이크의 Arc 140V는 30W에 제한이 걸려있으며, 실질적으로 그 이상의 전력을 인가한다고 성능이 증가하지도 않는다. 이는 U 라인업의 GPU 전력 소모와 일치한다. U 라인업의 GPU로 활용되었던 인텔 Arc 1세대 4코어 GPU는 루나 레이크의 Arc 140V와 마찬가지로 30W를 소모한다. 반면 H 라인업의 GPU로 활용되었던 인텔 Arc 1세대 8코어 GPU, Radeon 780M은 50W 혹은 그 이상을 소모했다. 이를 토대로 루나 레이크가 실질적으로 U 라인업 SKU에 속한다는 것을 알 수 있다.

배터리 사용시간 지표 [ 펼치기 · 접기 ]

||<width=50%>

||<width=50%>



루나 레이크 배터리 효율 지표

상대적으로 떨어지는 멀티코어 전성비로 인해 고부하 환경에서는 배터리타임이 별로이지만 실사용환경에서 더 자주 있는 저부하 ~ 극저부하 구간에서는 퀄컴 스냅드래곤 X Elite와 맞먹는 수준의 배터리타임을 보인다. 다만 맥북에어 13인치의 배터리가 53Wh이기 때문에 Apple M3에는 미치지 못한다. 한편 Notebookcheck의 측정 자료를 보면 Wi-Fi 환경에서의 웹 서핑 배터리 테스트 결과에서는 AMD의 HX370보다도 밀리는 면이 존재한다.

결과적으로 기존 인텔 노트북들에 비하면 배터리타임에서 장족을 이루었으며, 실사용환경에서는 퀄컴의 스냅드래곤과 비등한 수준의 배터리타임을 확보하는데 성공했다. 따라서 윈도우 환경에서 굳이 x86을 포기하고 ARM으로 넘어갈 필요가 없다는 사실을 보여주었다. 비슷한 배터리 사용시간이라면 가격은 비슷하면서 호환성은 떨어지는 퀄컴 스냅드래곤을 쓸 동기가 없기 때문이다.

3.3. 평가

3.3.1. 긍정적 평가

벤치마크에 따라 성능 우열 관계가 판이하게 나뉘긴 하지만 큰 틀에서 루나 레이크에 대해 요약해보면 대체로 긍정적이다.

개선된 싱글코어 성능 및 전성비
싱글코어 기준으로 봤을 때 라이언 코브와 스카이몬트 아키텍쳐는 다른 모든 기존의 x86 기반 CPU 아키텍쳐 대비 더 높은 성능을 훨씬 적은 전력을 소모하면서 낼 수 있고, ARM 명령어 셋을 처리하는 퀄컴 Oryon과 비교했을 때에도 정수 연산의 경우 모든 전력 범위 내에서 우위를 점하며, 부동 소숫점에 한해 7W를 넘어가는 고전력에서는 Oryon에게 추월을 허용한다.
이렇게 증가한 단일코어 효율을 통해 PCMark, UL Procyon Office 벤치마크 상에서 경쟁 제품과 비슷한 성능을 발휘하면서도 절반 혹은 그 이하의 전력을 소모한다. 그 외에도 Office, 어도비 포토샵, 다빈치 리졸브와 같은 작업용 소프트웨어에서 높은 효율성을 보였다. 만약 자신이 압축 프로그램이나 비디오 인코딩과 같이 병렬화가 높게 이뤄진 소프트웨어를 주로 구동하지 않고 어도비 포토샵[17]과 같이 제한된 수의 스레드만 활용하는 오피스 작업이나 간단한 게임, 그리고 오래 가는 배터리를 추구한다면 루나 레이크가 탑재된 노트북을 고려해 볼 만 하다.

인텔 Arc 내장 그래픽의 우수한 성능과 전성비

네이티브 해상도 측정 결과.
27종 평균 성능, 28W 전력 제한

AMD 측의 게임 성능 측정 결과.
업스케일링 및 보간 기술 적용

내장그래픽 역시 전성비와 드라이버가 대폭 개선되었다. 자료에 따라 우열 관계가 다르지만 이상의 자료를 최대한으로 취합해 보면 루나 레이크의 Arc 140V는 전작인 메테오 레이크에 비하면 거의 항상 우세인 구도를 차지한다.
게임 성능을 기준으로 구체적인 비교를 한 결과를 취합하면 다음과 같다. 루나 레이크의 Arc 140V는 30W로 제한이 걸려 있는데, 메테오 레이크의 Arc 1세대 GPU가 루나 레이크의 Arc 140V와 유사한 게임 성능을 내기 위해서는 90W까지 전력 제한을 해제해야 한다.[18] 그리고 퀄컴의 스냅드래곤 X 시리즈와 비교하면 모든 전력 구간에서 최대 2배 가량의 격차를 벌리며 압도적인 우위를 점한다.[19] 마지막으로 루나 레이크의 Arc 140V와 HX370의 Radeon 890M을 비교하면 두 GPU 모두 30W, 혹은 그 이하로 동일한 전력 제한을 걸어둔 상황에는 140V의 우위[20], Arc 140V에 30W를 인가한 채로 890M에 80W의 전력을 인가하면 Arc 측이 10% 가량 뒤쳐지는 열세 구도를 보인다고 정리할 수 있다.
따라서 그래픽 감속기로 대변되는 인텔 GPU의 기존 이미지에 대한 종말을 고했다. 다만 AMD측의 발표치에서 볼 수 있듯이 업스케일링과 프레임 생성을 통한 보간 기술을 쓰려면 890M측이 아직 우위를 점하고 있다. FSR3 + FG 환경에서의 나쁜 특성과 1% Low로 측정이 되는 스터터링 지표, 그리고 AAA급 게임이 아닌 마이너한 분야의 게임에서 최적화가 훨씬 나빠진다는 점은 앞으로 개선해야 할 과제이다.

개선된 NPU 성능
크게 주목받지는 않았지만 NPU성능 역시 경쟁사들과 동일한 수준으로 맞춰 Copilot+ 지원 요건을 충족하게 되었다.

배터리 사용시간 증대를 통한 ARM의 공세 저지
루나레이크는 'x86 프로세서가 ARM만큼 효율적일 수 없다'라는 편견을 깨기 위해 출시되었고, 결과적으로 높은 실사용 환경 전성비와 우수한 내장그래픽 성능으로 큰 틀에서의 개발 목적을 달성했다. 그 결과 스냅드래곤 X 시리즈를 앞세워 PC시장을 본격적으로 개척하려던 퀄컴의 공세를 무위로 돌리고 되려 관짝에 넣어 못질하는데 성공했다. 추가적으로 공개가 되고 있는 테크 리뷰어들의 리뷰 영상에 따르면 한 자릿수 대의 전력을 소모하는 저부하 환경에서는 루나 레이크가 배터리 사용시간 측면에서 스냅드래곤과 비교하더라도 별 차이가 안날 정도로 오래 간다. 반대로 많은 시스템 자원을 필요로 하는 환경에서는 스냅드래곤과의 거리가 멀어지고 Zen 5 계열 CPU와 유사한 배터리 사용시간으로 수렴한다는 단점 또한 가지고 있다. 종합적으로 배터리 사용시간 측면에서 아직까지는 스냅드래곤 X 시리즈가 소폭 우위를 점한다는 평이 다수이지만 그리 큰 차이는 아니며, 호환성 부분에서 손해를 생각하면 굳이 스냅드래곤을 구매할 필요성이 사라졌다. 다만, 후술할 생산비용 문제로 루나레이크는 일회성 프로젝트가 될 것으로 예상되며, 따라서 펫 겔싱어 CEO가 공언한 대로 후속 제품이 없다면 ARM의 공세를 지속적으로 막기 위해 다른 카드가 필요할 것이다.

3.3.2. 부정적 평가

다만 기술적인 관점에서 보자면 부정적인 측면도 있다.

투자 대비 저조한 성과
루나레이크는 마이크로아키텍처의 대대적인 체급 향상은 물론 통합 패키지 구조, TSMC 3 nm 공정 등 기존에 인텔이 해 오던 방식을 모두 버리고 사실상 전성비와 상품성만을 위해 사용 가능한 모든 카드를 꺼내들었으나, 막상 자/타사 기술 가리지 않고 모든 것을 총동원했음에도 압도하지 못하고 있다. 하이퍼스레딩까지 버린 라이언 코브는 AMD64 프로세서들이 기존에 사용하던 구조를 그대로 사용하고 하이퍼스레딩도 유지한 스트릭스 포인트의 젠5 일반 코어와 비교해 IPC가 별반 차이가 없다. 전성비 역시 기술적인 측면에서는 상당히 우려스러운데, 물론 Cinebench 2024, SPEC 2017 기준 단일코어 전성비는 타 x86 CPU 대비 충분히 높지만, ARM 명령어 세트를 사용하는 CPU까지 비교대상에 포함한다면 N3B 기반임에도 N4에서 제조된 스냅드래곤 X 시리즈 대비 코어별 전성비가 상황에 따라서는 오히려 밀리는 양상을 보인다. 동일한 N3B 공정에 한 세대 이전의 아키텍처를 사용한 Apple M3와 비교 시 코어 전성비는 구간에 따라서는 2배도 벌어지는 등 매우 암울한 형국이며, 실사용 환경 배터리 타임과는 별개로 ARM 대비 전성비 동급 내지 우위를 점했는지에 대해서 평가가 엇갈린다.

비싼 완제품 가격
이는 비단 루나 레이크에만 한정되는 문제점은 아니며 경쟁사인 AMD 스트릭스 포인트 탑재 노트북도 공통으로 지적받는 사항인데, 바로 AI 연산 기능과 온디바이스 AI를 지원하는 NPU 및 특화기능이 들어갔다는 이유로 최근 출시가 되는 노트북의 가격이 지나치게 높아지고 있다는 점이다. 너도나도 AI 노트북, AI 스마트폰이라 마케팅을 하며 제품 가격을 계속 올려 팔지만, 사실 100 TOPS 수준의 칩셋으로 돌리는 온디바이스 AI의 성능은 크게 의미가 있는 수치가 되지 못하는 상황이다.[21] 제대로 된 온디바이스 AI를 굴리려면 Nvidia GPU를 쓰거나, 온디바이스가 아닌 클라우드형 LLM 서비스를 사용해야 하는 상황임에도 각종 빅테크 기업들은 AI로 마케팅을 하며 노트북의 단가 상승 수단으로 쓰고 있다. ASUS Zenbook S14 기준 258V 32 GB RAM 모델의 국내 출시가가 219.9만 원인데, Zenbook 14 155H 32 GB RAM 탑재 모델의 국내 출시가 169.9만 원 대비 50만 원 가량 상승했으며 레노버도 비슷하게 출시하였다. 갤럭시 북5 Pro도 갤럭시 북4 Pro에 비해 유사 사양기준 대략 40~50만 원 정도 가격이 상승하였다.

소결
기존에도 각종 간접적인 정황들은 있었으나, 루나레이크는 Apple 외의 기업들과 비교해도 인텔의 마이크로아키텍처 설계능력 우위가 사라졌다라는 것을 완벽히 증명한 세대가 되었으며, 인텔이 증명해낸 것 이상으로 앞으로 증명해야 할 것이 더 많다는 숙제를 남겼다.

이러한 일이 발생한 이유로 꼽히는 것은 인텔은 주요 경쟁사 중 P코어의 기반 아키텍처가 가장 오래된[22] 편이라 한계에 봉착한 것으로 보는 분석이 있고, 인텔도 이를 인지하며 2026년 노바 레이크에 탑재 예정인 팬서 코브에서 AMD의 Zen과 같이 대대적인 아키텍처 재설계가 예정되어 있는데, 이를 통해 설계 능력을 증명해내지 못한다면 큰 위기에 직면할 것이다.

3.3.3. 복합적 평가

적은 코어 수에 따른 멀티코어 성능 약세
지금까지 제조사와 제품을 막론하고 프로세서의 코어 수는 세대가 지날수록 점차 증가했으나, 루나 레이크는 오히려 코어의 수가 줄어들었다. 전작 격인 메테오 레이크-U와 비교해도 P 코어의 수는 2개에서 4개로 증가했으나, 대신 E 코어는 8개에서 4개로 훨씬 줄어서 LP-E 코어를 제외해도 총 코어의 개수가 적어졌다. 게다가 P 코어의 하이퍼스레딩 지원이 빠졌기 때문에 총 스레드 수는 12코어 14스레드→8코어 8스레드로 더 줄어들었다.

멀티코어 전성비는 코어 수가 적은 CPU가 불리하다. 전력-성능 그래프는 보통 스윗 스팟을 넘기기 이전 지점에서는 선형적인 특성을 보이나 스윗 스팟을 넘기게 되면 지수적인 전력 소모 증가를 보이는데, 코어 수가 적은 CPU는 동일한 멀티코어 성능을 얻기 위해서 각 코어의 클럭을 훨씬 더 주어야 하므로 전성비 특성이 매우 악화된다.[23]

멀티코어 성능을 기준으로 구체적인 비교를 한 결과를 취합하면 다음과 같다. 루나 레이크의 8코어 CPU는 10W를 초과하는 거의 모든 구간에서 AMD HX370 대비 열세를 보인다. 그리고 메테오 레이크와 비교시 18W 구간 아래에는 우세를 보이나, 18~30 W 구간 사이에서는 각 IT 웹진의 테스트마다 우열이 갈리는 백중세를 보이며, 30 W 구간을 초월하면 절대열세를 보인다.

단일코어 자체의 성능과 효율은 크게 향상되었기 때문에 오피스와 같이 8 스레드 이하를 사용하는 일반적인 작업에서는 높은 성능을 보이면서도 효율도 좋지만 이런 점 때문에 성능의 한계가 명확하다. 전작인 메테오 레이크-U와 비교하면 더 나아졌다고 볼 수 있지만, 더 높은 SKU인 H 라인업들을 상대로 비교하면, Blender, 7-Zip과 같은 압축 프로그램, Handbrake와 같은 비디오 인코딩 벤치마크에서 멀티코어 성능의 약세로 인해 부족한 모습을 보이고 있는 상황이다.

물론 근본적으로 루나 레이크는 메테오 레이크-U 라인업을 계승하는 저전력 제품군이기 때문에 큰 단점으로 부각되지는 않는 상황이다. 더 높은 성능이 필요하다면 메테오 레이크-H 및 곧 출시될 애로우 레이크라는 선택지가 있기 때문. 하지만 만약 자신이 여러 개의 창을 동시에 띄워두면서 노트북을 사용하는 타입이거나 압축 프로그램이나 비디오 인코딩과 같이 병렬화가 높게 이뤄진 소프트웨어를 주로 구동한다면, 루나 레이크가 들어간 노트북을 후보로 두는 것에 대해 재고해 볼 필요가 있다.

CPU와 함께 패키징된 메모리
메모리가 인터포저 위에 적층된 구조이며 같은 인터포저에 프로세서 타일과 메모리를 수평으로 쌓아 올려서 하나의 패키징으로 묶은 형태이기 때문에 사용자가 메모리를 업그레이드하는 것이 불가능하다. 이로 인해 32 GB 단일인 Ultra 9를 제외하면 메모리 16 GB와 32 GB로 모델이 나뉘어 판매된다.
루나 레이크가 고성능 작업을 위한 제품은 아니기 때문에 주 이용 환경을 생각하면 메모리 16 GB도 별 문제가 되지 않을 가능성이 크지만, 몇 년 후에는 16 GB로 이용하는데 좀 답답해질 가능성은 있다. 물론 그 때는 메모리 뿐만 아니라 CPU 성능도 문제가 될 가능성이 크지만, 어쨌든 장기적인 관점에서 16 GB를 선택해야 할지 32 GB를 선택해야 할지 고민의 대상이 하나 더 늘어난 것은 사실이다. 당연히 전작인 메테오 레이크에서 지원하는 64 GB의 메모리로의 업그레이드는 불가능하다.

하지만 CPU와 램 간의 거리가 가까워졌다는 점, 그리고 최대 6400 MHz를 지원하는 기존의 DDR5보다 더 빠른 8533 MHz를 지원하면서도 전력을 덜 소모하는 LPDDR5X를 장착했다는 점은 장점이다.

4. 데스크탑용: 애로우 레이크-S

===# 출시 전 정보 #===
정격 전력 최대 125W로, 메테오 레이크-H, 랩터레이크-HX, 랩터레이크-S를 대체하는 것에 골자를 두고 있다.

CPU
CPU는 루나 레이크와 동일한 라이언 코브 아키텍처와 스카이몬트 아키텍처를 각각 P-코어와 E-코어로 활용한다.

애로우 레이크에서 CPU-Z 벤치마크를 수행한 결과, 단일 스레드에서 i9-14900KS보다 무려 20% 향상된 성능을 보였다는 루머가 있다. 모델명은 알 수 없으나, 멀티 스레드 성능을 근거로 추정하면 기존 인텔 코어 i의 i5에 해당하는 Core Ultra 5일 가능성이 높다고 한다. 다만, 아직 정식 출시 전이기 때문에 실제 결과인지는 알 수 없다.

애로우 레이크-S용 GPU

GPU
데스크탑용 애로우 레이크-S에 탑재되는 iGPU는 Xe2 코어를 탑재한 루나 레이크와는 다르게 전 세대인 메테오레이크-U의 GPU 타일을 공정만 N5에서 N5P로 바꾼 채로 재활용한다.[24] 메테오 레이크-U와 동일한 Xe1 4코어 구성을 가지고 있다.

NPU
NPU는 인텔의 3세대 NPU가 탑재된다. 루나 레이크의 NPU 4보다는 더 낮은 성능을 가지고 있으나 Zen 5를 포함한 데스크탑용 CPU중에서는 가장 높은 13TOPS의 정수 8비트 연산 성능을 가진다. 데스크탑용 애로우 레이크-S에는 13TOPS의 NPU와 각각 15, 8TOPS의 CPU, GPU AI 연산 성능을 합하여 최대 36TOPS의 연산 성능을 가진다.

생산 공정 및 출시 일정
원래 인텔 20A 공정이 주력이 될 예정이었으나, 어느 순간 슬금슬금 20A의 비중이 줄어들기 시작해, 나중에 가서는 U5 이하 라인 일부 SKU의 CPU 타일만 20A를 사용한다는 소식이 나왔고, 그러다가 2024년 9월, 인텔은 비용 문제를 이유로 20A의 양산을 취소한다고 발표했다. 결국 애로우 레이크는 전량 TSMC 공정으로 나오게 되었다. 베이스 타일이 인텔 22FFL, CPU 타일 N3B, GPU 타일 N5, SoC 타일 N6로 알려졌다.

4.1. 제품

자세한 내용은 인텔 코브 마이크로아키텍처/사용 모델 문서

의 애로우 레이크 부분을

참고하십시오.

4.2. 성능 분석

4.2.1. 작업 및 AI

애로우 레이크-S CPU 벤치 성능 [ 펼치기 · 접기 ]

* 퀘이사존 벤치마크



Cinebench, Geekbench 기준 애로우 레이크-S CPU 성능

IPC의 큰 상승이 있을 것이라는 예측도 있었으나, 인텔 발표에서도 IPC 상승은 9%에 불과한데다가 클럭이 내려갔기 때문에 시네벤치 싱글 점수에서는 인텔 14세대 대비 +4~7%의 향상폭을 보이며 드라마틱한 상승은 보이지 않았다. 오히려 하이퍼 스레딩을 빼서 약할 것이라던 멀티 성능에서 10~13% 상승이 있었는데, 이는 하이퍼 스레딩으로 얻을 수 있는 성능이 그리 큰 편은 아닌데다가, E-코어로 탑재된 스카이몬트 아키텍쳐가 루나 레이크와는 다르게 L3 캐시가 탑재된 덕분에 DRAM까지 접근해야 하는 Cache Miss 발생확률이 감소하여 IPC가 예상보다 크게 향상되었기 때문이다.

파일:英特尔酷睿Ultra 200S评测：无药可救！_20241118_040921.691.jpg

E-코어로 탑재된 스카이몬트 아키텍쳐의 성능은 인상적이다. 물론 인텔의 발표치처럼 정수 IPC +32%, 부동 소숫점 IPC +72%를 달성하지는 못했으나, L3 캐시가 탑재된 스카이몬트의 IPC는 정수 기준으로 +21.6%, 부동 소숫점 기준으로는 +42.1%의 향상을 보이며 인텔이 목표로 제시했던 인텔 14세대의 P-코어인 랩터 코브에 필적하는 IPC를 가졌다는 사실을 증명하였다.

애로우 레이크-S CPU 작업 성능 [ 펼치기 · 접기 ]

* 탐스하드웨어 작업 벤치



작업 기준 애로우 레이크-S CPU 성능

그러나 Cinebench, Geekbench 기준으로 늘어난 멀티코어 성능이 무색하게도 여러 요인들로 인하여 몇몇 작업에서의 성능의 발목을 잡고 있다는 점이 아쉬운 부분이다. 여러 가지의 제약이 걸리기 때문에 작업 성능이 뛰어난 부분도 그 영역이 좁다.#

첫 번째 제약은 L3 캐시 내에서 주고받는 데이터의 레이턴시가 늘어났다는 점이다.# David Huang의 주장에 따르면 Cinebench와 Geekbench는 대부분 L2 캐시 내에서 실행되지만, SPEC으로 측정할 수 있는 성능은 전반적으로 캐시와 메모리에 훨씬 더 민감하기 때문에 치명적이라고 한다. 실제로 루나 레이크와 랩터 레이크의 L3 캐쉬 간 데이터 주고 받는 레이턴시는 약 55 사이클인 반면, 애로우 레이크(265K)는 약 73 사이클, 메테오 레이크(155H)는 80 사이클이라고 한다. 이는 성능에 큰 걸림돌이 된다. 이전 세대에 비해 링 클럭이 후퇴한 것이 L3 캐시 레이턴시 사이클 증가의 원인이라고 한다. 코어 클럭과 링 클럭 사이의 차이가 이전 세대보다 훨씬 더 크게 벌어졌으며, 이 문제점은 비교적 일반적인 코어 배치 레이아웃을 가지는 메테오 레이크 또한 공유하고 있다고 한다. 이 약점은 추후에 바이오스나 마이크로코드 수정으로도 개선할 수 없는 하드웨어적인 약점이라는 성격이 있다. 이러한 제약으로 인하여 Task 방식으로, 코어 하나가 자기 일만 하고, 메모리도 자기것만 쓰고 끝마친 다음, 다른 Task가 생기는 형태여야 제 성능을 발휘할 수 있다.

두 번째 제약은 AVX512의 부재라는 점이다. 연산이 많더라도 AVX2, FMA3(256bit 레지스터) 수준의 연산이어야 하고, 512비트 레지스터까지 풀로 쓰는 작업이면 Zen 5 계열보다 앞서기는 쉽지 않다.

파일:英特尔酷睿Ultra 200S评测：无药可救！_20241118_041304.907.jpg

세 번째 제약은 메모리 읽기 쓰기가 너무 많이 이뤄지면 안된다는 점이다. 이는 게임 성능 측면에서도 공통적으로 공유하는 단점이다. 메모리 컨트롤러를 별도의 SoC 타일로 옮겼는데 이로 인하여 CPU가 DRAM에 데이터를 받아오기 위해서는 물리적으로 SoC 타일을 무조건 경유해야 한다. 따라서 랩터 레이크와 비교하여 DRAM으로 접근하는 레이턴시가 크게 늘어났다고 한다. Geekerwan 측의 영상에 따르면 칩렛 구조 자체가 상대적으로 별로여서 CPU 클럭을 오버클럭 하거나 램 클럭을 오버클럭하고 램 타이밍을 조절하는 것보다는 캐시 버스의 클럭을 높이고 타일 모듈간의 통신을 담당하는 NGU와 D2D 클럭을 오버클럭 하는 것이 더 큰 효과를 본다고 한다. 그러나 그렇게 클럭을 높여도 인텔 14세대보다 레이턴시가 늘어지며 이 문제를 완전히 극복하기는 쉽지 않다.

이로 인하여 코어 자체의 성능과는 별개로 언코어 부분에서 걸리는 여러 제약들로 인해 테크파워업의 작업성능 그래프에 나타난 것처럼 작업에 따라 애로우 레이크-S의 성능 편차가 심하게 나뉜다. 특히 멀티코어를 활용하면서 L3 캐시를 통해 코어간의 데이터를 주고받거나 혹은 DRAM까지 데이터를 찾아 불러와야 할 때 불리해진다. 구체적으로는 영상 인코딩과 시네벤치로 대표되는 렌더링 관련이나 퀵싱크를 활용한 작업은 높은 성능을 내지만, 그 외에는 동률이거나 낮은 성능을 내는 추세를 보이고 있다. 가장 의외로 받아 들여지는 점은 인텔의 텃밭이던 어도비 포토샵에서조차 라이젠 9000 시리즈에 크게 밀리는 결과를 보여준 점이다.

인텔은 모바일 라인업에서 메테오 레이크에서 같은 문제를 범하고 나서 그 문제를 인지하고 루나 레이크에서는 수정했지만, 데스크탑 라인업에서는 루나 레이크보다 나중에 나온 애로우 레이크에서 그 점을 수정하지 않고 강행해서 출시했다. 이는 원래의 로드맵을 보면 알 수 있는데, 원래는 애로우 레이크-S보다 루나 레이크가 더 나중의 세대였으며, 인텔 18A 공정을 통해 생산될 인텔 16세대로 분류되어 있었다. 따라서 루나레이크는 더 새로운 버전의 라이언 코브 코어를 탑재하고 있으며, SoC의 많은 IP 블록도 업데이트 되었다고 한다.

4.2.2. 게임

애로우 레이크-S 외장 그래픽 성능 [ 펼치기 · 접기 ]

* 퀘이사존 벤치마크
외장 그래픽을 사용한 게이밍 측면에서는 전작을 한참 상회하던 경쟁사의 게임 특화 모델 X3D시리즈의 전세대 라인업인 7800X3D에게 285K는 아예 논외가 되어 비교 대상에서부터 제외되고 있으며, 이젠 2세대 전의 라인업인 5800X3D에도 열위를 보이는 부분이 있다는 점[25][26]에서 게이밍 분야에선 추락할 대로 끝까지 추락했다.


CPU / GPU 병목 테스트

Notebookcheck 측의 리뷰는 훨씬 극단적이다. 물론 이쪽은 더 극단적인 조건을 걸고 진행된 벤치마크이다. 전자는 CPU 병목 상태에서의 성능을 알아보기 위해 720p 최하옵으로 구동한 결과이고, 후자는 GPU를 한계까지 활용하기 위해 2160p 해상도에 최고 옵션을 걸어놓고 게임을 구동한 결과이다. 물론 극단적인 환경을 가정했다고 하지만 전자에서 Core Ultra 5 245K에 비해 Core i5-14600K는 20% 앞서며, 7800X3D는 아예 50%의 게임 성능 격차를 벌린다. 가성비 픽, 전성비 픽이 되었어야 할 Ultra 5가 실제로는 3세대 이전 i7-12700 non-K와 비교가 되는 셈이다. 후자의 환경에서는 CPU 성능 격차로 인한 차이점이 다소 희석되었으나, 그럼에도 불구하고 최대 12%의 성능 격차가 관측된다.

급감한 게임 성능 또한 코어 간 레이턴시 증가가 원인으로 지목이 되고 있다. P코어나 E코어를 비활성화 시키고 사용하는게 더 나을 수준이라는 벤치마크 결과로 인해 P코어 - E코어 - P 코어 - E코어 순으로 배치된 CPU 코어 타일 배치가 그 원인이라는 가설 또한 제시되었다. 이는 열을 많이 뿜어내는 P코어 주변에 열을 덜 뿜는 E코어라는 열 배출이 쉬운 공간을 둘수 있어서 발열 관리가 좋아진다는 설계 의도로 보인다. 실제로 애로우 레이크는 온도 관련으로는 역대급이라는 긍정적인 평가를 받고 있다. 그러나, 이런 설계로 인해 코어들 끼리 링버스로 데이터를 주고 받는데, 이 P코어 E코어 배치에 띄엄띄엄 걸려버리는 바람에 큰 지장이 생기고, 이는 곧 레이턴시 증가를 초래했다는 주장이다.# 그 레이턴시 증가가 게임 프레임 같은데서 상당한 문제를 일으킨 것이다.

이 부분에 대해 증명하기 위해 아예 코어들을 비활성화 해서 P코어끼리, 또는 E코어만 활성화 해서 사용하거나, 아니면 최대한 P-E 코어를 번갈아서 데이터가 이동하는 경계를 최소화 하는 방향으로 지그재그로 비활성화 한다는 여러 시나리오로 테스트를 시행한 영상이 공개되었다.# 그 결과는 다음과 같다.

일단 첫 번째로, P코어 E코어 상관없이 게임에서 활용하는 스레드는 최대한 확보해야 성능이 제대로 발휘된다. 영상 내의 사이버 펑크 2077의 경우는 14 스레드까지 활용하는 것으로 추정되며, 12코어 이하가 활성화 되면 상당한 성능 하락이 관측된다.

두 번째로, P코어와 E코어의 경계를 통과하는 횟수를 최대한 줄여야 성능이 그나마 개선된다.

마지막으로, 상부 기점에서 물리적으로 최대한 가까운 코어들을 켜야 한다는 점이다. 중간에 E코어가 있든 없든 SoC 타일로부터 멀리 있는 코어를 끄는 것이 약간이라도 성능 개선에 도움이 된다.

이런 방식으로 대조 실험을 한 결과 최적의 조합을 맞추어 보니 최대 6%에 가까운 프레임 개선이 있었다는 결론이었다. 물론 이 정도의 개선 가지고는 전세대나 경쟁사에 비해서 어림도 없는 수준이다. 게다가 각자가 하는 게임마다 스레드 활용 갯수를 다 미리 파악해서 일일이 바이오스에서 최적의 코어 파킹을 해주고, 게임을 종료하면 리부팅해서 다시 되돌리는 작업을 해야 하는 등등 매우 번거로운 일들이 수반되기 때문에, 일반 게임 유저들에게 선뜻 권할 만한 방식도 아니다.

한편으로는 비교적 일반적인 코어 배치 레이아웃을 가지는 메테오 레이크 또한 이 문제를 공유하고 있기 때문에 L3 레이턴시 증가의 원인은 코어 배치 레이아웃이 아니라는 David Huang의 주장 또한 공존하는 상태이다. Geekerwan 측의 영상에 따르면 그냥 복합적으로 총체적인 난국이라고 한다. 어느 쪽이 맞든 이 약점은 추후에 바이오스나 마이크로코드 수정으로도 개선할 수 없는 물리적인 약점이라는 성격이 있다.

애로우 레이크-S 내장 그래픽 성능 [ 펼치기 · 접기 ]

* 내장 그래픽 벤치마크


애로우 레이크-S용 GPU / 애로우 레이크-H용 GPU

한편 내장 그래픽 측면에서는 발전이 있었다고 한다. Techpowerup의 내장 그래픽 벤치마크에 따르면 이전 세대인 인텔 14세대와 RDNA2 2CU 구성인 라이젠 9000 시리즈와 비교했을 때 약 2배의 성능 격차를 보이며, 경우에 따라서는 RDNA 3 4CU으로 구성되어 8500G에 탑재된 AMD Radeon™ 740M을 넘기는 성능을 보여주기도 했다.

이는 전 세대인 메테오레이크-U의 GPU 타일을 공정만 N5에서 N5P로 바꾼 채로 재활용한 덕분이다. 보통 같은 세대의 CPU라면 데스크탑용 내장 그래픽은 타임 스파이 최대 900점 수준의 화면 표시기를 넣어주지만 노트북용에 들어가는 내장 그래픽의 구성은 더 크게 챙겨주기 때문이다. 이 때문에 내장 그래픽 설계를 그대로 우렸음에도 불구하고 전작인 인텔 14세대나 RDNA 2 정도나 넣는 라이젠 9000 시리즈의 내장 그래픽에 비해 2배 이상의 우위를 가지는 것이다.

요약하자면 DX12 게임 성능을 기준으로 Radeon 780M, 메테오 레이크-H 및 애로우 레이크-H에 탑재되는 Arc 1세대 8코어 GPU는 GTX 1050Ti ~ GTX 1650 사이의 성능을 내며, Time Spy 기준으로는 약 3천점대의 점수를 낸다. 게임 성능을 기준으로 삼으면 Arc 1세대 8코어 GPU 측이 소폭 열세이다.

8500G에 탑재되는 Radeon 740M과 메테오 레이크-U 및 애로우 레이크-S에 탑재되는 Arc 1세대 4코어 GPU는 780M의 60% 정도의 수준의 게임 성능을 내며 Time Spy 기준으로는 2천점을 넘길듯 말듯한 점수를 낸다. 게임을 기준으로 삼았을 때는 대략 GTX 1630보다 한 티어 낮은 성능을 낸다고 보면 된다.[27]

마지막으로 데스크탑용 인텔 14세대에 내장되었던 UHD Graphics 770과 그 경쟁자인 RDNA2 2CU GPU는 Radeon 740M이나 Arc 4코어 GPU 대비 절반 이하의 성능을 낸다. Time Spy 기준으로는 900점 가량의 점수를 낸다.

4.2.3. 오버클럭 마진, 온도 및 전력

애로우 레이크-S 전력 [ 펼치기 · 접기 ]

* 퀘이사존 벤치마크
애로우 레이크-S의 전성비는 이전 세대인 인텔 14세대에 비하면 크게 늘어났다. 그러나 인텔 14세대는 6GHz를 넘기는 차력쇼를 하며 전성비가 극히 악화된 제품이기 때문에 경쟁사의 제품들과 비교해야 전성비가 어느 정도 레벨인지 가늠해 볼 수 있다.

문제는 AMD의 ZEN 5와 비교했을 때는 아직 떨어지는 편이라는 점이다.테크파워업 전성비 그래프 링크 탐스하드웨어 전성비 그래프 링크 ZEN 4의 Non-X나 X3D 라인업보다도 떨어지는데 ZEN 5도 이쪽에는 한참 못미치므로 논외.[28] 국내에서도 신성조가 방송으로 그 점을 피력했다. 영상 링크 스샷 링크

David Huang의 측정 결과에 따르면#, 애로우 레이크-S의 최후의 보루라고 여겨져 왔던 단일코어 전성비 곡선마저 Zen 5는 물론이고 Zen 4보다도 저열한 전력 효율을 보인다. 측정 결과는 SPECint 2017 버전으로 진행되었으며, 코어 + 캐시 + 링 전력을 측정한 결과이다. 다른 출처에 따르면, 루나 레이크의 라이언 코브는 실질적으로는 LNC+에 해당이 되며 세부 사항은 불명이나 애로우 레이크의 LNC와는 다른 링 구조를 가지고 있다고 한다.# 이 말이 사실이라면 애로우 레이크의 단일코어 전성비가 부진한 원인은 LNC+ 보다 저열한 LNC의 언코어 설계라고도 볼 수 있다. 윗 문단에 언급된 원래는 애로우 레이크-S보다 루나 레이크가 더 나중의 세대였다는 사실 또한 이를 간접적으로 드러낸다.

파일:英特尔酷睿Ultra 200S评测：无药可救！_20241118_041038.307.jpg

Geekerwan 측의 측정 결과에 따르면 멀티코어 전성비 곡선은 200W 이하에서 절대적인 우위를 가지며, 200W를 초과하는 구간에는 Ryzen 9950X보다 밀리는 전성비를 보여준다고 한다. 이러한 특성때문에 Geekerwan 측에서는 애로우 레이크-S 보다는 애로우 레이크-H가 더 기대할 만 하다고 한다. 전성비도 더 우수할 것이며, 코어간의 레이턴시가 높다는 단점도 스트릭스 포인트가 그보다도 더 높은 레이턴시를 보이기 때문에 문제가 상쇄되는 셈이다.

애로우 레이크-S 오버클럭 특성 [ 펼치기 · 접기 ]

* 애로우 레이크-S의 전압/클럭 특성

애로우 레이크-S의 오버클럭 특성은 좋지 못하다. 55배수까진 클럭/전압비가 완만하게 늘어나는데, 그 이상으로 넘어가면 전압이 급증하기 때문이다. 현대의 CMOS는 기생 Capacitance가 존재하며 이로 인하여 RC delay가 존재한다. RC delay를 극복하고 CMOS에 더 빠른 동작을 시키기 위해서는 전압을 높일 필요성이 있지만, 이로 인하여 전력의 소모 또한 전압의 제곱 × 늘어난 클럭에 비례하여 증가하게 된다. 따라서 실질적으로 250W의 전력 한도 내에 사용할 수 있는 선택지는 57배수가 되며, 55배수 이상부터는 소위 말하는 차력쇼 구간에 접어들게 된다는 것이다. 인텔이 60배수까지 클럭을 높이지 않았던 이유는 이와 같았던 것으로 보인다. 전압 특성을 보면 60배수를 하려고 해도 못했을 수치를 보여주고 있다.

이러한 실패의 원인으로는 변화한 CPU 아키텍처와 제조공정 모두가 원인으로 지목되고 있다. CPU 아키텍처는 타사의 기조에 따라 비대화 되었는데, 이는 고클럭을 달성하는데 장애물이 된다. CMOS 배치를 조밀하게 설계해야 그만큼 기생 Capacitance도 적고, 클럭을 올리기 용이한데 인텔의 라이언 코브는 정 반대의 사상을 가지고 설계되었다. 물론 오버클럭이나 60배수 이상의 환경을 상정하지 않는다면 바뀐 방향성이 더 낫긴 하지만 오버클럭의 면으로만 봤을때는 악영향을 끼쳤다는 것이 중론.

공정 역시 상당한 하자가 있다. TSMC 3nm는 비록 전성비는 우수하지만, FinFET 기반 3nm라는 점 때문에 클럭 측면에서는 한계가 명확한 공정이다. 특히 N3B는 PPA 3요소 중 Area(면적)에 지나치게 올인했다가 수율이 저조해지는 바람에 Performance(성능)와 Power(전력)의 향상분을 상당 부분 토해내게 되었고, 따라서 N4P 대비 향상폭도 신통치 못하게 되어버렸다. 결과적으로 웨이퍼 단가만 폭증하고 성과물은 저조해 실패한 공정이라는 평가를 받고 있다.

저전력에서의 전성비는 상대적으로 낮은 클럭으로 동작하는 루나 레이크의 싱글코어 전성비 곡선에서 볼 수 있듯이 기존 인텔 7 공정보다 훨씬 양호한 모습을 보여주었으나, 클럭쇼로 대변되는 인텔, 나아가 철저히 고클럭 제품에 기반해 돌아가는 소비자 데스크탑 CPU 자체에는 특히나 부적합하다.[29] 물론 다르게 말하면 인텔은 이러한 부적합성과 단가의 불리함을 알면서도 N3B 사용을 강행해야 했을만큼 아키텍처의 상태가 불량해 경쟁사 AMD 대비 어떠한 방식으로라도 공정상 전성비 우위를 확보하는 것이 절실했다고 볼 수 있다. 따라서 공정 문제 역시 그 근본을 파고들면 인텔이 아키텍처 설계능력 및 공정 경쟁력을 모두 잃어버린 것에서 시작했다는 결론에 도달한다.

4.3. 평가(애로우 레이크-S)

We knew we built a great part.
We didn't know the competitor(Intel) had built a horrible one.
So the demand has been a little higher than we forecasted.

우리는 우리가 훌륭한 제품을 만들었다는 건 알고 있었습니다.
우리는 경쟁사(인텔)가 그렇게 끔찍한 제품을 만들었을 거라는 것은 몰랐습니다.
그래서 (제품에 대한) 수요가 저희 예상보다 약간 높아졌습니다.

AMD 게이밍 담당 임원 Frank Azor, 9800X3D 물량 부족에 대해 해명하며[30]

실질적으로 U 라인업을 대체하며 울트라북을 타겟으로 좋은 성과를 거두며 호평을 받은 루나 레이크와는 다르게 PC를 타겟으로 한 애로우 레이크는 겨우 인텔 12세대와 라이젠 5000 시리즈를 힘겹게 이기는 수준에 불과한 처참한 게이밍 성능으로 인해 혹평을 받고있다. 출시 시점 기준으로 퀘존 벤치상에선 DDR4 플랫폼인 라이젠 5800X3D와 엎치락 뒤치락 하는 형국이다. 그토록 강조했던 게이밍 전성비 포인트도 사이버펑크 2077에서 전세대 i5-14600K와 코어 울트라 9 285K가 같은 전력을 먹는데 성능은 i5-14600K가 낫다는 벤치마크도 나올 지경이니 사실상 의미를 상실했다.

무엇보다 가장 뼈아픈 점은, "바로 전 세대까지 인텔은 자사의 구세대 공정에 발이 묶여 있어서 제 힘을 못 낸 것 뿐이지, 공정만 정상화되면 과거 보여주었던 세계 탑급의 반도체 설계 능력이 다시 빛을 발할 것"이라는 기대마저 처참하게 무너뜨렸다는 점이다. 현 세대 최고의 반도체 공정 중 하나인 TSMC의 3nm 공정을 동원해서 나온 결과가 이따위이기 때문에 이제는 공정만 개선되면 성능도 정상화될 것이라는 일말의 기대도 할 수 없게 되었으며, 이제 인텔의 설계 능력이 타사 대비 우위를 점하지 못한다는 사실만 만천하에 드러났다.

경쟁작인 AMD의 라이젠 9000 시리즈와 비교해도 굉장히 처참하다. AMD ZEN 5는 실 기기를 까보니 루머나 발표에서 나온 큰 성능 향상폭은 어디가고 실사용 시에는 옆그레이드 수준에 불과하다는 사실이 드러나 집중 포화를 받았는데, 이 제품은 옆그레이드도 아니고 성능이 아예 퇴보했다는 점에서 더 큰 실망감을 주었다. 오히려 최소 옆그레이드라도 된 ZEN 5로 수요가 모조리 쏠리면서 ZEN 5, 특히 9800X3D의 세계적인 품절 대란까지 일어났다.

구체적으로 보면, 어떤 사용례를 가정하고 보아도 마땅한 특장점이 보이지 않는다는 것이 이 CPU의 시장 반응을 어둡게 만들고 있다.

게임용으로 쓰기에는 전세대보다 퇴보한 게임 성능으로 장점이 완전히 퇴색되었다. 게다가 레이턴시 증가 때문에 고성능 CPU의 주요 사용 이유이자 인텔 유저층의 최후의 보루에 가까웠던 1% Low fps도 더 이상 경쟁작이나 자사의 전작 대비 우위를 점하지 못한다.
작업용으로 쓰기에는 Cinebench, Geekbench 등 벤치마크 상에서 측정이 되는 멀티코어 성능과는 다르게 용도에 따라 편차가 심하다. 빅데이터를 다루는 등 일부 작업들에서는 오히려 늘어간 레이턴시 때문에 전세대 대비 개선이 없거나 역으로 퇴보한 경우도 있다.
오버클럭을 통한 성능 향상을 기대하자니 오버클럭이 잘 들어가지도 않고, 오버클럭으로 인한 성능 향상폭도 미미하다.
장점이라면 이전 세대였던 인텔 14세대보다 온도와 전력 특성, 전성비가 좋아졌다는 점이지만, 성능은 동급 내지 소폭 퇴보했는데 메인보드도 바꿔야 하기 때문에 메리트가 크지 않다.
AMD CPU를 사용하는 유저 입장에서는 넘어갈 이유가 아예 없다. 게임 성능만 보면 그냥 전 세대나 9000 시리즈의 X3D 모델로 가면 그만이고, 나머지 X 모델들에 비교해서도 절대 성능으로는 굳이 거론할 필요도 없고, 전성비 측면에도 전 세대 Non-X나 X3D 라인업, 현 세대 X 라인업 대비 딱히 우위가 아니며, 작업에서도 특정 작업을 제외한 평균적인 작업 성능 측면에서는 9950X가 우위이다.
데스크탑 라인에서는 처음으로 NPU가 들어갔지만, Copilot+ PC의 요구 사항도 충족하지 못하는 낮은 성능 때문에 NPU는 실질적으론 장식용에 불과하다.[31][32]
B860, H810의 출시가 빨랐다면 ZEN 5가 품귀로 가격이 폭등했을 때의 수요를 어느정도 흡수할 수 있었겠지만, B860과 H810 보드가 25년 1분기에서야 뒤늦게 출시되면서 이 기회마저 잡지 못했다. 사실 애로우 레이크 논K 중하위 라인업은 전성비 개선으로 인해 성능이 이전 세대 대비 큰 폭으로 오르며[33]가성비가 꽤 괜찮은 편이지만, 중하위 라인 CPU를 CPU 값보다 더 비싼 Z보드와 쓸 사람은 아무도 없을 것이니 ZEN 5 중하위 라인업과 경쟁 자체가 안 됐다.[34] 이후 B860, H810 보드가 뒤늦게 출시됐을 때에는 이미 라이젠 논X3D 라인업의 가격이 안정화된 터라 판매에 별 도움이 되지 않았다. 더군다나 뒤늦게 출시된 H, B 보드도 AM5 대비해서 싼 것도 아니라 여전히 메리트는 별로 없는데, 최하급 H보드가 12만, 방열판이라도 달린 거 찾으려고 보면 15만, B보드 보려면 20만원은 써야 하는 등 가격 자체가 전 세대들 대비 많이 오르면서 중하위 라인업 CPU들의 경쟁력을 깎아먹고 있다.
추후 업그레이드 가능성마저 불투명하다는 루머가 있다는 것도 구매를 불안하게 만드는 요소다. 애로우 레이크 리프레시가 취소되면서 LGA 1851은 1세대만 유지되고 소켓이 교체될 것이라는 루머가 있기 때문이다. 물론 확정된 것은 아니며, 1851 소켓을 2세대 이상 지원할 것이라는 루머도 동시에 존재한다. 사실 인텔의 업그레이드라 해 봤자 한세대고 잘해야 두세대라 효용성이 별로지만, 지금처럼 CPU 성능에도 논란이 많은 상황에서 소켓이 1년만에 바뀐다는 루머가 있다는 것 만으로도 구매를 망설이게 만드는 요소다.

이런저런 상황을 고려했을 때, 퀵싱크 기능을 반드시 써야하는 사용자, 그 중에서도 오직 인텔 제품만 쓰는 12세대 이전 제품 사용자가 신제품만을 기다리면서 버티다가 이번 시점에 치명적인 결함이 없는 새 시스템을 반드시 갖춰야 할 경우를 상정하는 식으로 경우의 수를 좁히고 좁혀야 가까스로 이 제품을 합리적으로 선택할 경우의 수가 생긴다.

이 신제품을 평가하는 하드웨어 마니아들 사이에서 인텔 14나노 공정 문제와 미완성된 바이오스로 인한 낮은 출시 초기 성능으로 인하여 i7부터 i9까지 8코어 제품들 한정으로 '모래낭비'라는 오명을 얻었던 인텔 11세대인 로켓레이크가 유사한 사례로 소환되는 중이다. 하다못해 11세대의 경우, 이전 세대 대비 IPC 증가는 확실해서 절대적인 게임 성능과 코어 수가 줄어든 i9을 제외한 라인업의 작업 성능 개선이라도 있었다. 이쪽은 최신 공정을 사용하고도 이 모양이다. 심지어 안 그래도 회사가 큰 위기에 빠진 상황에서 나온 신작의 성능이 전작에 비해 퇴보했다는 설계 측면의 문제로 인해 AMD를 완전히 끝장낼 뻔했던 불도저마저 떠올리게 하는 측면이 있다.

4.3.1. 긍정적 평가

개선된 멀티스레드 성능
싱글 스레드 점수는 14세대 대비 인상적이지 않았지만, E-코어의 IPC 향상에 힘입어 출시 전 예상과 달리 Cinebench, Geekbench 등으로 측정이 되는 멀티코어 성능 지표상으로는 우수한 모습을 보여주었다. 그래서 하이퍼스레딩 없이 멀티 성능에서 9950X에게 빼앗긴 왕좌를 되찾아 왔다. 이로 인해 특히 인텔 특화 작업의 성능이 뚜렷하게 향상되었다.

Arc 내장 그래픽의 우수한 성능
오랫동안 그래픽 감속기라는 오명을 벗지 못하던 인텔 내장그래픽이 환골탈태 수준으로 좋아졌다. 이미 메테오레이크에 탑재되어 호평을 받은 바 있는 Arc 내장 그래픽이 들어가면서 인텔 14세대나 라이젠 9000 시리즈와 비교하더라도 큰 폭의 성능 향상을 보여주었다. 특히 하위 라인업의 경쟁력이 돋보이는데, 애로우 레이크-S 내의 상위 SKU와 하위 SKU 간의 성능 차이가 거의 없기에[35] 하위 라인업 기준으로도 AMD APU군에 속하는 라이젠 8500G(Radeon 740M)를 약간 앞지르고, 외장 그래픽 카드 GTX 1630의 바로 아랫급 정도의 성능을 낸다. 이후 초기 가격 거품이 꺼지고 나면 내장 성능 만으로도 나쁘지 않은 FHD 게이밍 환경을 구축할 수 있을 것으로 예상해 볼 수 있다.

전 세대 대비 크게 개선된 온도
애로우 레이크를 가장 부정적으로 보는 리뷰어들도 온도에 대해서는 호평하는 추세다. 퀘이사존 리뷰에 따르면 퍼포먼스 설정의 285K, 265K, 245K는 게임 구동 시 14세대 대비 9-16도, 풀로드가 걸리는 작업 시에는 최대 5도 가량의 큰 온도 개선이 이루어졌고, 경쟁사인 라이젠 Zen 5 CPU들과 비교해도 10도 전후의 큰 우위를 가진다. 이는 쿨러 투자비용 하락으로 이어져 가성비와도 직결되는 점으로, 특히 13, 14세대 i9은 3열 수랭이 필수라는 말이 나올 정도로 발열이 심각했다는 점에서 괄목할만한 개선이라 볼 수 있다.

전 세대 대비 개선된 전성비
온도와 마찬가지로 14세대 대비 큰 개선점을 보였다. 같은 상황에서 14세대 대비 전력 소모량이 20-40%까지 감소하여 전기먹는 하마라는 오명은 벗게 되었다. 다만 단점 문단에 후술하겠지만 비정상의 정상화 수준이지 경쟁사를 압도하는 수준의 전성비는 아니며, 발열과 전력소모가 줄어든 만큼 성능까지 퇴보했다는 것이 문제다.
사실 전성비 개선으로 진짜 수혜를 본 쪽은 논-K 라인업 쪽인데, 논-K 라인업은 PL1이 65W로 제한되기 때문에 전성비가 바로 성능으로 연결되기 때문이다. K 라인과는 아직 성능 차이가 꽤 있지만 전 세대에 비하면 차이가 많이 줄었으며, 전 세대의 같은 레벨(285-14900, 265-14700, 235-14500 등)과 비교했을 때는 작업에서는 말 그대로 레벨이 다른 성능을 보여주며 게임에서도 밀리지 않는다.#

4.3.2. 부정적 평가

전세대 대비 하락한 성능
애로우 레이크의 성능에 집중해 평가하면 로켓 레이크의 재림을 넘어 초월하는 수준의 망작이라는 점에는 이견이 없다.[36] 실제로도 로켓 레이크와 비슷한 양상을 띄면서도 부분적인 문제는 심화된 것으로 보이는데, 사용 가능한 유효 스레드 수가 감소한 것(코어 수 감소/SMT 삭제)의 유사점과, 작업 성능의 개선점 전무 등과 같이 애로우 레이크에만 존재하는 차이점이 각각 있다.

퇴보한 게임 성능
하이엔드 게이밍을 표방하는 한화 90만원이 넘는 최신 최상위 라인업인 285K가 14900K와 비교해 평균 게임 성능이 오히려 소폭 하락했다. 비교 대상인 14900K는 손상 결함 논란으로 인한 전압 제한 패치를 받아 성능이 가장 큰 폭으로 하락한 제품인데, 285K는 그것마저도 추월하지 못한 것이다. 출시 초창기에는 14세대 대비 성능이 눈에 띌 정도로 낮았고, 인텔 CPU의 주요 장점 중 하나였던 Low 1% 프레임은 AMD CPU에게도 밀리는 수준으로 처참했으나, 25년 2월 마이크로코드 패치 이후로는 285K 기준 14900K와 비슷한 수준까지 성능이 올라왔고 Low 1%도 상당히 안정화되었다.#
코어 간 레이턴시 증가
애로우 레이크는 L3 캐시 접근 레이턴시가 전 세대 대비 증가하였고, 이것이 게임 및 작업 성능이 저하의 주요 원인 중 하나로 지목된다. 인텔은 이 문제를 인지했으나, 데스크탑 라인업에서는 수정하지 않고 출시했다. 이 문제의 원인에 대해선 여러 가설이 있지만, 원인이 무엇이든 간에 물리적인 배치 문제가 한몫을 하고 있다는 점은 확실하기 때문에 바이오스나 마이크로코드 수정으로도 완전한 해결을 기대할 수 없는 약점이다. 특히나 더 뼈아픈 점은 경쟁사는 ZEN 4든, ZEN 5든 출시 이후 꾸준한 바이오스 업데이트나 지원 프로그램으로 성능을 끌어올리고 버그나 약점은 줄여왔으며, 하다못해 인텔의 그 유명한 모래낭비였던 11세대조차도 꾸준한 바이오스 업데이트를 통해 게임 성능을 10세대보다 유의미한 수준으로 끌어올리는데 성공했지만 현재 인텔 울트라 2세대는 그것도 기대하기 힘들다는 점이다.
~~윈도우 스케줄러의 P, E코어 구분 이슈~~ 해결
12-14세대 CPU는 컴퓨트 타일에 P코어는 P코어끼리, E코어는 E코어끼리 뭉쳐서 배치되었으나, 이번에는 효율적인 발열 관리를 위해 285K 기준으로 P코어 2개 - E코어 8개 - P코어 4개 - E코어 8개 - P코어 2개 순서로 코어가 분산되어 있다. 이렇게 하면 P코어의 발열들이 효과적으로 분산되기 때문에 실제로도 온도는 크게 개선되었다. 그러나 출시 시점에선 윈도우의 스케줄러가 P/E 코어 구분 없이 그냥 코어를 배치된 그대로 인식하는 문제가 있었다.[37] 이 탓에 앞 부분의 코어들을 꺼 버리면 오히려 성능이 올라가는 기현상도 벌어졌는데, 추후 거듭된 마이크로코드 패치로 수정되었다.

여전히 기대에 못 미치는 전성비
출시 직후에는 전성비가 14세대 대비 크게 개선된 것을 보고 환호하는 반응이 많았지만, 좀 더 냉정한 분석이 이루어지면서 평가가 다소 복합적으로 바뀌었다. 최근 출시된 웬만한 CPU들 중 13, 14세대 랩터 레이크보다 전성비 나쁜 걸 찾기가 힘들 정도였다는 것을 생각했을 때, '최악에서 평범한 수준이 된 거지, 환호할만큼 좋아진 게 맞나?' 하는 점이다. 특히나 기존 인텔 7nm 공정을 탈피하고 애로우 레이크 출시 시점에서 최고의 반도체 생산공정인 TSMC 3nm를 쓰기까지 한 물건에게 기대할 만한 전성비는 아니라는 평이며, ZEN 5[38]와 비교하더라도 전성비 면에서 크게 우위를 점하지 못한다는 평이다.

빠듯한 클럭 마진과 거의 의미없는 오버클럭
지금까지 인텔은 10년 이상 그 위험성을 감수하고서라도 실제 구입 후 사용할 때 오버클럭이 잘 된다는 이점은 확실한 CPU들을 쭉 내 왔고, 그에 맞추어 유일하게 오버클럭이 되는 Z보드의 수요도 꾸준히 있어왔다.[39] 그런데, 그 기조가 이번에 최초로 무너졌다. 출시 후 전 세계의 리뷰어들과 벤치 사이트들이 입을 모아 말하는 것을 보면 P코어의 오버클럭 마진은 거의 없는 수준이고, E코어의 오버클럭 마진은 그래도 양호한 편이지만 과거 인텔 CPU들과 비교될 수준은 아니고, 오버클럭을 해서 생기는 성능 상의 이점 역시 미미한 수준이 되어 버렸다는 결론이다. 많은 유저들이 '그래도 오버하면 성능 향상 폭이 크기 때문에' 인텔을 선택하기도 했지만, 지금 기조에서는 그 동기가 사라져 버릴 위기에 처했다.

4.3.3. 복합적 평가

미묘한 작업 성능
라이젠 1, 2세대 시절과 비교하면 격세지감이 오지만, 이 분야는 인텔이 점점 경쟁사 대비 우위가 강해지는 분야다. 그런데, 이번에 나온 애로우 레이크는 그 비교우위가 다소 미묘하다는 평가다. 하이퍼스레딩 삭제 및 클럭 퇴보로 인해 그나마 신형 아키텍처로 얻었던 IPC가 상당부분 상쇄되었으며, 올라간 멀티코어 성능이 실제 환경에서의 작업성능 향상으로 완전히 치환되지 않는 모습이다. 물론 인텔의 자랑거리인 퀵싱크를 쓸 수 있는 작업들의 압도적인 성능은 여전하나, 이외 작업들의 성능은 ZEN 5 9950X, 9900X에 비해 작업에 따라 조금씩 앞서거니 뒷서거니 하는 수준으로 확고한 우위를 점하지 못한다. 라이젠 1000번대와 2000번대와 같이 게임에서 뒤처졌다면 작업이라도 우수해야 경쟁사 대비 확실한 용도 영역을 나누어갈 수 있는데, 이렇게 미묘하다면 이도 저도 아닌 물건이 되어버린다.

NPU 탑재
인텔 테스크탑 프로세서 최초로 NPU가 탑재되었다. 하지만 여타 동 세대 NPU들이 그렇듯 성능이 유용한 수준이 아니라서 제대로 된 활용이 불가능하며, Copilot+ 지원 요건에도 미달한다. 물론 NPU를 지원하는 애플리케이션에서는 CPU를 이용하는 것에 비해 성능 향상이 있지만, 애초에 지원하는 애플리케이션이 많지 않은데다가 이런 애플리케이션은 연산의 특성상 GPU도 지원하는 경우가 많고 보통은 GPU를 이용하는 쪽의 성능 향상이 크기 때문에 실질적인 효용성은 높지 않다.

4.4. 인텔의 성능 개선 공언

이러한 성능 저조에 대한 반응으로, 인텔은 2024년 11월 11일 "애로우 레이크의 성능은 아직 제 성능을 발휘한 것이 아니며, 저평가된 성능을 제자리 찾게 만들어 줄 수 있는 마이크로코드를 배포하겠다"는 의도를 담은 발표를 진행했다. # 번역

뒤이어 인텔은 2024년 12월 18일에 "애로우 레이크 CPU성능에 영향을 미치는 5가지 주요 문제를 확인했다"고 발표했다. # 번역 이전에는 경쟁사 AMD의 CPU와 GPU가 성장형 제품의 대표주자였던 것을 생각하면 격세지감이 드는 상황인데, 어쨌든 "이번에는 인텔이 성장형이냐?"는 비아냥 속에서도 나름 인텔 애로우 레이크의 성능 향상을 기대하는 반응도 없지 않았다.

2024년 12월과 2025년 1월에 각각 한 차례씩 마이크로코드 패치가 있었으나, 이 두 패치로는 의미있는 성능 향상이 없었다.#번역 테스트를 진행한 탐스 하드웨어의 분석에 따르면 작업에서든 게임에서든 유의미한 성능 개선은 없었고, 간혹 나아지는 경우는 인텔의 마이크로코드 적용이 아닌, 어플리케이션 제조사나 게임사의 성능 개선 패치가 주된 원인이었으며, 오히려 그 적용을 받은 인텔 14세대 제품들의 성능 향상이 그나마 더 나았다는 결론이다.

4.5. 기타

오버 클럭에 관해서는 신제품이 나오자 마자 구매해서 히트스프레더를 분리해서 분석하는, 소위 '뚜따'를 시행한 전 개그맨 정종철 [40]은 "P코어의 오버 마진은 거의 없고, E코어의 오버 마진은 제법 있지만, 전체 오버를 통한 효율은 그닥"이라는 평가를 내린다.# # 정종철은 '그 동안 인텔 파운더리를 사용한 공정의 특징이 오버클럭을 통한 성능 향상 폭이 크다는 특징이 있었고, TSMC 공정을 사용한 AMD의 특징이 오버클럭을 통한 성능 향상 폭이 그렇게 크진 않다는 특징이 있었는데, 이번 애로우 레이크가 TSMC를 통해 제조되면서 지금까지 특성이 소멸된 것이 아닐까' 하는 추론을 하면서 영상을 마무리 한다.

메인보드 지원이 이번 15세대 한 세대로 끝나고 다음 세대에서는 또 소켓이 바뀔 것이라는 루머가 돌고 있었으나, 다시 그것을 덮는 루머가 나왔다.#

5. 모바일 저·중·고전력용: 애로우 레이크-U/H/HX

5.1. 출시 전 정보


인텔 코어 200 라인업 정리

CPU

애로우 레이크-H
CPU는 루나 레이크와 동일한 라이언 코브 아키텍처와 스카이몬트 아키텍처를 각각 P-코어와 E-코어로 활용하며, 추가적으로 크레스트몬트 아키텍처를 LPE-코어로 활용하여 두 개의 코어를 집어넣는다.

유출된 긱벤치 자료를 참고하면 i7 이상급 라인업은 6 + 8 + 2 코어 구성을 갖추며 i5 이하급 라인업은 4 + 8 + 2 코어 구성을 갖출 것으로 예상이 된다. 자료를 보면 E-코어 클러스터가 10코어라고 표기되어 있으나, 스카이몬트 아키텍처는 4코어 클러스터 구성으로 L2를 통하여 내부 코어 간의 통신을 하며, 이 4코어 클러스터가 다른 P-코어들과 함께 L3을 보유하며 서로 통신한다는 점을 감안하면, 긱벤치 상에 표기된 10코어는 실질적으로 8 + 2 코어라고 보는 것이 합리적이다.
애로우 레이크-U
명칭은 애로우 레이크지만 CPU는 메테오 레이크와 동일한 레드우드 코브 아키텍처와 크레스트몬트 아키텍처를 각각 P-코어와 E-코어, 그리고 LPE-코어로 활용한다.

루머에 따르면 생산 공정은 인텔 4에서 인텔 3[41]으로 다이 쉬링크가 이뤄지며 레드우드 코브와 크레스트몬트 아키텍처도 소소한 개선이 있을 것이라고 한다. 이런 점을 감안하면 상당히 이질적인 라인업이다.

추가적인 유출에 따르면 레드우드 코브 플러스(RWC+)가 P-코어로 탑재되며 크레스트몬트 인핸스드(CME)가 E-코어로 탑재된다고 한다. RWC+는 기존의 레드우드 코브와는 다르게 엔터프라이즈용 라인업인 Xeon 6에 들어간 아키텍처이며, 프론트엔드의 디코더 폭이 8-Wide로 확장되었다고 한다. 인텔 3 공정 적용으로 인하여 기존의 메테오 레이크-U 라인업과 비교하여 베이스 클럭이 대폭 늘어났다고 한다.[42]

구성은 MLID에 따르면 6 + 8 + 2 구성이지만 애로우 레이크-H 하위 라인업이 4 + 8 + 2 코어인데 -U 라인업에서 그렇게 넣어줄 리는 거의 없고, 중화권 측의 유출 자료처럼 2 + 8 + 2 코어 구성이 더 유력하다.
랩터 레이크 리프레시 리프레시
CPU나 나머지 iGPU 등등의 구성은 모두 인텔 13세대와 동일하다. 실질적으로 리네이밍, 적나라하게 말하면 우려먹기 제품이며 이 제품군은 Core Ultra 200이 아닌 Core 200 명칭으로 출시된다고 한다. 자세한 내용은 인텔 13세대로.

애로우 레이크-H용 GPU

* GPU

* 애로우 레이크-H
모바일 제품군 또한 루나 레이크와는 다르게 Xe2(배틀메이지) 아키텍처가 아닌 메테오레이크의 Xe1(알케미스트) 아키텍처를 강화시킨 Xe+를 사용한다고 한다. XMX가 추가되면서 AI 연산 성능이 4배로 증가했고 2배 강력한 레이 트레이싱 성능과 2배로 늘어난 L2 캐시 용량을 가진다고 한다. Xe+ 8코어 구성을 가지고 있다.

* NPU
NPU는 인텔의 3세대 NPU가 탑재된다. 루나 레이크의 NPU 4보다는 더 낮은 성능을 가지고 있으나 Zen 5를 포함한 데스크탑용 CPU중에서는 가장 높은 13TOPS의 정수 8비트 연산 성능을 가진다. 모바일용 애로우 레이크-H는 13TOPS의 NPU와 각각 9, 77TOPS의 CPU, GPU AI 연산 성능을 합하여 최대 99TOPS의 연산 성능을 가지게 된다.

5.2. 제품

자세한 내용은 인텔 코브 마이크로아키텍처/사용 모델 문서

의 애로우 레이크 부분을

참고하십시오.


애로우 레이크 모바일 SKU 차트

5.3. 상세

5.3.1. 작업 및 AI

애로우 레이크 모바일 CPU 벤치 성능 [ 펼치기 · 접기 ]

애로우 레이크 모바일 CPU 작업 성능 [ 펼치기 · 접기 ]

5.3.2. 게임

외장 그래픽 사용시의 게임 성능 [ 펼치기 · 접기 ]

내장 그래픽 성능 [ 펼치기 · 접기 ]

5.3.3. 전력 소모 및 배터리 효율

애로우 레이크 모바일 전력 [ 펼치기 · 접기 ]

배터리 사용시간 지표 [ 펼치기 · 접기 ]

5.4. 평가(애로우 레이크-H/HX)

5.4.1. 긍정적 평가

5.4.2. 부정적 평가

5.4.3. 복합적 평가

[1] 기존의 메테오 레이크는 인텔 4 공정 문제로 데스크탑이 취소되어 노트북 제품군 한정으로 출시되었다. 때문에 급하게 땜빵으로 투입된 물건이 인텔 14세대다.[2] 최대 3개의 마이크로옵을 발행할 수 있는 3개의 Complex Decoder[3] SMT가 각종 Hazard와 보안 문제를 일으키는 것이 드러난 탓도 있다.[4] 기존 U 라인업 SKU에 비해 2W 늘어났는데, 22FFL 인터포저 위에 함께 탑재되어 같은 패키징으로 포함이 된 LPDDR5 램으로 인한 영향이다.[5] 코어 구성에 따른 성능 차이는 매우 크다. 스냅드래곤 8 Gen이 1세대에서는 1+3+4 구조였으나, 같은 8코어 구성을 유지하더라도 1+4+3, 1+5+2, 2+6+0 구성으로 성능 향상을 하는 것을 보면 알 수 있다.[6] 그 이전까지의 인텔 E-코어는 스카이레이크와 유사한 수준의 IPC를 가졌다.[7] 사실 인텔의 말은 이론적으로 보면 딱히 틀릴 것도 없는 것이 RISC가 CISC보다 태생적으로 성능·효율이 더 좋은 것은 사실이지만 이는 어디까지나 여러 요소 중 하나일 뿐, 반도체의 성능과 전성비를 결정하는 가장 큰 요소는 ISA가 아닌 개발주체의 설계(아키텍처)와 제조(팹) 기술력이다.[8] P 코어 - LP E 코어 간 레이턴시: 약 55 ns, E코어 클러스트 내 레이턴시: 20 ns대 중반 (P코어 간 레이턴시와 비슷한 수준)[9] EU 64개, SP(FP32) 1024개[10] Core Ultra 5 계열은 벤치마크 유출을 통해 1.85GHz의 클럭으로 GPU가 작동한다는 것이 드러났다.[11] 54W 이상의 전력을 소모하는 메테오 레이크-H의 최대 GPU 성능을 잡지는 못하더라도 28W 메테오 레이크-H GPU 성능이 17W 루나 레이크-V GPU 성능이랑 동급이기 때문에, 동일 17W 상에서 기존 메테오 레이크-H의 128EU GPU의 1.5배 성능을 낸다면 틀린 말은 안한 셈이 된다.[12] 155H와 258V는 최대 클럭이 4.8GHz로 서로 동일하다.[13] 번역 출처 [14] P 코어 4개 + E 코어 4개[15] 물론 스냅드래곤에서 게임을 구동하면 에뮬레이션으로 돌아가는 것은 감안해야 하지만, 어차피 게임들이 ARM 네이티브를 지원할 리 없으니 현실에서는 오버헤드 페널티를 받지 않는 상황은 없다.[16] 세 번째의 자료를 보면 3DMark 구동시 루나 레이크의 Arc 140V가 17W를 소모할 때의 성능과 메테오 레이크의 1세대 Arc가 28W를 소모할 때의 성능이 정확히 일치한다.[17] 포토샵은 최대 6스레드까지 원활하게 활용한다.[18] 이 경우 90W를 소모하는 메테오 레이크의 Arc 1세대 GPU가 Bilibili 기준으로 0.9%의 우위, Geekerwan 기준 -2%의 열세 구도를 가지며 종합적으로 오차범위 내의 게임 성능을 낼 수 있다.[19] 물론 이는 호환성 문제가 크다.[20] Geekerwan, Tom's Hardware, Notebookcheck 3곳에서 교차 검증.[21] 메인스트림 게이밍 노트북에 널리 쓰이는 RTX 4070 모바일의 AI 성능이 321TOPS이다. 물론 저 성능을 100% 발휘하려면 풀로드와 동시에 엄청난 팬 소음이 동반되지만 AI 작업을 전문적으로 하는 사람이라면 상관 하지 않는다.[22] 출시 시점 기준 인텔 샌디브릿지 마이크로아키텍처(2012), AMD는 Zen 1(2017), 퀄컴의 오라이온(2024), Apple의 1세대 Everest(2022).[23] 장점 부문에 서술된 싱글코어 전성비와는 다른 이야기이다.[24]

출처 : [25] 여러 커뮤니티의 실기 게임 프레임 테스트를 기준으로, QHD에서 5800X3D에게 확실하게 패배하며 UHD 이상이 되어서야 285K가 경합 또는 근소 우위를 보이는 것으로 나타났다.[26] 5800X3D는 DDR4 기반 285K는 DDR5 기반 시스템인데도 불구하고 인텔의 열위가 발생한다는 점에 의해 애로우 레이크의 문제가 더욱 심각하다고 할 수 있다.[27] RDNA3 12CU인 780M과 RDNA3 4CU인 740M 간의 성능 차이가 1.7~1.8배 정도라는 점이 의아할수도 있지만 AMD APU에 내장그래픽은 램 대역폭에 제약을 받기 때문에 그렇다. 실제로 780M 12CU와 8CU간의 차이는 CU 수 차이에 비하면 훨씬 좁고, 스트릭스 포인트 또한 RDNA 3.5 16CU를 사용하는 890M과 12CU인 880M 간의 차이가 좁다.[28] ZEN 4의 Non-X나 X3D 라인업의 전성비가 높게 나오는 것은 TDP가 낮게 설정되어 전력 소모는 적지만 실제 성능 하락은 전력 제한에 비례하지 않기 때문에 나오는 일종의 착시일 가능성이 크다. 역으로 전력 제한을 풀었을 때 전력 소모량에 정비례하게 성능이 오르지 않는 것을 생각하면 된다.[29] N3E 공정을 사용하면 이렇게까지 되지는 않았겠지만 CAPA 부족으로 인해 N3E를 사용하는 것은 어렵고 인텔에게 사용 가능한 3nm 선택지는 N3B가 유일했을 가능성이 높다.[30] 24년 말부터 25년 초까지 이어진 전세계적인 9800X3D 품귀 현상으로 인한 소비자들의 불만에 대해 해명하는 말이었다. AMD의 속 뜻은 "우리도 나름 수요를 예측하고 그에 따른 물량을 준비했는데, 우리 경쟁사 인텔의 애로우 레이크가 병X으로 나와버려서 안 팔리고, 그 수요가 우리에게 몰릴 것까지는 예측 못했다. 우리가 CPU 잘 만들어서 수요가 증가한 이유도 있지만, 경쟁사가 CPU를 너무 못 만든 것도 이유에 들어간다."라고 인텔에게 티배깅을 하는 것.[31] 오직 CPU만으로 AI를 돌리는 조건을 상정해도 의미가 거의 없다. 현재 온디바이스 AI로 의미있는 성능을 내려면 반드시 외장 GPU를 끌어다가 써야 하며, CPU 내장 NPU만으로 돌리는 온디바이스 AI는 CPU 기종과 AI 모델을 막론하고 장난감 수준의 결과물만 나온다.[32] 애초에 NPU가 있으니까 데스크탑에도 안 자르고 넣었다고도 할 수 있는 것이, 인텔 공식 홈페이지 데스크탑 제품 요약에서까지 NPU는 배터리 수명에 좋다고 하고 있다. 기대할 것을 찾지 못해 복붙 했거나, 신경도 안 썼거나, 결국 인텔 측에서도 데스크탑 CPU 내장 NPU에 기대하는 것이 없는 것이다.[33] 인텔 non-K 라인업은 PL1 전력제한이 65W로 강제되기 때문에 전성비가 성능에 직결된다. 처참한 전성비로 악명높은 13, 14세대는 이 탓에 non-K와 K 라인의 성능 격차가 굉장히 심했는데, 애로우레이크 들어서 이 격차가 크게 좁혀졌다.[34] 사실 ZEN 5도 인텔과 마찬가지로 신세대 보드 출시가 상당히 늦어졌다. 그러나 ZEN 5는 AM5 소켓이 유지되어 전 세대 보드와 호환이 가능해 얼마든지 대안이 있었던 반면, 애로우 레이크는 소켓도 바뀌었는데 B/H보드의 출시가 늦어지면서 한동안 Z보드 외에는 선택지가 전혀 없었다.[35] 최상위 제품인 U9 285K부터 최하위 제품인 U5 225까지 Xe 코어 수는 모두 같으며, 클럭만 2.0GHz, 1.9GHz로 미세하게 차등이 있다. 1.9GHz Arc는 2.0GHz Arc 대비 96% 정도의 성능을 낸다.[36] 그나마 프레스캇이나 불도저보단 나은게, 성능은 퇴보하긴 했어도 전력 소모와 발열은 전작 대비 개선되었기 때문이다. 14세대만큼 전기를 퍼먹으면서 발열 제어마저 안 됐으면 진짜로 프레스캇, 불도저의 재림이라고 볼 수 있었을 것이다.[37] 그러니까 만약 10스레드를 끌어써야 하는 상황이라면 12~14세대의 경우 맨 앞의 P코어 5개를 정상적으로 끌어다 쓰지만, 285K의 경우 앞에서부터 P코어 2개 + E코어 8개를 끌어다 쓰기 때문에 뒤쪽의 P코어 6개가 놀게 된다.[38] ZEN 5는 성능을 과장되게 부풀린 AMD의 발표로 인해 출시 전 기대가 너무 높았기에, 출시 후 기대에 못 미치는 성능에 실망한 여론으로 인해 과소평가된 경향이 있었다.[39] 인텔은 Z 보드에서만 오버클럭이 되며, AMD는 X와 B 보드에서도 오버클럭이 된다.[40] 개그맨으로 유명한 사람이지만, 은퇴 후에 의외로 하드웨어 유튜브 활동도 하고 있고, 그동안 쌓은 재력을 통해서 일반 유저들이 하기 힘든 시도들을 영상으로 만들어 채널에 올려주곤 한다.[41] 일반 소비자용 제품으로 출시되지는 않았지만 인텔 3 공정은 Xeon과 같은 B2B 라인업을 통하여 어느 정도 검증이 이뤄진 공정이다. 물론 3나노라는 명칭과는 다르게 인텔 4의 하프노드에 해당하는 공정으로 타사의 3나노와 같은 집적도를 가지고 있지는 않다.[42] Phoronix의 분석에 따르면, 인텔 3 공정과 마이너 업데이트된 아키텍처가 적용이 된 Granite Rapids는 코어당 3.9W를 소모하며 3.2Ghz의 클럭을 유지한다. 인텔 7 공정으로 생산된 이전 세대는 6.01W/Core의 전력 소모를 보이는데, 6% 더 높은 클럭을 유지하며 전력 소모를 35% 낮춘 것이다.