인텔 스카이몬트 마이크로아키텍처

||<-8><tablealign=center><bgcolor=#009385> 인텔 아톰 라인 마이크로아키텍처 ||

공정	서버		데스크탑 및 모바일			임베디드
공정	데이터 센터	마이크로 서버	데스크탑	랩톱	태블릿 및 스마트폰	산업용	가전용
<colbgcolor=#00a495> 45 nm	본넬 (Bonnell) 기반
			다이아몬드빌 (Diamondville)	실버쏜 (Silverthorne) 다이아몬드빌 (Diamondville)
			파인뷰 (Pineview)		린크로프트 (Lincroft)	터널 크릭 ^{(Tunnel Creek)} 스텔라톤 (Stellarton)	소다빌 ^(Sodaville) 그로브랜드 (Groveland)
32 nm	솔트웰 (Saltwell) 기반
32 nm		센터톤 (Centerton) 브라이어우드 (Briarwood)	시더뷰 (Cedarview)		펜웰 (Penwell) 클로버뷰 (Cloverview)		베리빌 (Berryville)
22 nm	실버몬트 (Silvermont) 기반
22 nm		아보톤 (Avoton) 랭글리 (Rangeley)	베이 트레일-D ^{(Bay Trail-D)}	베이 트레일-M ^{(Bay Trail-M)}	베이 트레일-T ^{(Bay Trail-T)} 무어필드 (Moorefield) 메리필드 (Merrifield) SoFIA	베이 트레일-I (Bay Trail-I)
14 nm	에어몬트 (Airmont) 기반
			브라스웰 (Braswell)		체리 트레일 ^{(Cherry Trail)} SoFIA LTE
	골드몬트 (Goldmont) 기반
		덴버튼 (Denverton)	아폴로 레이크 (Apollo Lake)			아폴로 레이크 ^{(Apollo Lake)}
	골드몬트 플러스 (Goldmont Plus) 기반
			제미니 레이크 (Gemini Lake) 제미니 레이크 리프레시 (Gemini Lake Refresh)
10 nm	트레몬트 (Tremont) 기반
10 nm		스노우 릿지 ^{(Snow Ridge)}	재스퍼 레이크 (Jasper Lake) 스카이호크 레이크(?) (Skyhawk Lake)		레이크필드(Lakefield)	엘크하트 레이크 (Elkhart Lake)
Intel 7	그레이스몬트 (Gracemont) 기반
Intel 7			엘더 레이크-S ^{(Alder Lake-S)}	엘더 레이크-P ^{(Alder Lake-P)}	엘더 레이크-N ^{(Alder Lake-N)} 트윈 레이크 ^{(Twin Lake)}
Intel 4/3	크레스트몬트 (Crestmont) 기반
Intel 4/3	시에라 포레스트 ^{(Sierra Forest)}			메테오 레이크-H
TSMC N3B	스카이몬트 (Skymont) 기반
TSMC N3B			애로우 레이크	루나 레이크
Intel 18A	다크몬트 (Darkmont) 기반
Intel 18A	클리어워터 포레스트 ^{(Clearwater Forest)}				와일드캣 레이크 ^{(Wildcat Lake)}

1. 개요2. 상세

2.1. 변경점2.2. 루나 레이크2.3. 애로우 레이크

3. 사용 모델4. 여담

1. 개요

2024년 발표 예정인 인텔 아톰 계보의 마이크로아키텍처.

2. 상세

2023년 8월, 인텔 오픈소스 웹사이트에서 루나 레이크에 사용된 P-코어 및 E-코어의 코드명이 확인됐다. #

2024년 5월 30일, 6월 중 엠바고 해제 예정인 인텔 슬라이드가 유출되었는데 해당 슬라이드에 따르면 정수 연산에서 평균 38%, 부동소수점 연산에서 평균 68%의 성능 향상이 있다고 한다.

2.1. 변경점

코어 레벨 (크레스트몬트 대비)

프론트 엔드

분기 예측기 개선

디코더의 폭이 6-wide(2x3-wide) → 9-wide(3x3-wide)로 증가

나노코드 도입

마이크로옵 큐의 크기가 64 엔트리 → 96 엔트리로 확장

백 엔드

할당량이 6-wide → 8-wide로 확장
퇴출 폭이 8 → 16으로 확장
실행 레이턴시 감소를 위한 dependency breaking 메커니즘
재정렬 버퍼(Reorder Buffer, ROB)가 256 엔트리 → 416 엔트리로 확장
물리 레지스터 파일의 크기가 증가
스케줄러의 크기가 증가
실행 엔진

실행 포트가 총 17-way → 26-way로 확장
ALU의 수가 4개 → 8개로 증가
분기 유닛의 수가 2개 → 3개로 증가
로드 AGU의 수가 2개 → 3개로 증가

스토어 AGU의 수가 2개 → 4개로 증가

SIMD ALU의 수가 3개 → 4개로 증가
벡터 처리량이 최대 2배 증가 (FADD/FMUL/FMA 포트 수가 2 → 4)
FADD, FMUL, FMA 레이턴시 개선

하드웨어 수준의 부동소수점 반올림 지원

-O2

메모리 서브시스템

로드 및 스토어 버퍼의 크기가 증가
L2 공유 TLB

L1 캐시 메모리

L1간 데이터 전송 지원

L2 캐시 메모리

그레이스몬트 [1]/크레스트몬트 [2] 아키텍처에서 큰 확장 및 여러 개량이 이루어져 IPC가 크게 상승하였다. 특히 기존에 E코어의 약점으로 지적되었던 벡터 및 메모리 부분에서 유의미한 개선이 이루어졌다. 이에 따라 기존 L3 캐시 및 링버스를 사용하는 버전 기준으로 정수 및 부동소수점 모두 랩터 코브 코어와 동급 IPC를 보여준다고 한다.

2.2. 루나 레이크

2.3. 애로우 레이크

3. 사용 모델

/사용모델 참조

4. 여담

스카이몬트의 선임 설계자인 스티븐 로빈슨에 따르면 3 x 3-디코더 구성을 채택하는 데에는 x86 명령어의 통계적 경향성이 고려되었다고 한다. #

[1] 2021년 발표, 2021년 엘더레이크, 2022년 랩터레이크[2] 2023년 발표, 2024년 메테오레이크 등 적용