AMD CCX (Core Complex) 아키텍처란?

728x90

AMD CCX (Core Complex) 아키텍처란?

AMD의 CCX (Core Complex) 아키텍처는 Zen 마이크로아키텍처(Zen, Zen+, Zen 2) 기반의 멀티코어 프로세서에서 사용되는 기본 연산 블록입니다. CCX는 CPU 다이(die) 내에서 코어 그룹을 형성하여 L3 캐시를 공유하고, 다수의 CCX가 결합하여 **CCDs (Core Complex Dies)**를 구성합니다.

1. AMD CCX 아키텍처 개요

AMD의 Ryzen 및 EPYC 프로세서는 칩렛(Chiplet) 기반 설계를 사용하며, 각 칩렛(CCD)은 CCX 여러 개로 구성됩니다.

세대코어 아키텍처CCX당 코어 수CCX당 L3 캐시주요 특징

Zen (Ryzen 1000, EPYC Naples)	1세대 Zen	4코어	8MB	CCX 간 L3 캐시 공유 불가
Zen+ (Ryzen 2000, Threadripper 2)	개선된 Zen	4코어	8MB	더 낮은 레이턴시
Zen 2 (Ryzen 3000, EPYC Rome)	완전한 칩렛 설계	4코어	16MB	CCX 2개가 1 CCD를 형성
Zen 3 (Ryzen 5000, EPYC Milan)	통합된 CCX	8코어	32MB	CCX 구조가 CCD 단위로 통합됨

2. CCX 구조와 동작 방식

✅ CCX(Core Complex)의 역할

각 CCX는 최대 4개의 CPU 코어를 포함하며, 각 코어는 개별적인 L1 및 L2 캐시를 가짐.
CCX 내부의 코어들은 동일한 L3 캐시(Shared L3 Cache)를 공유함.
여러 개의 CCX가 결합하여 하나의 **CCD(Core Complex Die)**를 구성.

✅ CCX 간 통신 (Infinity Fabric)

CCX 간 데이터 교환은 AMD의 Infinity Fabric 인터커넥트를 통해 이루어짐.
Zen 및 Zen+에서는 CCX 간 L3 캐시 공유가 불가능하여 높은 레이턴시가 발생.
Zen 2부터 CCX 간 통신 성능이 개선되었지만, 여전히 CCX 간 이동하는 데이터는 **추가적인 지연 시간(Penalty)**이 발생함.

✅ Zen 3에서의 CCX 변경

기존 Zen 2까지는 4코어 + 16MB L3 캐시 구조의 CCX가 사용되었으나, Zen 3에서는 하나의 CCX가 최대 8코어 + 32MB L3 캐시를 지원함.
Zen 3의 변화로 인해 CCX 내 모든 코어가 단일 L3 캐시 풀을 공유하게 되어, 코어 간 통신 지연이 감소함.

3. AMD CCX의 장점과 단점

🔹 장점

✅ 칩렛 기반 모듈형 확장성

여러 CCX를 조합하여 높은 코어 수를 갖춘 프로세서를 쉽게 제조 가능.
EPYC 서버용 CPU에서 CCX 단위로 코어를 할당하여 유연한 구성이 가능.

✅ 전력 효율성 증가

각 CCX의 전력 소비를 독립적으로 조정할 수 있어, 저전력 모드에서 효율적인 성능 제공.

✅ 캐시 공유로 인한 성능 향상 (Zen 3 이후)

CCX 내 코어가 더 큰 L3 캐시를 공유하여 데이터 접근 속도가 향상됨.
특히 게임 성능 개선에 유리함.

🔻 단점

❌ CCX 간 데이터 이동 시 레이턴시 증가 (Zen 2 이전)

CCX 간 통신이 필요할 경우 Infinity Fabric을 거쳐야 하므로 지연 시간이 발생.
이로 인해 CCX 간 데이터를 주고받는 게임 및 일부 애플리케이션에서 성능 저하가 나타날 수 있음.

❌ 멀티스레딩(MT) 성능 저하 가능성 (Zen 2 이전)

CCX 구조로 인해 멀티코어 워크로드가 여러 CCX에 걸쳐 실행될 경우, 스케줄링 오버헤드가 발생.

❌ Infinity Fabric 클럭 속도에 따라 성능 변화

메모리 속도가 낮으면 Infinity Fabric(FCLK) 클럭 속도도 낮아져 성능 저하 발생.

4. CCX 기반 AMD CPU 성능 최적화

1️⃣ 게임 성능 최적화

CCX 간 데이터 이동을 최소화하기 위해 게임 스레드를 동일한 CCX 내에서 실행하면 성능이 향상됨.
Zen 3에서는 CCX가 8코어 단위로 통합되어 성능 저하 문제가 개선됨.

2️⃣ 메모리 및 Infinity Fabric 동기화

Infinity Fabric(FCLK)와 메모리 클럭(MCLK)을 1:1로 맞추면 성능 최적화 가능.
- 예: DDR4-3600MHz → FCLK 1800MHz 설정
낮은 FCLK를 사용할 경우 Infinity Fabric을 통한 CCX 간 통신 속도가 느려짐.

3️⃣ BIOS에서 CCX 단위 코어 오버클럭 설정

Ryzen Master 유틸리티를 사용하면 각 CCX 단위로 코어 클럭을 조정 가능.
최고 성능을 내는 CCX만 오버클럭하면 전력 대비 성능 최적화 가능.

5. 결론: CCX는 AMD의 확장성과 성능 최적화를 위한 핵심 기술

✅ Zen 3에서의 CCX 통합으로 인한 변화

이전 세대(Zen 2)에서는 4코어 단위의 CCX 구조였으나, Zen 3에서는 8코어 단위로 통합되어 코어 간 L3 캐시 공유 및 레이턴시 개선.
게임 및 멀티코어 성능 향상이 두드러짐.

✅ 향후 AMD CCX 발전 방향 (Zen 4, Zen 5)

Zen 4(Ryzen 7000, EPYC Genoa)에서는 5nm 공정 + DDR5 + PCIe 5.0을 지원하며, 기존의 CCX 구조보다 더 발전된 설계를 적용.
Zen 5에서는 L4 캐시 도입 가능성 및 완전한 칩렛 통합 가능성이 제기됨.

💡 결론:
AMD CCX 아키텍처는 Ryzen 및 EPYC 프로세서의 확장성과 성능을 결정하는 중요한 요소입니다. Zen 3에서 CCX 통합을 통해 게임 성능과 멀티코어 성능이 크게 향상되었으며, 향후 Zen 4, Zen 5에서도 CCX 구조의 지속적인 발전이 기대됩니다. 🚀

728x90

'IT 정보' 카테고리의 다른 글

vRAN 시장 규모 (0)	2025.03.16
Real-Time Scheduling in 5G Networks (0)	2025.03.15
Intra-Pod 유연성 (Intra-Pod Flexibility) (0)	2025.03.15
Inter-Pod 유연성 (Inter-Pod Flexibility) (0)	2025.03.15
모든 종류의 이모지 (0)	2025.03.15

mango

AMD CCX (Core Complex) 아키텍처란?