본문으로 이동

매니코어 프로세서

위키백과, 우리 모두의 백과사전.

매니코어 프로세서(manycore processor)는 높은 수준의 병렬 처리를 위해 설계된 특별한 종류의 멀티 코어 프로세서로, 수십 개에서 수천 개 이상의 단순하고 독립적인 프로세서 코어를 포함한다. 매니코어 프로세서는 임베디드 시스템고성능 컴퓨팅 분야에서 광범위하게 사용된다.

멀티코어 아키텍처와의 대조

[편집]

매니코어 프로세서는 멀티 코어 프로세서와 달리 처음부터 높은 수준의 명시적 병렬성과 지연 시간 및 낮은 단일 스레드 성능을 희생하면서도 높은 처리량(또는 낮은 전력 소비)을 위해 최적화되었다.

반면, 광범위한 범주의 멀티 코어 프로세서는 일반적으로 병렬 및 직렬 코드를 모두 효율적으로 실행하도록 설계되었으며, 따라서 높은 단일 스레드 성능에 더 중점을 둔다(예: 비순차적 명령어 처리, 더 깊은 파이프라인, 더 많은 슈퍼스칼라 실행 장치, 더 크고 일반적인 캐시에 더 많은 실리콘을 할당하고 공유 메모리를 사용). 이러한 기술은 단일 스레드에서 내재된 병렬성을 파악하는 데 런타임 자원을 투입한다. 이들은 단일 코어 프로세서에서 (하위 호환성을 유지하며) 지속적으로 발전해 온 시스템에 사용된다. 이들은 일반적으로 '소수의' 코어(예: 2, 4, 8)를 가지며, 이기종 시스템에서 매니코어 가속기(예: GPU)로 보완될 수 있다.

동기

[편집]

캐시 일관성은 멀티코어 프로세서의 확장성을 제한하는 문제이다. 매니코어 프로세서는 메시지 전달[1], 스크래치패드 메모리, DMA[2], 분할 전역 주소 공간[3] 또는 읽기 전용/비일관성 캐시와 같은 방법을 통해 이를 우회할 수 있다. 네트워크 온 칩과 로컬 메모리를 사용하는 매니코어 프로세서는 소프트웨어에게 태스크의 공간적 레이아웃을 명시적으로 최적화할 기회를 제공한다(예: 트루노스를 위해 개발된 툴링에서 볼 수 있듯이).[4]

매니코어 프로세서는 고성능 컴퓨팅에서 유래한 클러스터벡터 프로세서와 같은 기술과 (개념적으로) 더 많은 공통점을 가질 수 있다.[5]

GPU는 여러 셰이더 처리 장치를 가지며, 고도로 병렬적인 코드에만 적합한(높은 처리량, 그러나 매우 낮은 단일 스레드 성능) 매니코어 프로세서의 한 형태로 간주될 수 있다.

프로그래밍 모델

[편집]

매니코어 시스템의 분류

[편집]

특정 매니코어 아키텍처

[편집]

100만 개 이상의 CPU 코어를 가진 특정 매니코어 컴퓨터

[편집]

멀티코어 프로세서로 구축된 많은 컴퓨터들이 100만 개 이상의 개별 CPU 코어를 가지고 있다. 다음은 그 예시이다:

5백만 개 이상의 CPU 코어를 가진 특정 컴퓨터

[편집]

꽤 많은 슈퍼컴퓨터가 5백만 개 이상의 CPU 코어를 가지고 있다. 코프로세서, 예를 들어 GPU가 함께 사용될 경우 해당 코어는 코어 수에 포함되지 않으므로, 더 많은 컴퓨터가 이러한 목표를 달성할 수 있다.

같이 보기

[편집]

각주

[편집]
  1. Mattson, Tim (January 2010). “The Future of Many Core Computing: A tale of two processors” (PDF). 
  2. Hendry, Gilbert; Kretschmann, Mark. “IBM Cell Processor” (PDF). 2022년 6월 15일에 원본 문서 (PDF)에서 보존된 문서. 2025년 8월 1일에 확인함. 
  3. Olofsson, Andreas; Nordström, Tomas; Ul-Abdin, Zain (2014). “Kickstarting High-performance Energy-efficient Manycore Architectures with Epiphany”. arXiv:1412.5538 [cs.AR]. 
  4. Amir, Arnon (2015년 6월 11일). “IBM SyNAPSE Deep Dive Part 3”. IBM Research. 2024년 12월 10일에 원본 문서에서 보존된 문서. 2025년 8월 1일에 확인함. 
  5. “cell architecture”. "The Cell architecture is like nothing we have ever seen in commodity microprocessors, it is closer in design to multiprocessor vector supercomputers"
  6. Rick Merritt (2011년 6월 20일), “OEMs show systems with Intel MIC chips”, 《www.eetimes.com》 (EE Times) 
  7. Barker, J; Bowden, J (2013). 〈Manycore Parallelism through OpenMP〉. 《OpenMP in the Era of Low Power Devices and Accelerators》. IWOMP. Lecture Notes in Computer Science, vol 8122. Springer. doi:10.1007/978-3-642-40698-0_4. 
  8. Morgan, Timothy Prickett (2021년 2월 10일). “A First Peek At China's Sunway Exascale Supercomputer”. 《The Next Platform》 (미국 영어). 2021년 11월 18일에 확인함. 
  9. Hemsoth, Nicole (2021년 4월 19일). “China's Exascale Prototype Supercomputer Tests AI Workloads”. 《The Next Platform》 (미국 영어). 2021년 11월 18일에 확인함. 
  10. Chen, Yu-Hsin; Krishna, Tushar; Emer, Joel; Sze, Vivienne (2016). “Eyeriss: An Energy-Efficient Reconfigurable Accelerator for Deep Convolutional Neural Networks”. 《IEEE International Solid-State Circuits Conference, ISSCC 2016, Digest of Technical Papers》. 262–263쪽. 

외부 링크

[편집]