Computing System: Processor

Computing System: Processor

고성능 컴퓨팅(HPC)을 위한 적절한 프로세서 선택 가이드

고성능 컴퓨팅(HPC)을 위한 프로세서를 선택할 때는 각 워크로드에 맞는 CPU 성능을 이해하는 것이 중요합니다. Intel과 AMD는 다양한 용도에 맞는 프로세서를 정기적으로 출시하고 있지만, HPC의 경우에는 워크로드와 소프트웨어 라이선스 비용이 전체 인프라 비용에 어떻게 영향을 미치는지를 이해하는 것이 필수입니다. 다음은 최적의 선택을 할 수 있도록 돕는 가이드입니다.

1. 워크로드에 따른 프로세서 선택

HPC 워크로드는 크게 두 가지로 나눌 수 있습니다:

  • 오픈소스(라이선스 무료) 소프트웨어 워크로드: 라이선스 비용 없이 실행할 수 있으며, 하드웨어의 전체 성능에 맞게 확장할 수 있습니다.
  • 상용 소프트웨어 워크로드: 영구 라이선스 또는 연간 구독료를 요구하며, 상당한 비용이 발생합니다.

프로세서를 선택할 때, 실행할 소프트웨어 유형을 이해하는 것이 중요합니다. 이는 코어 수와 클럭 속도 중 어떤 것이 더 중요한지 결정하는 데 큰 영향을 미칩니다.

2. 소프트웨어 라이선스: 가장 중요한 결정 포인트

상용 HPC 애플리케이션의 경우, 소프트웨어 라이선스 비용이 하드웨어 비용보다 훨씬 큰 비중을 차지하는 경우가 많습니다. 이로 인해 고객은 라이선스 비용을 절감하기 위해 하드웨어 구매를 제한하는 경우가 있습니다. 따라서 CPU 선택은 단순한 성능뿐만 아니라, 소프트웨어의 성능을 최적화하여 라이선스 비용을 줄이는 데 중점을 둡니다. 각 워크로드 유형에 맞는 선택 방법은 다음과 같습니다:

3. 오픈소스 기반 워크로드

오픈소스 소프트웨어는 큰 라이선스 비용이 들지 않으므로, 하나의 노드에서 최대 성능을 발휘하는 것이 목표입니다. 이렇게 하면 다음과 같은 인프라 관련 비용을 최소화할 수 있습니다:

  • 운영 체제 라이선스
  • 네트워크 포트 및 연결 비용
  • 메모리 및 스토리지 오버헤드

이러한 워크로드에서는 다음과 같은 CPU를 선택하는 것이 좋습니다:

  • 코어 수가 많은 프로세서 (보통 32코어 이상)
  • 적당한 클럭 속도 (보통 2.0GHz에서 2.8GHz 사이)

이 구성이 노드 하나에서 최대의 소켓 성능을 보장하여, 여러 개의 노드를 추가로 사용할 필요 없이 최고의 컴퓨팅 성능을 얻을 수 있습니다.

4. 상용 소프트웨 기반 워크로드

상용 소프트웨어 워크로드는 라이선스 비용이 CPU 코어 수나 노드 수에 따라 책정되는 경우가 많습니다. 이러한 비용을 최소화하기 위해서는 라이선스 당 최대 생산성을 확보하는 것이 목표입니다. 이를 위해서는 다음과 같은 프로세서를 선택하는 것이 좋습니다:

  • 코어 수가 적은 프로세서 (보통 16코어 이하)
  • 높은 클럭 속도 (보통 2.8GHz에서 5.0GHz 사이)

높은 클럭 속도는 각 코어가 최대 성능을 발휘할 수 있도록 하여, 소프트웨어 라이선스의 성능을 최적화합니다. 이를 통해 노드 수는 증가할 수 있지만, 전체적인 비용은 소프트웨어 라이선스 비용이 지배적인 경우 더 저렴해질 수 있습니다.

5. 주요 고려 사항

HPC용 프로세서를 선택할 때 고려해야 할 사항은 다음과 같습니다:

  • 코어 수와 클럭 속도의 균형: 오픈소스 워크로드에는 코어 수가 많은 프로세서가 유리하고, 상용 소프트웨어에는 클럭 속도가 높은 프로세서가 더 적합합니다.
  • 소프트웨어 라이선스 모델: 라이선스 비용이 중요한 요소인 경우, 소프트웨어 라이선스 당 최대 성능을 발휘하는 CPU를 우선시합니다.
  • 총 인프라 비용: 노드 수를 줄이면서 더 강력한 CPU를 사용하면 네트워크, 운영 체제, 메모리 비용을 절감할 수 있습니다.

6. 프로세서 선택 예시

  • 오픈소스 HPC: AMD EPYC 또는 Intel Xeon Scalable 프로세서로, 32코어 이상의 코어 수와 2.0~2.8GHz 정도의 적당한 클럭 속도를 갖춘 제품이 적합합니다.
  • 상용 소프트웨어 HPC: Intel Xeon 또는 AMD Ryzen 프로세서로, 4~16코어와 2.8~5.0GHz에 해당하는 가능한 가장 높은 클럭 속도를 갖춘 제품이 이상적입니다.

HPC용 프로세서를 선택할 때는 워크로드 요구 사항, 라이선스 비용, 인프라 비용을 고려하여 결정해야 합니다. 오픈소스 워크로드의 경우 코어 수가 많고 클럭 속도가 적당한 프로세서가 비용 효율적이며, 상용 소프트웨어의 경우 클럭 속도가 높은 프로세서를 선택하여 소프트웨어 라이선스의 생산성을 최적화하는 것이 좋습니다.

고성능 컴퓨팅(HPC)에서 하위 프로세서 모델 제외

고성능 컴퓨팅(HPC)에서 CPU의 선택은 워크로드의 효율성과 성능에 중대한 영향을 미칩니다. 동일한 세대의 프로세서라고 하더라도, 하위모델은 L3 캐시 크기나 메모리 속도에서 제한이 있을 수 있습니다. 이러한 제한은 전체 시스템 성능에 큰 영향을 미치기 때문에, 하위 프로세서 모델은 HPC 환경에서는 적합하지 않습니다. 아래에서 그 이유를 구체적으로 설명하겠습니다.

1. L3 캐시의 크기와 성능 영향

프로세서의 L3 캐시는 CPU가 빠르게 데이터를 처리할 수 있도록 도와주는 중요한 요소입니다. L3 캐시는 시스템 메모리(DDR 메모리)보다 훨씬 빠르게 데이터를 전달하며, 프로세서가 처리할 데이터를 보다 가까운 위치에서 사용할 수 있게 합니다. 고성능 컴퓨팅에서는 데이터가 대량으로 처리되며, 이를 효율적으로 처리하기 위해 충분한 캐시 메모리가 필수적입니다.

  • L3 캐시가 작은 프로세서는 CPU가 더 자주 메인 메모리에서 데이터를 가져와야 하므로, 메모리 병목 현상이 발생할 가능성이 높습니다. 이는 계산 속도를 저하시켜 전체 성능에 부정적인 영향을 미칩니다.
  • 특히 HPC 작업은 많은 양의 데이터를 빠르게 처리해야 하므로, 작은 L3 캐시를 가진 프로세서는 반복적인 메모리 접근으로 인해 성능 저하를 일으킬 수 있습니다.

결론적으로, L3 캐시의 크기가 작은 저급 프로세서 모델은 HPC 작업의 연산 속도와 효율성을 크게 제한합니다.

2. 메모리 속도의 중요성

메모리 속도는 프로세서와 메모리 간의 데이터 전송 속도를 의미합니다. 고성능 컴퓨팅 환경에서는 고속 메모리가 필수적이며, 이는 대규모 데이터를 신속하게 처리하는 데 중요한 역할을 합니다.

  • 하위 프로세서 모델은 종종 메모리 속도가 낮거나 메모리 대역폭이 제한적인 경우가 많습니다. 이로 인해 CPU가 데이터를 받아들이고 처리하는 데 시간이 더 오래 걸리게 되어 성능 저하로 이어집니다.
  • HPC 애플리케이션은 주로 병렬 처리 및 대용량 데이터 전송이 필수적이므로, 메모리 속도가 느리면 전체 계산 처리 시간이 길어질 수 있습니다. 이는 HPC 환경에서는 치명적인 성능 저하로 나타납니다.

3. 하위 프로세서의 사용이 HPC에 미치는 영향

고성능 컴퓨팅에서 필요한 것은 고속 처리병렬 연산입니다. 그러나 하위 프로세서 모델은 이러한 요구 사항을 충족하지 못할 수 있습니다. 다음은 하위 프로세서 모델을 사용했을 때 발생할 수 있는 문제들입니다:

  • 메모리 병목 현상: 작은 L3 캐시와 낮은 메모리 속도는 CPU가 메인 메모리에서 데이터를 반복적으로 가져와야 하므로, 병목 현상이 발생할 가능성이 큽니다.
  • 작업 지연: 데이터 접근 시간이 길어지면 고성능 애플리케이션에서 처리 시간이 늘어나 작업이 지연될 수 있습니다.
  • 전체 성능 저하: HPC 작업은 CPU와 메모리의 상호작용이 중요하므로, 작은 L3 캐시와 느린 메모리 속도를 가진 프로세서는 전체 클러스터의 성능을 저하시킬 수 있습니다.

4. HPC에 적합한 프로세서 선택 기준

HPC를 위한 프로세서를 선택할 때는 단순히 같은 세대의 CPU라고 해서 모두가 동일한 성능을 제공하는 것은 아닙니다. 고성능 컴퓨팅을 위해서는 충분한 L3 캐시와 빠른 메모리 속도를 제공하는 고급 프로세서 모델을 선택해야 합니다.

  • 고급 프로세서 모델은 보통 더 큰 L3 캐시더 빠른 메모리 속도를 제공하며, 이는 대량 데이터를 신속하게 처리하고 병목 현상을 줄이는 데 도움이 됩니다.
  • Intel Xeon이나 AMD EPYC 같은 서버급 프로세서는 일반적으로 고성능 컴퓨팅에 적합한 대용량 L3 캐시와 높은 메모리 대역폭을 제공합니다.

하위 프로세서 모델은 동일한 세대의 CPU 라인업에 속하더라도, L3 캐시 크기와 메모리 속도에서 제한을 가지고 있으며, 이는 HPC 작업에 큰 영향을 미칩니다. HPC는 대규모 데이터와 복잡한 계산을 효율적으로 처리해야 하기 때문에, 충분한 L3 캐시와 빠른 메모리 속도를 제공하는 고급 프로세서를 선택하는 것이 중요합니다. 그렇지 않으면 메모리 병목 현상과 처리 지연으로 인해 전체 성능이 저하될 수 있습니다.

Intel Xeon Processors

Xeon MAX (Gen 6) https://www.intel.com/content/www/us/en/products/details/processors/xeon/max-series/products.html

Xeon ScalableGen 5 https://ark.intel.com/content/www/us/en/ark/products/series/236644/5th-gen-intel-xeon-scalable-processors.html#@Server

Xeon Scalable Gen 4 https://www.intel.com/content/www/us/en/products/docs/processors/xeon-accelerated/4th-gen-xeon-scalable-processors.html

AMD EPYC Processors

AMD EPYC Gen 4 https://www.amd.com/en/products/processors/server/epyc/4th-generation-9004-and-8004-series.html#specs

AMD EPYC Gen 4 https://www.amd.com/en/products/processors/server/epyc/7003-series.html

Derek Avatar