AI
-
Computing System: Processor
고성능 컴퓨팅(HPC)을 위한 적절한 프로세서 선택 가이드 고성능 컴퓨팅(HPC)을 위한 프로세서를 선택할 때는 각 워크로드에 맞는 CPU 성능을 이해하는 것이 중요합니다. Intel과 AMD는 다양한 용도에…
-
Computing System: Concept
AI 및 고성능 컴퓨팅(HPC)을 위한 컴퓨팅 시스템(서버) 구조 AI 및 HPC에 최적화된 컴퓨팅 시스템은 간단히 표현하면 ‘서버 시스템’입니다. 성능, 안정성, 확장성을 위해 설계된 여러 주요…
-
Data Management: Parallel FileSystem
고성능 컴퓨팅(HPC) 및 AI 인프라에서 병렬 파일 시스템은 대규모 데이터 관리와 접근을 효율적으로 수행하는 중요한 요소입니다. 병렬 파일 시스템은 여러 클라이언트가 동시에 데이터를 읽고 쓸…
-
MLOps 선택
MLOps 솔루션을 선택할 때 고려해야 할 주요 요소는 다음과 같습니다: 이러한 요소들을 고려하면 조직의 목표, 기술적 요구사항, 성장 가능성에 부합하는 MLOps 플랫폼을 선택할 수 있습니다.…
-
Interconnect: Ethernet vs. Infiniband
AI 인프라에서 네트워킹은 시스템 성능을 결정하는 중요한 요소입니다. 특히 여러 노드나 GPU를 확장할 때 네트워크 성능이 매우 중요합니다. 이 분야에서 주로 비교되는 네트워킹 기술은 이더넷(Ethernet)과…
-
AMD GPU: MI Series
AMD의 AI 목적 GPU 라인업은 특히 MI200 시리즈와 MI300 시리즈로 잘 알려져 있으며, AI 및 고성능 컴퓨팅(HPC) 작업에 최적화되어 있습니다. 주요 GPU와 OAM(Open Accelerator Module)…
-
RDMA2GDS:#1 RDMA 기반 성능향상
본 시리즈의 1편은 RDMA를 사용하면 성능이 좋아지는 이유를 폰 노이만 아키텍처를 통해 설명합니다. 컴퓨터 아키텍처의 기본 원리 중 하나는 폰 노이만(Von Neumann) 아키텍처입니다. 이 아키텍처는…
-
Supercomputer?
슈퍼컴퓨터는 일반적인 컴퓨터의 능력을 훨씬 뛰어넘는 매우 고급화된 계산 장치로, 매우 빠르고 복잡한 계산을 수행하기 위해 설계되었습니다. 슈퍼컴퓨터는 과학적 시뮬레이션, 기후 모델링, 물리학 연구, 분자…
-
AI/HPC Infra Management Software
클러스터 관리 도구는 여러 대의 서버(노드)로 구성된 컴퓨팅 클러스터를 효과적으로 운영, 관리, 모니터링하기 위한 소프트웨어 도구입니다. 클러스터는 보통 대규모 컴퓨팅 작업을 수행하기 위해 여러 서버를…
-
AI/HPC 인프라의 표준 구조
AI 및 고성능 컴퓨팅(HPC) 인프라는 다양한 규모와 목적에 맞추어 최적화된 시스템을 제공하기 위해 고도로 구조화된 표준 인프라 아키텍처를 따릅니다. 이 인프라는 주로 다음과 같은 네…