AI&HPC

AI

Posted On AI, compute, HPC

Computing System: Processor

Derek

2024-09-14

고성능 컴퓨팅(HPC)을 위한 적절한 프로세서 선택 가이드 고성능 컴퓨팅(HPC)을 위한 프로세서를 선택할 때는 각 워크로드에 맞는 CPU 성능을 이해하는 것이 중요합니다. Intel과 AMD는 다양한 용도에…

Continue Reading…: Computing System: Processor
Posted On AI, compute, HPC

Computing System: Concept

Derek

2024-09-11

AI 및 고성능 컴퓨팅(HPC)을 위한 컴퓨팅 시스템(서버) 구조 AI 및 HPC에 최적화된 컴퓨팅 시스템은 간단히 표현하면 ‘서버 시스템’입니다. 성능, 안정성, 확장성을 위해 설계된 여러 주요…

Continue Reading…: Computing System: Concept
Posted On AI, data management, HPC

Data Management: Parallel FileSystem

Derek

2024-08-27

고성능 컴퓨팅(HPC) 및 AI 인프라에서 병렬 파일 시스템은 대규모 데이터 관리와 접근을 효율적으로 수행하는 중요한 요소입니다. 병렬 파일 시스템은 여러 클라이언트가 동시에 데이터를 읽고 쓸…

Continue Reading…: Data Management: Parallel FileSystem
Posted On AI, MLOps, software

MLOps 선택

Derek

2024-08-24

MLOps 솔루션을 선택할 때 고려해야 할 주요 요소는 다음과 같습니다: 이러한 요소들을 고려하면 조직의 목표, 기술적 요구사항, 성장 가능성에 부합하는 MLOps 플랫폼을 선택할 수 있습니다.…

Continue Reading…: MLOps 선택
Posted On AI, network

Interconnect: Ethernet vs. Infiniband

Derek

2024-08-23

AI 인프라에서 네트워킹은 시스템 성능을 결정하는 중요한 요소입니다. 특히 여러 노드나 GPU를 확장할 때 네트워크 성능이 매우 중요합니다. 이 분야에서 주로 비교되는 네트워킹 기술은 이더넷(Ethernet)과…

Continue Reading…: Interconnect: Ethernet vs. Infiniband
Posted On AI, compute

AMD GPU: MI Series

Derek

2024-08-23

AMD의 AI 목적 GPU 라인업은 특히 MI200 시리즈와 MI300 시리즈로 잘 알려져 있으며, AI 및 고성능 컴퓨팅(HPC) 작업에 최적화되어 있습니다. 주요 GPU와 OAM(Open Accelerator Module)…

Continue Reading…: AMD GPU: MI Series
Posted On AI, data management, HPC, network

RDMA2GDS:#1 RDMA 기반 성능향상

HyunWook Jeon

2024-08-21

본 시리즈의 1편은 RDMA를 사용하면 성능이 좋아지는 이유를 폰 노이만 아키텍처를 통해 설명합니다. 컴퓨터 아키텍처의 기본 원리 중 하나는 폰 노이만(Von Neumann) 아키텍처입니다. 이 아키텍처는…

Continue Reading…: RDMA2GDS:#1 RDMA 기반 성능향상
Posted On AI, compute, HPC

Supercomputer?

Derek

2024-08-20

슈퍼컴퓨터는 일반적인 컴퓨터의 능력을 훨씬 뛰어넘는 매우 고급화된 계산 장치로, 매우 빠르고 복잡한 계산을 수행하기 위해 설계되었습니다. 슈퍼컴퓨터는 과학적 시뮬레이션, 기후 모델링, 물리학 연구, 분자…

Continue Reading…: Supercomputer?
Posted On AI, HPC, software, system software

AI/HPC Infra Management Software

Derek

2024-08-20

클러스터 관리 도구는 여러 대의 서버(노드)로 구성된 컴퓨팅 클러스터를 효과적으로 운영, 관리, 모니터링하기 위한 소프트웨어 도구입니다. 클러스터는 보통 대규모 컴퓨팅 작업을 수행하기 위해 여러 서버를…

Continue Reading…: AI/HPC Infra Management Software
Posted On AI, HPC

AI/HPC 인프라의 표준 구조

Derek

2024-08-18

AI 및 고성능 컴퓨팅(HPC) 인프라는 다양한 규모와 목적에 맞추어 최적화된 시스템을 제공하기 위해 고도로 구조화된 표준 인프라 아키텍처를 따릅니다. 이 인프라는 주로 다음과 같은 네…

Continue Reading…: AI/HPC 인프라의 표준 구조

Categories

Featured Post