#C++

C++ 비대칭 펜스(Asymmetric Fences)의 내부 원리

C++ 동시성 제어에서 드물게 실행되는 경로의 동기화 비용을 늘리는 대신, 빈번하게 실행되는 경로의 오버헤드를 줄여 전체 성능을 최적화하는 '비대칭 펜스(Asymmetric Fences)'의 개념과 작동 원리를 설명합니다. 이 기법은 스레드 풀, RCU 등 고성능 동시성 라이브러리에서 시스템 성능을 극대화하기 위해 활발히 사용되고 있습니다.

C++ 동시성 메모리모델

Hacker News • 44일 전

IMP 7

해커뉴스: AI 없이 순수 C++로 레이 트레이서를 처음부터 직접 구현했습니다

C++20을 기반으로 외부 종속성 없이 처음부터 직접 구현한 'Luz'라는 고성능 몬테카를로 패스 트레이서(Monte Carlo Path Tracer) 프로젝트가 해커뉴스에 공개되었습니다. 이 프로젝트는 글로벌 일루미네이션, BVH 가속, 적응형 샘플링, 노이즈 제거(Denoising) 등 상용 렌더러에 필적하는 고급 기능들을 제공하며, 블렌더(Blender) 익스포터와 크로스 플랫폼 빌드를 지원합니다. AI의 코드 생성 능력에 의존하지 않고 개발자의 순수한 엔지니어링 역량만으로 구현되었다는 점이 그래픽스 및 시스템 프로그래밍 실무자들에게 큰 인상을 주고 있습니다.

C++ 레이 트레이싱 그래픽스

Hacker News • 60일 전

IMP 8

C++와 CUDA로 구현하는 고성능 LLM 추론 엔진

인기 있는 LLM 추론 프레임워크인 vLLM의 경량화된 버전인 tiny-vLLm을 C++와 CUDA를 사용해 밑바닥부터 직접 구현해 보는 오픈소스 프로젝트 및 강의 자료입니다. 모델 가중치 로딩부터 PagedAttention, 연속 배치(Continuous Batching) 등 실제 운영 환경에서 필요한 핵심 기술들을 직관적으로 학습할 수 있습니다. 개발자와 강사 모두가 LLM의 작동 원리와 추론 서버 구축 과정을 깊이 있게 이해하는 데 매우 유용한 자료입니다.

오픈소스 LLM 추론 vLLM

Hacker News • 112일 전

IMP 7

테일슬레이어: RAM 읽기 꼬리 지연 시간 감소 라이브러리

테일슬레이어(Tailslayer)는 DRAM 리프레시(refresh) 지연으로 인해 발생하는 RAM 읽기의 꼬리 지연 시간(tail latency)을 줄여주는 C++ 라이브러리입니다. 이 라이브러리는 여러 독립적인 DRAM 채널에 데이터를 복제하고, 가장 먼저 응답하는 결과를 활용하는 헤지드 리드(hedged read) 방식을 사용합니다. 이를 통해 실무자들은 시스템의 메모리 읽기 지연과 관련된 성능 병목을 해결할 수 있어 매우 중요합니다.

오픈소스 C++ 메모리 최적화