#NVIDIA

NVIDIA 코드 데이터셋 파이프라인 구축 실습

이번 튜토리얼에서는 대규모 코드 사전학습 연구를 위해 NVIDIA의 'Nemotron-Pretraining-Code-v3' 데이터셋 메타데이터를 활용하는 파이프라인을 구축합니다. 데이터를 직접 다운로드하지 않고 스트리밍(Streaming) 방식으로 불러와 언어별 분포와 저장소 구조를 분석하며, 실제 깃허브 소스 코드를 가져와 토큰(Token) 규모를 추정하는 전체 과정을 다룹니다.

데이터셋 nvidia 코드-사전학습

MarkTechPost • 62일 전

IMP 8

엔비디아, 에이전트 RL 훈련 프레임워크 'Polar' 공개

엔비디아가 기존 에이전트 구동부 수정 없이도 강화학습 훈련을 가능하게 하는 롤아웃 프레임워크 'Polar'를 발표했습니다. 이 프레임워크는 API 프록시를 통해 토큰 단위의 상호작용을 캡처하여 완벽한 훈련용 궤적을 재구성하는 것이 특징입니다. 실제 SWE-Bench 테스트에서 Codex, Claude Code 등 다양한 환경의 코딩 성능을 크게 향상시키며 그 효용성을 입증했습니다.

에이전트 강화학습 NVIDIA

MarkTechPost • 80일 전

IMP 8

엔비디아, 러스트를 CUDA PTX로 컴파일하는 백엔드 오픈소스 공개

엔비디아 NVlabs가 Rust 코드를 CUDA GPU용 PTX 코드로 직접 변환해 주는 실험적 컴파일러 백엔드인 'cuda-oxide v0.1.0'을 공개했습니다. 이 도구는 별도의 CUDA 코드 없이 Rust만으로 GPU 커널을 작성할 수 있게 해 주며, cargo 명령어 하나로 호스트와 디바이스 코드의 단일 소스 컴파일을 지원합니다. 이를 통해 Rust의 안정성과 생산성을 그대로 유지하면서도 복잡한 GPU 프로그래밍을 단순화할 수 있어 그래픽스 및 AI 개발자들에게 중요한 의미를 가집니다.

NVIDIA Rust CUDA

Hacker News • 83일 전

IMP 8

Unsloth와 엔비디아, 소비자용 GPU에서 LLM 학습 25% 속도 향상 달성

Unsloth와 NVIDIA는 소비자용 GPU에서 LLM 파인튜닝 시 발생하는 숨겨진 병목 현상을 해결하여 학습 속도를 약 25% 향상시켰습니다. 반복적인 메타데이터 구축을 캐싱하고, 그래디언트 체크포인팅 시 버퍼를 2개 사용해 연산을 겹치게 하며, MoE 라우팅을 최적화하는 세 가지 핵심 기술을 도입했습니다. 이는 개발자들이 기존 하드웨어의 한계를 뛰어넘어 최대치의 성능을 끌어낼 수 있게 해준다는 점에서 실무적으로 매우 중요합니다.

LLM 파인튜닝 GPU 최적화 Unsloth

MarkTechPost • 88일 전

IMP 8

엔비디아, 강화학습에 추론 디코딩 도입해 속도 최대 1.8배 향상

NVIDIA 연구팀이 언어 모델의 강화학습 훈련 루프에 추측적 디코딩(Speculative Decoding)을 통합하여, 모델 출력 분포 손실 없이 롤아웃 생성 속도를 1.8배 향상시키는 기술을 선보였습니다. 이 방식은 기존의 처리량 증가를 위해 훈련 충실도를 희생해야 했던 문제를 해결하여, 모델 성능 저하 없이 완벽한 속도 개선을 이뤄냈다는 점에서 매우 중요합니다.

NVIDIA 강화학습 추측적 디코딩

r/LocalLLaMA • 90일 전

IMP 7

홈랩 16x DGX Spark 클러스터 구축, 뭘 돌려야 할까?

한국 독자를 위해 요약하면, 이 글은 16대의 NVIDIA DGX Spark를 활용해 역대급 규모의 홈랩 AI 클러스터를 구축하는 과정을 담고 있습니다. 통합 2TB 메모리와 200Gbps 고속 스위치로 구성되어 대규모 AI 모델의 분산 학습이나 추론에 활용할 수 있는 중요한 인프라입니다. 내일 오후면 세팅이 완료될 예정으로, 어떤 워크로드를 실행할지 논의를 위해 공유되었습니다.

dgx-spark 클러스터 홈랩

MarkTechPost • 101일 전

IMP 9

NVIDIA, 하이브리드 양자-클래식 시스템용 최초의 오픈소스 양자 AI 모델 'Ising' 공개

NVIDIA가 연구진과 기업이 실질적인 애플리케이션을 구동할 수 있는 양자 프로세서를 구축하도록 돕기 위해 세계 최초의 오픈소스 양자 AI 모델 패밀리인 'NVIDIA Ising'을 출시했습니다. 이 모델은 AI를 활용해 양자 컴퓨팅의 핵심 병목 현상인 하드웨어 교정과 실시간 오류 정정을 자동화하여, 기존 대비 처리 속도는 최대 2.5배, 정확도는 3배 향상시켰습니다. 이미 아이비리그, 국책 연구소, 연세대학교 등을 포함한 수많은 글로벌 기관이 이 기술을 실제 도입하며 양자 컴퓨팅의 실용화를 크게 앞당기고 있습니다.

양자 컴퓨팅 NVIDIA 오픈소스 모델

MarkTechPost • 106일 전

IMP 7

엔비디아 PhysicsNeMo 실전 코딩 튜토리얼

이 글은 구글 Colab 환경에서 NVIDIA PhysicsNeMo를 활용해 물리 기반 머신러닝(Physics-informed ML) 워크플로우를 구축하는 단계별 코딩 튜토리얼입니다. 2D Darcy Flow 문제 데이터를 생성 및 시각화하고, FNO, PINNs 등 핵심 모델을 구현 및 학습하여 대리 모델(Surrogate Model) 기반의 추론 벤치마킹까지 수행하는 실무 과정을 다룹니다.

NVIDIA 물리 기반 머신러닝 PINNs