메뉴

#엔비디아

TD
The Decoder 18시간 전
IMP 8

마이크로소프트·엔비디아, 코파일럿 대신 실제 작동하는 AI 에이전트 PC 개발

마이크로소프트와 엔비디아가 윈도우 운영체제의 메인 프로세서로 엔비디아 칩을 탑재한 차세대 AI PC를 공동 개발하고 있습니다. 이번 프로젝트는 기존의 단순한 코파일럿 연동을 넘어, 오픈클로(OpenClaw) 프레임워크를 활용해 로컬 환경에서 실제 업무 워크플로우를 처리할 수 있는 AI 에이전트를 내장하는 것을 목표로 합니다. 이는 PC 시장의 판도를 바꾸고 사용자의 업무 생산성을 직접적으로 혁신할 중요한 시도로 평가받습니다.

엔비디아 마이크로소프트 AI PC
MP
MarkTechPost 1일 전
IMP 7

엔비디아, GOLD 모델 대폭 능가하는 새 지식 증류 기술 공개

엔비디아가 서로 다른 토크나이저를 사용하는 언어 모델 간의 지식 증류(KD) 효율을 극대화하는 'X-Token' 기술을 소개했습니다. 이 기술은 기존 방식인 GOLD의 구조적 한계를 극복하여 Llama-3.2-1B 모델 평가에서 평균 3.82포인트 높은 성능을 기록했습니다. 특히 수학 추론 벤치마크인 GSM8k에서 정확도를 2.56에서 15.54로 약 6배 이상 획기적으로 끌어올렸습니다.

엔비디아 지식 증류 대형 언어 모델
TC
TechCrunch AI 1일 전
IMP 7

엔비디아 200억 달러 인재 영입 후, AI 칩 스타트업 Groq 6억5천만 달러 유치

엔비디아와 200억 달러 규모의 실질적인 인수 및 인재 영입 계약을 맺은 AI 칩 스타트업 Groq가 자체 칩 기반의 추론 클라우드 사업 확장을 위해 6억 5천만 달러(약 8,900억 원)의 새로운 자금 조달을 진행 중입니다. 이번 자금 조달은 기존 투자자들을 대상으로 진행되며, 인공지능 산업에서 모델 학습보다 추론 처리의 수요가 폭발적으로 증가하는 가운데 회사의 사업 방향성을 공고히 하는 데 중요한 역할을 합니다.

AI 칩 엔비디아 자금 조달
TC
TechCrunch AI 1일 전
IMP 8

엔비디아와 200억 달러 규모 계약 맺은 AI 반도체 스타트업 그록(Groq), 6억 5천만 달러 유치 보도

AI 추론(inference) 특화 반도체 스타트업 그록(Groq)이 기존 투자자들을 대상으로 6억 5천만 달러(약 8,800억 원) 규모의 새로운 펀딩을 유치 중입니다. 지난해 12월 엔비디아와 핵심 인력 영입 및 하드웨어 기술 라이선스를 포함하는 200억 달러 규모의 '사실상의 인수(not-acqui-hire)' 계약을 체결하며 자금력을 확보한 바 있습니다. 이번 펀딩은 엔비디아의 인수를 피하면서도 막대한 현금을 확보한 그록이 자체 AI 칩 기반의 '추론 클라우드(neocloud)' 비즈니스를 본격적으로 확장하기 위해 추진되는 것으로 업계의 높은 관심을 끌고 있습니다.

AI 반도체 엔비디아 스타트업 투자
TD
The Decoder 3일 전
IMP 8

AI 붐, 엔비디아 대만 연간 지출 10배 확대

AI 수요 폭발로 인해 엔비디아의 대만 공급망(TSMC 등) 연간 지출액이 3~4년 전 100~150억 달러에서 최대 1,500억 달러로 급증했습니다. 엔비디아는 2030년 완공을 목표로 대만 직원 수를 4배로 늘리고 새로운 캠퍼스를 건설할 계획이며, 경쟁사 AMD 역시 선진 패키징 공정 확보를 위해 대만에 100억 달러 이상을 투자하며 반도체 공급망 경쟁이 한창입니다.

엔비디아 TSMC AI 반도체
HN
Hacker News 6일 전
IMP 9

AI 반도체 부품 원가, 메모리 비중 63% 육박

AI 반도체 부품 전체 지출에서 고대역폭 메모리(HBM)가 차지하는 비중이 52%에서 63%로 급증하며 핵심 비용 요소로 자리 잡았습니다. 엔비디아, AMD, 구글, 아마존 4개사의 HBM 지출은 2024년 약 120억 달러에서 2025년 320억 달러로 폭증하여 다른 어떤 부품보다 가장 빠른 증가율을 기록했습니다. 반면 어드밴스드 패키징 및 보조 부품 비용 비중은 하락해 메모리 확보가 AI 칩 산업 경쟁력의 핵심으로 부상했습니다.

AI 반도체 HBM 엔비디아
TC
TechCrunch AI 10일 전
IMP 9

엔비디아, 사상 최대 실적 달성...비상장 스타트업 투자 430억 달러

엔비디아가 데이터센터 매출 호조를 바탕으로 816억 달러의 또 다른 사상 최대 분기 매출을 기록했습니다. 특히 분기 중 비상장 기업에 대한 투자 지분이 약 두 배로 급증하며 430억 달러에 달해, 오픈AI 및 앤스로픽 등 AI 생태계 전반에 걸친 지배력 확대를 시도하고 있습니다. 이는 엔비디아가 단순한 하드웨어 공급자를 넘어 핵심 AI 기업들의 주요 투자자로 자리매김하고 있음을 보여줍니다.

엔비디아 재무결과 AI 투자
MP
MarkTechPost 11일 전
IMP 8

엔비디아, Qwen3-8B 대비 6배 빠른 트리모드 언어모델 공개

엔비디아가 기존 오픈소스 모델인 Qwen3-8B보다 한 번의 연산(Forward pass)당 6배 많은 토큰을 처리하는 새로운 트리모드 언어 모델 'Nemotron-Labs-Diffusion'을 발표했습니다. 이 모델은 텍스트, 코드, 이미지 생성 등 다양한 생성(AI) 작업을 단일 모델에서 처리할 수 있도록 설계되었습니다. 이는 AI 모델의 연산 효율성을 획기적으로 끌어올리며, 실시간 처리와 대규모 배포가 필요한 실무 환경에서 매우 중요한 기술적 진전으로 평가됩니다.

엔비디아 언어모델 오픈소스
LL
r/LocalLLaMA 16일 전
IMP 8

GDDR7 가격 상승 여파, 엔비디아 RTX 5090 인상 준비

GDDR7 메모리 공급 부족 및 가격 상승으로 인해 엔비디아가 AIC(애드인 카드) 파트너사에 공급하는 RTX 5090 및 5090D V2 GPU의 가격을 약 300달러 인상할 예정입니다. 이 증가된 원가 부담은 결국 소비자 체감가로 이어져 그래픽 카드의 최종 판매가가 더욱 치솟을 것으로 보입니다. 현재 서방 국가 리테일 시장에서는 이미 출고가(MSRP)의 두 배 이상에 거래되고 있어, 그래픽 카드 수급 및 가격 경색이 심화될 전망입니다.

엔비디아 그래픽카드 GDDR7
TD
The Decoder 16일 전
IMP 8

바이트댄스 등 中기업, 美AI칩 수출 허가 받고도 수입 거부

미국이 알리바바, 텐센트, 바이트댄스 등 약 10개 중국 기업에 엔비디아 H200 AI 칩 구매 허가를 내렸으나 단 한 개의 칩도 수입되지 않았습니다. 중국 정부가 자국 반도체 산업 보호 및 대미 의존도 탈피를 위해 이들의 구매를 막고 있기 때문입니다. 이는 중국이 AI 인프라 자립을 미국 AI 모델 개발만큼 중요하게 여기고 있음을 시사합니다.

미중관계 수출통제 엔비디아
TD
The Decoder 19일 전
IMP 8

엔비디아, 2026년 AI 파트너사에 400억 달러 투자

엔비디아가 2025년 한 해 동안 AI 기업들에 400억 달러 이상을 투자하며 업계 최대 규모의 후원자로 자리매김했습니다. 가장 큰 비중은 OpenAI에 투자한 300억 달러이며, 최근에는 데이터센터 운영사인 IREN과 광섬유 전문기업 코닝(Corning)에도 대규모 투자 권리를 확보했습니다. 젠슨 황 CEO는 특정 기업을 지목하기보다 모든 파운데이션 모델 기업을 지원하겠다고 밝혔으나, 일각에서는 엔비디아 자사 GPU 매출을 견인하기 위한 순환 투자라는 지적도 나오고 있습니다.

엔비디아 AI 투자 오픈AI
MP
MarkTechPost 20일 전
IMP 8

사카나 AI·엔비디아, LLM 최대 21.9% 속도 향상 기술 공개

사카나 AI와 엔비디아 연구진은 L1 정규화를 적용해 피드포워드 레이어의 99% 이상을 희소화(Sparsity)하면서도 모델 성능 저하를 최소화하는 기법을 선보였습니다. 이를 새로운 희소 데이터 포맷과 융합된 CUDA 커널(CUDA Kernels)을 통해 실제 GPU 처리량 향상으로 연결하여, LLM의 학습 속도를 최대 21.9%, 추론 속도를 20.5% 각각 향상시켰습니다.

최적화 희소화 사카나 AI
MP
MarkTechPost 21일 전
IMP 8

엔비디아, 12B~30B 크기 자유자재로 조절되는 '스타 일래스틱' 출시

엔비디아가 단 하나의 체크포인트(Checkpoint)에서 120억(12B), 230억(23B), 300억(30B) 파라미터 크기의 추론(Reasoning) 모델을 자유롭게 추출할 수 있는 '스타 일래스틱(Star Elastic)'을 공개했습니다. 제로샷 슬라이싱(Zero-Shot Slicing) 기술을 적용하여 모델을 처음부터 다시 학습할 필요 없이, 필요에 따라 즉각적으로 모델의 크기를 조절해 배포할 수 있다는 점이 가장 큰 특징입니다. 이는 다양한 하드웨어 환경과 예산에 맞춰 AI 모델을 유연하고 효율적으로 운영해야 하는 실무자들에게 배포 비용과 저장 공간을 혁신적으로 절감할 수 있는 중요한 돌파구가 될 것입니다.

엔비디아 스타일래스틱 제로샷슬라이싱
TC
TechCrunch AI 21일 전
IMP 8

엔비디아, 2026년 AI 지분투자에 400억 달러 확정

엔비디아가 2026년 초반에만 AI 기업 지분 투자에 400억 달러 이상을 확정 지으며 AI 생태계의 핵심 투자자로서의 입지를 다지고 있습니다. 이 중 300억 달러는 OpenAI에 대한 대규모 단일 투자에서 비롯되었으며, 코닝(Corning) 및 데이터센터 운영사 IREN 등 상장사들에도 수십억 달러 규모의 투자를 단행했습니다. 고객사에 대한 순환 투자라는 비판에도 불구하고, 엔비디아는 이러한 전략을 통해 장기적인 경쟁 우위인 '해자(Moat)'를 구축하고 있습니다.

엔비디아 인공지능 벤처투자
TC
TechCrunch AI 25일 전
IMP 8

일레븐랩스, 블랙록·엔비디아 등 투자 유치

음성 AI 스타트업 일레븐랩스(ElevenLabs)가 5억 달러 규모의 시리즈 D 투자를 완료하며, 블랙록, 엔비디아, 세일즈포스 등을 새로운 투자자로 영입했습니다. 이번 자금 조달과 함께 회사의 연간 반복 수익(ARR)은 5억 달러를 돌파했으며, 기업 가치 역시 110억 달러로 급상승하며 업계 최강자로서의 입지를 확고히 했습니다.

음성 AI 일레븐랩스 투자 유치
TD
The Decoder 26일 전
IMP 8

AI 칩스타트업 세레브라스, 2차 IPO로 400억 달러估值(몸값) 도전

AI 칩 제조업체 세레브라스 시스템스(Cerebras Systems)가 두 번째 기업공개(IPO)에 나서며 400억 달러의 기업가치를 목표로 하고 있습니다. 이번 IPO를 통해 최대 40억 달러를 조달할 것으로 보이며, 티커 심볼 'CBRS'로 나스닥에 상장될 예정입니다. 엔비디아(Nvidia)와 직접 경쟁하는 이 회사는 2025년 첫 흑자 전환을 기록하며 시장에서의 성장세를 입증했습니다.

AI 반도체 IPO 세레브라스
TD
The Decoder 29일 전
IMP 7

엔비디아 황재승, "AI 일자리 대량 실직 예언은 신 콤플렉스"

엔비디아의 젠슨 황(Jensen Huang) CEO가 AI로 인한 대규모 일자리 감소를 경솔하게 예측하는 일부 기술 업계 리더들을 강도 높게 비판했습니다. 그는 이러한 발언이 사회에 실질적인 해를 끼칠 수 있다고 경고하며, 방사선과 의사의 사례를 통해 AI가 도입되더라도 일자리가 사라지지 않는 이유를 설명했습니다. 또한 AI가 실제로 수십만 개의 일자리를 창출했으며, 엔비디아 역시 최고조의 엔지니어 채용을 진행 중이라고 덧붙였습니다.

젠슨 황 일자리 대체 AI 리스크
TC
TechCrunch AI 29일 전
IMP 8

미 국방부, 엔비디아·MS·AWS와 기밀망 AI 도입 계약

미 국방부가 엔비디아, 마이크로소프트(MS), 아마존 웹 서비스(AWS), 리플렉션 AI와 계약을 체결하고 이들의 AI 기술과 모델을 군사 기밀 네트워크에 도입합니다. 이는 앤스로픽과의 사용 조건 갈등 이후, 특정 기업에 대한 의존도를 낮추고 AI 공급망을 다각화하려는 국방부의 전략적 조치로 풀이됩니다. 이번 계약을 통해 도입된 AI는 최고 수준의 보안 환경(IL6, IL7)에 배치되어 전장 상황 인지 및 작전 결정 보조 등 군 작전의 핵심 역량으로 활용될 예정입니다.

미 국방부 엔비디아 기밀 네트워크
AI
r/artificial 29일 전
IMP 8

엔비디아 "AI 일자리 50만 개 창출", 中 "AI 해고 전면 금지"

엔비디아 CEO가 최근 2년간 AI가 50만 개의 새로운 일자리를 창출했다고 밝힌 가운데, 중국 정부는 기업의 AI 도입을 이유로 한 인력 감축을 전면 금지하는 파격적인 정책을 내놓았습니다. 전 세계적으로 AI의 경제적 이익 창출과 기존 노동자들의 일자리 대체 문제가 극명한 대립각을 세우고 있어 각국의 정책 대응이 주요 실무적 관심사로 떠오르고 있습니다.

인공지능 일자리 엔비디아 중국 AI 정책
TD
The Decoder 32일 전
IMP 9

엔비디아 네모트론 3 나노 옴니 공개

엔비디아가 텍스트, 이미지, 비디오, 오디오를 동시에 처리하는 오픈소스 멀티모달 모델 '네모트론 3 나노 옴니(Nemotron 3 Nano Omni)'를 공개했습니다. 이 모델은 경쟁사 모델(Qwen, GPT 등)에서 생성한 합성 데이터와 자체 오디오 데이터셋을 포함한 7,170억 개의 토큰으로 학습되었으며, 에이전트 애플리케이션에 최적화되어 상업적 사용이 가능합니다. 가장 주목할 점은 모델 가중치뿐만 아니라 학습 데이터, 파이프라인, 강화 학습 레시피까지 투명하게 공개하여 오픈소스 생태계에 큰 의미를 갖는다는 것입니다.

엔비디아 멀티모달 오픈소스
AI
r/artificial 32일 전
IMP 8

엔비디아 임원 "AI 연산비, 인건비보다 훨씬 비싸다"

최근 빅테크 기업들이 대규모 투자에도 불구하고 AI 도입 비용이 인건비를 훨씬 상회하고 있어 경제성 논란이 일고 있습니다. MIT 연구에 따르면 현재 기술 수준에서 AI 자동화가 인력보다 비용 효율적인 직무는 23%에 불과한 것으로 나타났습니다. 기업들은 비용 절감보다는 보완재로서 AI를 재평가하며, 단기적인 비용 불균형 속에서도 미래 경쟁력 확보를 위해 막대한 자본을 쏟아붓고 있습니다.

AI 비용 노동 대체 빅테크 투자
LL
r/LocalLLaMA 32일 전
IMP 7

엔비디아 새 추론 모델 '네모트론' 유출?

레딧(Reddit)에 엔비디아의 새로운 AI 모델로 추정되는 'Nemotron-3-Nano-Omni-30B-A3B-Reasoning'의 추론 템플릿 코드가 유출되었습니다. 이 코드는 사용자의 프롬프트에 따라 모델의 '생각(Thinking)' 기능을 켜고 끌 수 있는 고급 추론 제어 시스템을 포함하고 있어, 엔비디아가 강력한 오픈소스 추론 모델을 준비하고 있음을 시사합니다.

인공지능 모델 엔비디아 추론 모델
OA
r/OpenAI 37일 전
IMP 9

오픈AI, GPT-5.5 '스퍼드' 모델 공개

오픈AI가 경쟁사 앤스로픽의 신모델 발표 직후 일주일 만에 코딩 및 복잡한 워크플로우 처리 능력을 강화한 GPT-5.5(Spud)를 공개했습니다. 이 모델은 최소한의 사용자 개입만으로도 다단계 작업을 훨씬 더 자율적으로 수행할 수 있도록 설계되었습니다. 엔비디아의 최신 칩셋과 결합하여 성능은 높이면서도 토큰당 운영 비용을 최대 35배까지 절감할 수 있어, 오픈AI가 집중하고 있는 B2B 기업 시장 공략에 강력한 무기가 될 전망입니다.

오픈AI GPT-5.5 에이전트
TC
TechCrunch AI 38일 전
IMP 8

구글, 엔비디아 겨냥해 AI 반도체 2종 새롭게 출시

구글 클라우드가 8세대 커스텀 AI 칩(TPU)을 AI 모델 학습용(TPU 8t)과 추론용(TPU 8i) 두 가지로 세분화하여 출시했습니다. 신형 칩은 이전 세대 대비 최대 3배 빠른 학습 속도와 80% 향상된 가성비를 제공하며, 에너지 및 비용 효율성을 크게 높였습니다. 자체 칩을 강화하면서도 구글은 여전히 엔비디아 최신 칩(Vera Rubin)을 지원하고 네트워크 기술을 협업하는 등 보완적인 관계를 유지하고 있습니다.

구글 AI 반도체 TPU
TC
TechCrunch AI 42일 전
IMP 8

AI 칩 스타트업 세레브라스, 상장 신청

AI 반도체 스타트업 세레브라스 시스템즈(Cerebras Systems)가 기업공개(IPO)를 위해 SEC에 상장 신청서를 제출했습니다. 이 회사는 지난해 81억 달러의 기업가치로 11억 달러를 유치하는 등 빠르게 성장하며, 최근에는 아마존 웹 서비스(AWS) 및 오픈AI와 대규모 파트너십을 체결했습니다. 세레브라스는 자사의 칩이 엔비디아를 대체할 수 있는 차세대 AI 학습 및 추론 하드웨어라고 주장하며, 5월 중순을 목표로 상장을 준비하고 있습니다.

세레브라스 IPO AI 반도체
TD
The Decoder 43일 전
IMP 9

자가 개선 AI 스타트업, 설립 4개월만에 5억 달러 유치

설립된 지 4개월밖에 되지 않은 AI 스타트업 Recursive Superintelligence가 40억 달러의 사전 가치 평가액으로 최소 5억 달러의 자금을 조달했습니다. 이번 투자 라운드는 GV(구글 벤처스)가 주도하고 엔비디아가 참여했으며, 인기가 너무 높아 최대 10억 달러까지 모집될 가능성도 열려 있습니다. 전 세일즈포스 수석 과학자 등 쟁쟁한 연구진들로 구성된 이 회사는 인간의 개입 없이 스스로 발전하는 초지능(Superintelligence) AI 시스템 개발을 목표로 하고 있습니다.

AI 투자 초지능 Recursive Superintelligence
TD
The Decoder 44일 전
IMP 8

엔비디아, 단 한 장의 사진으로 3D 환경 구축하는 'Lyra 2.0' 공개

엔비디아 연구진이 단 한 장의 사진만으로 최대 90m 길이의 일관된 3D 환경을 생성하는 시스템 'Lyra 2.0'을 발표했습니다. 이 시스템은 기존 3D 생성 모델들의 고질적인 문제였던 공간 왜곡과 누적 오류를 해결하여 6개의 경쟁 모델을 성능 면에서 압도합니다. 생성된 3D 공간은 엔비디아의 물리 엔진인 Isaac Sim으로 내보내어 실제 데이터 없이도 로봇 훈련을 위한 시뮬레이션 환경으로 즉각 활용할 수 있어 로봇 산업의 훈련 비용과 시간을 혁신적으로 단축할 수 있습니다.

3D 생성 로봇 시뮬레이션 엔비디아
WR
Wired AI 45일 전
IMP 8

AI가 반도체 산업의 가장 큰 진입장벽을 허물다

엔비디아의 아성을 이루는 핵심 무기인 칩 최적화 소프트웨어 생태계를 AI가 대체할 수 있는 가능성이 열렸습니다. Wafer와 같은 스타트업은 AI 모델을 활용해 특정 하드웨어에 맞춘 코드 최적화를 자동화하여, 엔비디아가 아닌 타사 칩의 경쟁력을 획기적으로 높이고 있습니다. 또한 AI가 칩 설계 자체를 혁신함에 따라, 소수 기업이 독점하던 실리콘 시장의 민주화가 가속화될 전망입니다.

엔비디아 칩 최적화 AI 코딩
SG
r/singularity 46일 전
IMP 8

엔비디아 "AI 도입으로 GPU 설계 10개월 업무, 하루 만에 처리"

엔비디아는 칩 설계 과정 전반에 AI를 도입하여 설계 시간을 획기적으로 단축했다고 밝혔습니다. 특히 8명의 엔지니어가 10개월 걸리던 표준 셀 라이브러리 포팅 작업을 단일 GPU로 하룻밤 만에 끝낼 수 있게 되었습니다. 그러나 윌리엄 달리 수석 과학자는 완전한 무인 칩 설계에는 아직 멀었으며, 현재는 AI를 보조 및 최적화 도구로 활용해 인간 설계자 이상의 성능을 이끌어내는 단계라고 설명했습니다.

엔비디아 칩 설계 AI 자동화
MP
MarkTechPost 47일 전
IMP 8

엔비디아, 강력한 오픈소스 오디오-언어 모델 공개

엔비디아와 메릴랜드 대학교 연구진이 음성, 환경 소음, 음악 등 오디오 전반을 깊이 있게 이해하고 추론할 수 있는 오픈소스 대규모 오디오-언어 모델 '오디오 플라밍고 넥스트(Audio Flamingo Next, AF-Next)'를 공개했습니다. 기존 이미지-언어 모델에 비해 발전이 더뎠던 오디오 분야의 기술적 한계를 극복한 것이 특징입니다. 이번 연구 성과는 멀티모달 AI의 실제 배포 및 활용 범위를 시각을 넘어 청각 영역으로 획기적으로 확장했다는 점에서 매우 중요합니다.

인공지능 오디오-언어 모델 오픈소스