CODA: 트랜스포머 블록을 GEMM 에필로그 프로그램으로 재작성
AI 모델 학습 시 흔히 발생하는 메모리 병목 현상을 해결하기 위해, 개별적으로 처리되던 연산들을 하나의 GPU 커널(GEMM Epilogue)로 통합하여 성능을 극대화하는 새로운 추상화 기법인 CODA를 제안합니다. 이 방식은 데이터 이동을 최소화하면서도 프레임워크 수준의 생산성과 하드웨어 수준의 극적인 효율성을 동시에 달성할 수 있도록 돕습니다.
AI 모델 학습 시 흔히 발생하는 메모리 병목 현상을 해결하기 위해, 개별적으로 처리되던 연산들을 하나의 GPU 커널(GEMM Epilogue)로 통합하여 성능을 극대화하는 새로운 추상화 기법인 CODA를 제안합니다. 이 방식은 데이터 이동을 최소화하면서도 프레임워크 수준의 생산성과 하드웨어 수준의 극적인 효율성을 동시에 달성할 수 있도록 돕습니다.
AI 개인 비서를 위한 모델과 하드웨어를 개발하는 스타트업 하크(Hark)가 시리즈 A에서 7억 달러(약 9,300억 원)를 유치하며 기업가치 60억 달러를 인정받았습니다. 창업자 브렛 애드콕이 이끄는 이 회사는 디지털 세계와 연결되는 '범용 인터페이스'를 목표로 오는 여름 멀티모달 모델을 공개할 예정입니다. 전례 없는 대규모 자금 유치에도 불구하고 제품의 구체적인 형태는 철저히 비밀에 부쳐져 있어 업계의 높은 관심을 끌고 있습니다.
인텔의 차세대 AI 추론 가속기인 '크레센트 아일랜드(Crescent Island)'의 기판(PCB) 이미지가 최초로 유출되었습니다. 이 장치는 HBM 공급 부족 및 고가 문제를 우회하기 위해 160GB 용량의 LPDDR5X 메모리를 채택했으며, 이는 비용과 전력 효율을 크게 높이는 전략입니다. 새로운 Xe3P 아키텍처를 기반으로 하는 이 가속기는 AI 토큰 서비스 및 공냉식 데이터센터 추론 워크로드에 최적화된 경쟁력 있는 솔루션을 제공할 전망입니다.
국내 스타트업 레틴아르(LetinAR)는 AI 스마트 글래스스의 핵심인 초소형, 저전력 광학 모듈 'PinTILT' 기술을 개발하여 업계의 주목을 받고 있습니다. 이 기술은 기존 방식의 단점을 극복해 일반 안경처럼 얇고 가벼우면서도 선명한 화면을 구현할 수 있게 해줍니다. 2027년 국내 상장을 준비하며 대규모 자금을 유치한 이 회사는 글로벌 빅테크들이 주도하는 차세대 AI 기기 플랫폼 경쟁에서 핵심 부품 공급자로 자리매김할 계획입니다.
AI 및 고속 네트워킹 시대의 핵심 기술인 공장광학(Co-Packaged Optics, CPO)의 기술 개념과 공급망 병목 현상을 분석한 글입니다. 기존 플러그형 광 트랜시버의 한계를 극복하고 전력 소모를 절반으로 줄이며 대역폭 밀도를 극대화하는 CPO 기술이 필수적인 이유를 설명합니다. 더불어 소재부터 최첨단 패키징까지 전 세계 CPO 공급망을 장악하고 있는 핵심 기업들을 상세히 짚어줍니다.
오픈AI가 전통적인 앱 없이 AI 에이전트가 사용자의 작업을 처리하는 자체 스마트폰을 개발하고 있습니다. 애널리스트 밍치궈에 따르면 미디어텍과 퀄컴 칩을 탑재하며, 2027년 상반기 양산이 가능할 것으로 보입니다. 기존 혁신적인 AI 하드웨어의 한계를 인정하고 대중적인 스마트폰 형태를 선택했으나, 과거 '페이스북 폰'을 연상시키는 우려도 존재합니다.
오픈AI가 아이폰을 직접 겨냥한 자체 'AI 에이전트 폰'을 개발 중이며, 2027년 상반기 양산 및 연내 출시를 목표로 일정을 앞당기고 있습니다. 애플의 전 디자인 총괄 존스 아이브가 참여한 이 프로젝트는 미디어테크 커스텀 칩셋과 듀얼 NPU 아키텍처를 탑재할 것으로 알려졌습니다. 이는 AI 기업의 하드웨어 시장 본격 진입과 기존 모바일 생태계의 판도 변화를 예고하는 중요한 움직임입니다.
애플의 팀 쿡 CEO는 실적 발표 통화에서 맥 미니의 폭발적인 수요를 충족하는 데 '몇 달'이 걸릴 수 있다고 밝혔습니다. 이는 개발자들이 오픈소스 AI 도구인 OpenClaw 등을 활용한 에이전틱 AI(Agentic AI) 작업에 맥 미니가 최적의 기기로 평가하면서 수요가 예상을 웃돌았기 때문입니다. 맥 제품군의 공급 부족은 생성형 AI의 빠른 도입과 합리적인 가격의 새로운 노트북인 맥북 네오(Meo)의 뜻밖의 인기로 인해 심화되고 있습니다.
애플의 최근 분기 실적에서 아이폰과 서비스 매출이 돋보인 가운데, AI 워크로드 처리를 위한 맥(Mac)의 수요가 급증하며 조용히 호실적을 기록했습니다. 특히 팀 쿡 애플 CEO는 맥 미니와 맥 스튜디오가 AI 및 에이전트 도구 플랫폼으로서 예상보다 빠르게 소비자들의 인정을 받았으며, 기업과 교육 시장에서도 맥을 도입하는 사례가 늘고 있다고 밝혔습니다.
테슬라가 2026년 1분기 실적 발표와 관련된 어떤 언급도 없이, SEC 10-Q 보고서 말미에 최대 20억 달러 규모의 무명 AI 하드웨어 기업 인수 사실을 단 한 문장으로 조용히 공개했습니다. 18억 달러는 기술의 성공적인 상용화 등 성과 달성 조건이 걸려 있어 기술력이 검증되지 않은 스타트업을 주식으로 인수하며 핵심 인력을 유지하려는 의도로 풀이됩니다. 이는 테슬라가 막대한 현금을 보유하고도 주식 희석을 감수하면서까지 AI 반도체 및 하드웨어 자체 구축 역량을 강화하려는 전략적 행보로 보입니다.
온디바이스 AI 모델 구동에 최적화된 애플의 M4 맥 미니 기본 모델이 전 세계적으로 품절되면서 이베이 등 중고 시장에서 웃돈이 붙어 거래되고 있습니다. 낮은 소음과 안정성, 뛰어난 전력 효율성 덕분에 AI 개발자들의 테스트용 기기로 각광받은 것이 주된 원인입니다. 수요가 Mac Studio로까지 번지며 공급망 전체에 악영향을 미치고 있어, 애플의 추가 공급이 이루어지기 전까지는 높은 가격이 유지될 전망입니다.
AI 기업들이 무한정 자금을 태워 서비스를 저렴하게 제공하던 시대가 저물며 'AI 컴퓨팅 대란(Compute Crunch)'이 본격화되고 있습니다. 이로 인해 깃허브와 오픈AI 등은 서비스 제한과 가격 인상을 단행했으며, 메모리와 SSD 등 관련 부품 가격 폭등, 전력 수급 문제 등으로 전방위적인 경제적 타격이 발생하고 있습니다. 과거 우버의 파괴적 할인 정책이 견디지 못하고 가격을 대폭 올렸듯, AI 산업 역시 적자 운영의 한계에 부딪혀 기업과 투자자들에게 막대한 자본 부담으로 작용할 전망입니다.
하드웨어 제조사들이 AI 기기와 에이전트를 쉽게 개발할 수 있도록 지원하는 소프트웨어 플랫폼을 개발하는 스타트업 '에라(Era)'가 1,100만 달러(약 150억 원)의 시드 펀딩을 유치했습니다. 이 회사는 앱 기반 모델을 대체할 '지능 레이어(intelligence layer)'를 제공하여 다양한 형태의 AI 기기(안경, 쥬얼리, 스피커 등) 제작을 지원하며, 멀티모달 입력 및 추론 처리를 통해 차세대 AI 하드웨어 생태계의 기반을 다지는 것을 목표로 합니다.
구글이 대규모 AI 모델 학습용 'TPU 8t'와 고속 추론용 'TPU 8i' 두 가지 목적에 특화된 8세대 TPU를 발표했습니다. 복잡한 추론과 다단계 워크플로우를 수행하는 '에이전트(Agent)' 시대의 인프라 요구를 충족하기 위해 설계되었으며, 기존 대비 극대화된 전력 효율과 성능을 자랑합니다. 이 칩들은 올해 하반기 일반 공급될 예정이며, AI 실무자들의 대규모 워크로드 확장을 강력히 지원할 전망입니다.
NVIDIA가 연구진과 기업이 실질적인 애플리케이션을 구동할 수 있는 양자 프로세서를 구축하도록 돕기 위해 세계 최초의 오픈소스 양자 AI 모델 패밀리인 'NVIDIA Ising'을 출시했습니다. 이 모델은 AI를 활용해 양자 컴퓨팅의 핵심 병목 현상인 하드웨어 교정과 실시간 오류 정정을 자동화하여, 기존 대비 처리 속도는 최대 2.5배, 정확도는 3배 향상시켰습니다. 이미 아이비리그, 국책 연구소, 연세대학교 등을 포함한 수많은 글로벌 기관이 이 기술을 실제 도입하며 양자 컴퓨팅의 실용화를 크게 앞당기고 있습니다.