메뉴

#인프라

HN
Hacker News 11일 전
IMP 8

Railway, 구글 클라우드 계정 차단으로 대규모 장애 발생

클라우드 호스팅 플랫폼인 Railway가 상위 클라우드 제공업체인 Google Cloud의 계정 차단을 원인으로 대규모 서비스 장애를 겪고 있습니다. 이로 인해 사용자 인증 실패, 대시보드 접속 불가 등의 증상이 발생했으며, API 및 내부 네트워크 제어 등 핵심 인프라 복구를 위해 구글 측과 협력 중입니다. 현재 복구 시점(ETA)은 미확정 상태이며 지속적인 모니터링이 필요합니다.

클라우드 장애 인프라 Railway
TC
TechCrunch AI 15일 전
IMP 8

AI 전력 수요 폭증, 타호호수 에너지 위기 불러

AI 데이터센터의 폭발적인 전력 수요로 인해 네바다주의 에너지 공급이 부족해지면서, 샌프란시스코 베이 지역의 휴양지인 타호호수(Lake Tahoe)가 에너지 공급자를 새로 찾아야 하는 위기에 처했습니다. 거대 테크 기업들이 전력을 확보하기 위해 어떤 비용이라도 지불하려는 상황 속에서, 전통적 소비자들은 높은 요금 부담이나 공급 중단의 피해를 고스란히 떠안게 되었습니다. 이는 AI 기술의 폭발적 성장이 이제 실리콘밸리의 핵심 인사들을 포함한 일반인들의 일상과 주거 환경에도 직접적인 타격을 주고 있음을 보여줍니다.

AI 데이터센터 에너지 위기 전력망
AI
r/artificial 16일 전
IMP 7

美 여론조사: "AI 데이터센터 내 지역 반대" 70% 육박

최근 갤럽 여론조사에 따르면 미국인의 약 70%가 자신이 거주하는 지역에 AI 데이터센터가 건설되는 것을 반대하는 것으로 나타났습니다. 막대한 전력·용수 소모로 인한 공공요금 인상과 환경·건강 문제가 주요 우려 사항으로 꼽혀, 원전 건설보다도 반대 여론이 높습니다. 일부 지자체는 이미 데이터센터 건설에 제한 및 유예 조치를 내리고 있으며, 기업들은 인구 밀집지를 피해 외곽 지역으로 건설지를 선회하는 등 인프라 확장에 어려움을 겪을 전망입니다.

AI 데이터센터 지역 사회 갈등 ESG/환경 문제
40
404 Media 17일 전
IMP 8

전쟁과 AI 데이터센터, 광케이블 가격 폭등의 주범

전쟁(드론 통신용)과 AI 데이터센터 구축을 위한 막대한 수요가 맞물려 전 세계적인 광케이블 가격 폭등 및 대란을 유발하고 있습니다. 우크라이나 전장에서 중국산 광케이블 가격은 1년 새 두 배 이상 급등했으며, 미국 통신사들 역시 공급 부족과 주문 취소 사태를 겪고 있습니다. 인프라 및 방산 실무자들은 향후 광케이블 수급 불안이 프로젝트 지연과 비용 상승으로 이어질 것을 심각하게 경계해야 합니다.

인프라 데이터센터 광케이블
TD
The Decoder 23일 전
IMP 9

클로드 폭발적 성장, 머스크 슈퍼컴퓨터로 향하다

AI 기업 Anthropic의 연간 매출이 90억 달러에서 300억 달러 이상으로 급증하며 80배 성장세를 보이자, 기존 인프라를 감당하지 못해 이용량 제한 및 서비스 장애가 발생했습니다. 이를 해결하기 위해 최대경쟁사인 머스크의 xAI와 합병된 SpaceXAI와 파트너십을 체결하여 약 22만 개의 엔비디아 GPU를 보유한 콜로서스 1 슈퍼컴퓨터를 전면 활용하게 되었습니다. 이번 계약은 Anthropic의 막대한 연산 수요를 해결하는 동시에, 상장을 앞둔 SpaceXAI에게는 안정적인 대형 고객을 확보하는 윈윈(Win-Win) 전략으로 평가됩니다.

앤스로픽 스페이스엑스에이아이 인프라
MP
MarkTechPost 24일 전
IMP 8

오픈AI, 대규모 AI 클러스터 위한 새 네트워크 프로토콜 공개

오픈AI가 주요 기술 기업들과 협력하여 대규모 AI 슈퍼컴퓨터 훈련 클러스터의 네트워크 성능과 안정성을 혁신적으로 개선하는 개방형 네트워크 프로토콜인 MRC(Multipath Reliable Connection)를 발표했습니다. 이 프로토콜은 수백 개의 네트워크 경로로 패킷을 동시 분산 처리하고 마이크로초 단위의 장애 복구를 가능하게 하며, 단 2단계의 이더넷 스위치만으로도 10만 개 이상의 GPU를 연결하는 초대규모 클러스터 구축을 지원합니다.

네트워크 프로토콜 슈퍼컴퓨터 GPU 클러스터
TC
TechCrunch AI 24일 전
IMP 9

AI 경제의 설계자 5인이 지적하는 AI 산업의 한계

AI 산업 성장의 핵심 병목 현상은 칩 공급 부족과 막대한 전력 소모에서 비롯됩니다. ASML, 구글 클라우드 등 핵심 기업 리더들은 최근 물리적 한계에 부딪힌 AI 시장의 현주소를 진단하고, 데이터 확보의 어려움과 근본적인 아키텍처 재고의 필요성을 강조했습니다.

AI 반도체 인프라 구글 클라우드
TD
The Decoder 24일 전
IMP 8

오픈AI, 빅테크와 'MRC' 개발로 슈퍼컴 병목 해결

오픈AI가 AMD, 브로드컴, 인텔, 마이크로소프트, 엔비디아와 협력하여 대규모 AI 슈퍼컴퓨터의 데이터 전송 병목 현상을 해결하기 위한 새로운 네트워크 프로토콜 'MRC(Multipath Reliable Connection)'를 개발했습니다. 이 프로토콜은 패킷을 수백 개의 경로로 동시에 분산시켜 전송 속도를 높이고 장애 발생 시 마이크로초 단위로 복구하여 모델 학습의 안정성을 극대화합니다. MRC는 이미 오픈AI의 최대 규모 슈퍼컴퓨터에 적용되어 실제 프론티어 모델 학습에 사용 중이며, 오픈 컴퓨트 프로젝트(OCP)를 통해 사양이 공개되었습니다.

오픈AI 네트워크 프로토콜 슈퍼컴퓨터
HN
Hacker News 29일 전
IMP 6

AI 데이터센터의 물 사용량, 우려보다 적다

최근 언론과 대중을 중심으로 확산된 'AI 데이터센터의 과도한 물 사용량'에 대한 우려는 과장된 측면이 있습니다. 실제 물 사용량 산출 및 물리적 계산, 여러 AI 모델을 통한 검증 결과에 따르면 캘리포니아주의 데이터센터 물 사용량은 전체적으로 보통 수준이거나 상당히 적은 편입니다. 이는 신기술에 대한 맹목적인 공포와 일부 이해관계자들의 자금 확보 목적의 주장이 혼재된 사례로, 실제 과학적 데이터에 기반한 논의의 중요성을 시사합니다.

데이터센터 환경 및 지속가능성 물 사용량
LL
r/LocalLLaMA 30일 전
IMP 7

16대 DGX Spark 클러스터 구축 완료

엔비디아 DGX Spark 16대로 200Gbps 통신 속도의 고성능 클러스터 구축을 완료한 사례입니다. 통일 메모리(Unified Memory) 용량을 극대화해 대규모 언어 모델(GLM-5.1-NVFP4) 서빙을 수행하며, 향후 Mac Studio를 추가해 프리필과 디코드 단계를 분리할 계획입니다.

NVIDIA DGX Spark 클러스터 구축 통일 메모리
TD
The Decoder 31일 전
IMP 8

오픈AI, 10GW 연산 목표 수년 앞당겨 달성

오픈AI가 2029년으로 예상되던 미국 내 10기가와트(GW) AI 연산 용량 확보 목표를 수년 앞당겨 달성했다고 밝혔다. 최근 90일 동안 아마존으로부터 2GW를 확보하는 등 총 3GW의 대규모 컴퓨팅 파워가 추가 계약되며 목표를 조기에 완수할 수 있었다. 하지만 미국 텍사스 데이터센터 확장 거부, 영국 프로젝트의 높은 에너지 비용으로 인한 일시 중단, 노르웨이 사이트 전면 철회 등 모든 프로젝트가 순조로운 것은 아니다.

오픈AI 인프라 컴퓨팅 파워
LL
r/LocalLLaMA 31일 전
IMP 7

홈랩 16x DGX Spark 클러스터 구축, 뭘 돌려야 할까?

한국 독자를 위해 요약하면, 이 글은 16대의 NVIDIA DGX Spark를 활용해 역대급 규모의 홈랩 AI 클러스터를 구축하는 과정을 담고 있습니다. 통합 2TB 메모리와 200Gbps 고속 스위치로 구성되어 대규모 AI 모델의 분산 학습이나 추론에 활용할 수 있는 중요한 인프라입니다. 내일 오후면 세팅이 완료될 예정으로, 어떤 워크로드를 실행할지 논의를 위해 공유되었습니다.

dgx-spark 클러스터 홈랩
HN
Hacker News 33일 전
IMP 9

분산 AI 학습의 혁신, '디커플드 디로코' 발표

먼 거리에 있는 데이터센터 전역에 걸쳐 대규모 AI 모델을 학습할 수 있는 새로운 분산 아키텍처인 '디커플드 디로코(Decoupled DiLoCo)'가 소개되었습니다. 이 기술은 통신 대역폭을 크게 줄이면서도 하드웨어 장애에 강한 내구성을 제공하여, 기존 동기화 방식보다 20배 이상 빠른 속도로 글로벌 분산 사전 학습을 수행할 수 있습니다. 결과적으로 전 세계적으로 분산된 유휴 컴퓨팅 자원을 유연하게 활용할 수 있는 새로운 AI 인프라의 가능성을 열었다는 점에서 매우 중요합니다.

분산-학습 인프라 구글
TC
TechCrunch AI 35일 전
IMP 6

미국 메인주, 데이터센터 건립 동결 법안 거부권 행사

미국 메인주의 재닛 밀스 주지사가 신규 데이터센터 건립을 일시 중단하는 법안에 거부권을 행사했습니다. 해당 법안은 미국 최초로 주 차원의 데이터센터 건립을 2027년 말까지 동결하고 환경과 전력망에 미치는 영향을 연구할 위원회를 설치하려는 내용이었습니다. 주지사는 지역 주민들의 강력한 지지를 받는 특정 데이터센터 프로젝트에 대한 면제 조항이 없었다는 이유로 법안을 최종 거부했습니다.

데이터센터 인프라 규제
HN
Hacker News 39일 전
IMP 8

구글 8세대 TPU 공개: 에이전트 시대를 위한 두 개의 칩

구글이 대규모 AI 모델 학습용 'TPU 8t'와 고속 추론용 'TPU 8i' 두 가지 목적에 특화된 8세대 TPU를 발표했습니다. 복잡한 추론과 다단계 워크플로우를 수행하는 '에이전트(Agent)' 시대의 인프라 요구를 충족하기 위해 설계되었으며, 기존 대비 극대화된 전력 효율과 성능을 자랑합니다. 이 칩들은 올해 하반기 일반 공급될 예정이며, AI 실무자들의 대규모 워크로드 확장을 강력히 지원할 전망입니다.

구글 TPU AI 하드웨어
SG
r/singularity 39일 전
IMP 8

구글, 8세대 TPU '8t 및 8i' 공개

구글이 10년에 걸친 개발의 결실인 8세대 AI 반도체 TPU 8t와 TPU 8i를 발표했습니다. 이 칩들은 고도의 효율성과 확장성을 바탕으로 차세대 슈퍼컴퓨팅 환경을 구동하도록 맞춤 설계되었습니다. AI 에이전트(Agentic) 시대의 요구를 충족하기 위한 구글의 핵심 인프라 경쟁력 강화 조치로 평가됩니다.

구글 TPU AI 반도체
GB
Google AI Blog 39일 전
IMP 8

에이전트 시대를 위한 두 가지 특수 TPU 공개

사용자를 대신해 복잡한 업무를 수행하는 자율형 AI 에이전트 시대에 맞춰 새로운 두 가지 TPU 칩이 공개되었습니다. AI 에이전트의 빠른 추론 및 실행을 돕는 'TPU 8i'와 방대한 단일 메모리 풀에서 대규모 모델 학습에 최적화된 'TPU 8t'가 출시되어, 일상 사용자들에게도 반응성이 뛰어난 에이전트 AI 제공이 가능해질 전망입니다.

TPU AI 에이전트 인프라
HN
Hacker News 39일 전
IMP 8

AI 에이전트를 위한 다이어그램 인프라

에이전트가 다이어그램을 단순한 일회성 그림이 아닌, 추적 및 수정 가능한 영구적인 상태(durable state)로 다룰 수 있게 해주는 전용 인프라입니다. DSP(Diagram Scene Protocol)라는 기계 인터페이스를 통해 노드와 엣지를 선언하면, 내장된 레이아웃 엔진이 기하학적 배치를 자동으로 계산하여 SVG, PNG 등의 다양한 형태로 렌더링합니다. 체계적인 검증, 증분 편집(수정 시 전체 재생성 불필요), 버전 관리 기능을 제공하여 여러 에이전트가 협업하는 프로덕션 환경에 적합한 것이 특징입니다.

에이전트 인프라 다이어그램
HN
Hacker News 43일 전
IMP 7

일본 철도가 세계 최고인 진짜 이유

본 기사는 일본의 철도 시스템이 세계 최고 수준인 이유를 단순한 문화적 차이가 아닌, 우수한 공공 정책과 민영화 모델 덕분이라고 분석합니다. 철도 이용률이 미국보다 100배 이상 높고 적자 적은 유럽과 달리 막대한 영업 이익을 내는 일본의 구조적, 정책적 성공 요인을 심층적으로 다루고 있습니다. 따라서 전 세계 정부가 일본의 성공적인 정책을 직접 벤치마킹할 수 있다는 점에서 시사하는 바가 큽니다.

대중교통 철도망 민영화
TC
TechCrunch AI 44일 전
IMP 8

업스케일 AI, 20억 달러 밸류에이션 투자 논의

AI 인프라 스타트업 업스케일 AI(Upscale AI)가 약 20억 달러의 기업가치로 1.8~2억 달러 규모의 시리즈 B 투자 유치를 논의 중입니다. 설립 7개월 만에 세 번째 투자 라운드이자, 제품 출시 전임에도 불구하고 막대한 자금을 모으고 있어 업계의 이목을 끌고 있습니다.

인프라 하드웨어/칩 스타트업
MR
MIT Tech Review 45일 전
IMP 8

제약 많은 공공 부문에서 AI 실용화하는 법

보안과 규제가 엄격한 공공 부문은 민간 기업과 달리 클라우드 의존적인 대규모 언어 모델(LLM) 도입이 어렵습니다. 이를 해결하기 위해 데이터를 로컬에 안전하게 저장하고 운영할 수 있는 소규모 언어 모델(SLM)이 공공기관의 현실적인 대안으로 주목받고 있습니다. SLM은 복잡한 인프라 없이도 보안을 유지하며 실무에 즉각 활용할 수 있다는 점에서 매우 중요한 의미를 갖습니다.

공공부문 소규모언어모델(SLM) 데이터보안
TC
TechCrunch AI 46일 전
IMP 7

스타트업의 승부수, 토큰 극대화로 차세대 클라우드 강자 도약

AI 개발자들의 핵심 요구인 '빠르고 저렴한 토큰' 제공에 집중하는 스타트업 Parasail(파라세일)이 3,200만 달러의 시리즈 A 투자를 유치했습니다. 이 회사는 자체 칩을 소유하지 않고 전 세계 데이터센터의 유휴 GPU 자원을 유연하게 연결하여, 오픈소스 모델과 AI 에이전트 개발에 필수적인 '추론(Inference)' 비용을 획기적으로 낮추는 인프라를 제공합니다.

인프라 클라우드컴퓨팅 AI추론
TD
The Decoder 46일 전
IMP 7

마이크로소프트와 구글의 공간 확보로 OpenAI 유럽 스타게이트 축소

OpenAI가 추진하던 노르웨이와 영국의 유럽 '스타게이트' 데이터센터 프로젝트가 사실상 무산되었습니다. 해당 시설의 용량을 마이크로소프트와 구글이 각각 임대하며 인수했기 때문입니다. 이에 따라 OpenAI의 인프라 투자 규모 전망도 기존 1.4조 달러에서 2030년까지 6천억 달러로大幅 축소되었습니다.

OpenAI 인프라 데이터센터
MP
MarkTechPost 46일 전
IMP 7

타니피시 AI, AI 에이전트용 통합 웹 인프라 플랫폼 출시

타니피시 AI(TinyFish AI)가 검색, 데이터 추출, 브라우저 자동화, 에이전트 기능을 하나의 API 키로 통합 제공하는 웹 인프라 플랫폼을 출시했습니다. 실시간 웹 상호작용 및 다중 단계 워크플로우 자동화에 필요했던 파편화된 도구들을 하나로 묶어 개발팀의 구현 부담을 크게 줄여줍니다.

웹 자동화 API 에이전트
HN
Hacker News 51일 전
IMP 6

OpenAI, 英 스타게이트 데이터센터 전면 보류

OpenAI가 영국에 계획했던 대규모 AI 인프라 프로젝트인 '스타게이트 UK(Stargate UK)'를 에너지 비용 상승과 규제 환경을 이유로 무기한 보류했습니다. 영국 정부의 AI 성장 구역(AI Growth Zone) 혜택과 강력한 정치적 인맥에도 불구하고, 천문학적인 전력 수요와 인프라 투자 부담이 프로젝트의 발목을 잡은 것으로 보입니다. 이는 국가 주권 AI(Sovereign AI) 인프라 구축을 위한 글로벌 빅테크들의 현실적인 장벽을 보여주는 핵심 사례입니다.

인프라 데이터센터 정책_및_규제
HN
Hacker News 52일 전
IMP 8

클로드 매니지드 에이전트 출시

앤스로픽(Anthropic)이 클로드 플랫폼 내에서 에이전트를 신속하게 구축하고 배포할 수 있는 'Claude Managed Agents'를 공개 베타로 출시했습니다. 이 제품은 보안 인프라, 상태 관리, 권한 설정 등 복잡한 운영 오버헤드를 알아서 처리하여 개발자가 비즈니스 로직에만 집중할 수 있게 해줍니다. 그 결과 프로토타입에서 실제 프로덕션 환경으로의 배포 시간을 최대 10배 단축할 수 있어, 노션, 라쿠텐, 아사나 등의 기업들이 이미 유의미한 성과를 내고 있습니다.

에이전트 클로드 API
WR
Wired AI 52일 전
IMP 8

안스로픽, AI 에이전트 구축의 어려움을 해결할 신제품 출시

안스로픽이 기업의 AI 에이전트 구축과 배포를 간소화하는 신제품 'Claude Managed Agents'를 발표했습니다. 이 도구는 복잡한 인프라 구축의 부담을 덜어주고 안전한 샌드박스 환경에서 자율적인 에이전트를 운영할 수 있게 지원합니다. 이번 출시는 기업의 작업 자동화를 가속화하고 안스로픽이 급격히 성장하는 기업용 시장에서 우위를 점하려는 전략적 행보로 평가됩니다.

안스로픽 에이전트 클로드
TD
The Decoder 52일 전
IMP 8

앤스로픽, MS Azure AI 총괄 영입

AI 기업 앤스로픽(Anthropic)이 인프라 문제를 해결하기 위해 마이크로소프트의 전 Azure AI 플랫폼 총괄인 에릭 보이드(Eric Boyd)를 새 인프라 총괄로 영입했습니다. 이는 '클로드 코드(Claude Code)' 등 제품 수요 급증으로 인한 서버 불안정 문제를 해결하고, 향후 500억 달러 규모의 미국 내 AI 데이터센터 투자를 성공적으로 이끌기 위한 핵심 인사로 평가됩니다.

앤스로픽 인프라 마이크로소프트
HN
Hacker News 56일 전
IMP 9

이란 미사일 공격으로 바레인·두바이 AWS 센터 마비

이란의 미사일 공격으로 인해 바레인과 두바이에 위치한 아마존 웹 서비스(AWS) 데이터센터가 '완전 마비(Hard Down)' 상태에 빠졌습니다. AWS는 내부 메모를 통해 해당 지역의 정상화 시기를 알 수 없으며, 고객의 워크로드를 다른 지역으로 긴급 이전 중이라고 밝혔습니다. 이 분쟁으로 인해 오라클 등 타 기술 기업들도 피해를 입었으며, 호르무즈 해협을 통한 알루미늄, 헬륨 등 반도체 공급망 핵심 자재의 흐름이 단절되어 글로벌 IT 산업 전반에 큰 타격이 예상됩니다.

인프라 글로벌 이슈 공급망