메뉴

#GLM-5.1

LL
r/LocalLLaMA 2일 전
IMP 8

자이(Zai), GLM-5.1 추론 네트워크 교체로 33% 비용 절감 및 15% 성능 향상 달성

자이(Zai)는 천 개 GPU 규모의 GLM-5.1 코딩 추론 클러스터에서 기존 ROFT 방식을 청화대와 공동 개발한 'ZCube'로 전면 교체했습니다. 동일한 GPU와 소프트웨어 스택을 유지하면서도 네트워크 아키텍처만의 변경으로 스위치 비용은 33% 줄이고, 처리량은 15% 높이며 첫 토큰 지연 시간(P99)은 40.6% 단축시키는 결과를 얻었습니다. 이는 하드웨어 비용을 추가하는 대신 트래픽 병목을 해소하는 네트워크 평면화(Flat) 방식을 통해 역설적인 성과를 입증했다는 점에서 AI 인프라 실무자들에게 매우 중요한 시사점을 줍니다.

인프라 최적화 네트워크 아키텍처 GPU 추론
SG
r/singularity 51일 전
IMP 7

중국 AI의 파괴적 혁신, 서방의 대안은 없는가

최근 중국의 AI 기업들이 적은 컴퓨팅 자원과 혁신적인 엔지니어링으로 미국의 최고 수준 AI 모델과의 격차를 빠르게 좁히고 있습니다. 최근 화제가 된 오픈소스 모델 GLM-5.1은 자율 작업 수행 및 코딩 벤치마크에서 압도적인 성능을 보여주며, 가격 경쟁에만 치중하는 미국 기업들과 뚜렷한 대조를 이루고 있습니다.

중국 AI 오픈소스 GLM-5.1
TD
The Decoder 52일 전
IMP 8

지푸 AI GLM-5.1, 수백 번 반복하며 코딩 전략 스스로 수정

중국의 지푸 AI(Zhipu AI)가 복잡하고 장기적인 프로그래밍 작업에 특화된 오픈소스 모델 GLM-5.1을 공개했습니다. 이 모델은 작업 중 막히면 수백 번에 걸쳐 스스로 코드를 검토하고 전략을 근본적으로 수정하여 기존 최고 성능 모델들을 제치는 성능을 보여줍니다. 단일 프롬프트로 리눅스 데스크톱 환경을 구축하는 등 뛰어난 에이전트 기반 작업 능력을 증명했지만, 지식 및 추론 벤치마크에서는 여전히 개선할 점이 많음을 스스로 인정하고 있습니다.

지푸 AI GLM-5.1 자가 개선 코딩
LL
r/LocalLLaMA 53일 전
IMP 4

새로운 에이전트 도구, GLM 5.1과 함께 테스트

Reddit 사용자가 USB에서 발견한 새로운 Hermes Agent 스킨 라이브러리를 공유했습니다. 이 오픈소스 도구는 최신 GLM 5.1 모델과 함께 사용할 계획이며, 에이전트 UI 및 기능 확장에 유용할 것으로 보입니다. 개발자 커뮤니티에서 실무적인 도구로 주목받을 수 있습니다.

오픈소스 에이전트 GLM-5.1