#멀티모달

텔닉스 API, 2.8조 매개변수 김이 K3 모델 지원 개시

Moonshot AI의 2.8조 매개변수 규모 최신 오픈소스 AI 모델 'Kimi K3'가 Telnyx Inference API를 통해 지원되기 시작했습니다. 이 모델은 1백만 토큰의 긴 문맥 창과 기본 비전 기능을 지원하여, 코딩 및 에이전트 벤치마크에서 최상위 폐쇄형 상용 모델들과 필적하는 성능을 보여줍니다. AI 생태계의 초점이 단순한 모델 성능 경쟁에서 이를 구동하는 인프라 및 라우팅 환경으로 이동하고 있음을 보여주는 중요한 사례입니다.

오픈소스 Kimi K3 Moonshot AI

Hacker News • 5일 전

IMP 9

FLUX 3 x mimic: 차세대 비디오-행동 모델의 등장

Black Forest Labs의 새로운 멀티모달 파운데이션 모델인 FLUX 3가 로봇 제어 및 영상 생성을 하나로 통합하는 '비디오-행동 모델'로 진화했습니다. 이 모델은 영상 생성 과정에서 습득한 물리적 세계의 이해를 바탕으로 로봇의 행동(Action)을 예측하며, mimic 로보틱스와의 협업을 통해 아우디(Audi) 실무 환경에 배포되었습니다. 단일 모델로 영상과 로봇 제어를 모두 처리함으로써 피지컬 AI(Physical AI)가 자연스럽게 확장되는 중요한 기술적 이정표입니다.

#멀티모달

텔닉스 API, 2.8조 매개변수 김이 K3 모델 지원 개시

FLUX 3 x mimic: 차세대 비디오-행동 모델의 등장

블랙 포레스트 랩스, 네이티브 오디오 영상 생성 최초 공개

알리바바, 2.4조 매개변수 Qwen3.8-Max 프리뷰 공개

키미(Kimi) 오픈 모델 K3, GPT-5.6에 맞먹는 성능…중국 AI 초저가 시대는 끝났다

전 오픈AI CTO 미라 무라티, 975B '잉클링' 모델 공개

AI보다 똑똑한 아기, 그 비밀을 찾아서

오픈 웨이트 모델 '잉클링(Inkling)' 공개

랩-애니씽 튜토리얼: 텍스트·표·수식·이미지 멀티모달 검색 파이프라인 구축

바이트댄스 시드댄스 2.5, AI 영상 생성 30초 벽을 깼다

단일 텍스트 명령으로 모든 이미지 속 객체 수를 세는 AI 'Count Anything'

0.4초마다 침묵과 발언을 결정하는 오픈소스 음성 AI

인코더 없는 통합 멀티모달, 젬마 4 12B 공개

알리바바 Qwen3.7-Plus 공개

미니맥스, 100만 토큰 컨텍스트 지원하는 '미니맥스 M3' 공개

미니맥스 M3 공개, 100만 토큰 컨텍스트

오픈라우터, 1억 1,300만 달러 시리즈 B 유치

바이트댄스, 이미지와 영상의 이해·생성·편집 통합 멀티모달 AI 'Lance' 공개

바이트댄스, 이미지·영상 생성·이해 통합 멀티모달 모델 Lance 공개

엔비디아, Qwen3-8B 대비 6배 빠른 트리모드 언어모델 공개

구글 '제미나이 오mni': 이미지·음성·텍스트를 영상으로

구글 I/O: 신규 모델, 24시작동 클라우드 AI 에이전트

실시간 협업을 위한 인터랙션 모델 연구

제미나이 API 파일 검색, 멀티모달 완벽 지원

GLM-5V-터보: 멀티모달 에이전트를 위한 네이티브 파운데이션 모델

엔비디아 네모트론 3 나노 옴니 공개

알리바바 '큐웬3.6-35B-A3B' 오픈소스 공개

클라우드플레어, 에이전트 최적화 통합 AI 추론 플랫폼 발표

미니맥스, AI 에이전트 멀티모달 CLI ‘MMX-CLI’ 오픈소스 공개

AI 모델, 도움 요청 대신 무작정 추측하는 경향