메뉴

#인공지능 모델

LL
r/LocalLLaMA 6일 전
IMP 8

엘론 머스크, 내년 0.5T Grok 모델 공개 예고

일론 머스크가 내년에 0.5조(0.5T) 파라미터 규모의 Grok 모델을 공개할 계획이라고 밝혔습니다. 이와 함께 현재 Grok-3가 오픈소스로 공개되며 업계의 큰 주목을 받고 있습니다. 거대 언어 모델(LLM)의 성능 향상과 오픈소스 생태계 확장에 중요한 이정표가 될 것으로 보입니다.

Grok 오픈소스 인공지능 모델
MP
MarkTechPost 9일 전
IMP 8

마이크로소프트, 오픈AI·구글 능가하는 웹 브라우저 에이전트 'Fara 1.5' 공개

마이크로소프트 리서치가 4B, 9B, 27B 크기의 웹 브라우저 컴퓨터 사용 에이전트 모델군인 Fara 1.5를 공개했습니다. Fara 1.5-27B 모델은 Online-Mind2Web 벤치마크에서 72%의 점수를 기록하며 오픈AI의 Operator, 구글의 Gemini 2.5 Computer Use 등 기존 최고 수준 모델들을 뛰어넘는 성능을 입증했습니다. 또한, 제한된 데이터를 활용해 에이전트를 훈련시키는 합성 데이터 파이프라인인 FaraGen1.5도 함께 발표되었습니다.

에이전트 마이크로소프트 오픈소스
SG
r/singularity 24일 전
IMP 6

제네시스 AI, 자율형 모델 '진 26.5' 공개

제네시스 AI(Genesis AI)가 스스로 판단하고 작업을 수행할 수 있는 자율형 AI 모델인 '진 26.5(Gene'26.5)'를 공개했습니다. 실무자 관점에서 이 모델은 사용자의 개입을 최소화하고 복잡한 작업을 독립적으로 수행할 수 있는 완전 자율(Autonomous) 에이전트 시스템의 발전을 시사합니다. 최신 소식은 X(구 트위터) 계정을 통해 확인할 수 있습니다.

제네시스 AI 자율형 AI 에이전트
TC
TechCrunch AI 25일 전
IMP 8

오픈AI, 챗GPT 기본 모델로 'GPT-5.5 인스턴트' 공개

오픈AI가 챗GPT의 새로운 기본 모델인 'GPT-5.5 Instant'를 공개했습니다. 이 모델은 수학 및 멀티모달 추론 벤치마크에서 이전 모델을 크게 상회하는 성능을 보여주며, 법률 및 의료 등 민감한 분야의 환각(Hallucination) 현상을 줄이는 데 집중했습니다. 특히 과거 대화 및 파일 등을 참조하는 개인화된 컨텍스트 관리 기능과 모델의 기억 출처를 확인 및 수정할 수 있는 기능이 추가되어 사용자 경험이 크게 향상되었습니다.

오픈AI GPT-5.5 인스턴트 챗GPT
LL
r/LocalLLaMA 32일 전
IMP 7

엔비디아 새 추론 모델 '네모트론' 유출?

레딧(Reddit)에 엔비디아의 새로운 AI 모델로 추정되는 'Nemotron-3-Nano-Omni-30B-A3B-Reasoning'의 추론 템플릿 코드가 유출되었습니다. 이 코드는 사용자의 프롬프트에 따라 모델의 '생각(Thinking)' 기능을 켜고 끌 수 있는 고급 추론 제어 시스템을 포함하고 있어, 엔비디아가 강력한 오픈소스 추론 모델을 준비하고 있음을 시사합니다.

인공지능 모델 엔비디아 추론 모델
TD
The Decoder 35일 전
IMP 8

GPT-5.5, 벤치마크 1위이지만 환각 여전... API 비용은 20% 상승

OpenAI의 최신 모델 GPT-5.5가 다시 한번 종합 AI 성능 평가 1위를 차지했지만, 여전히 높은 수준의 환각(Hallucination) 현상을 보이는 것으로 나타났습니다. 놀랍게도 모델의 추론 능력이 향상되었음에도 불구하고, 말도 안 되는 질문을 사실처럼 포장하거나 잘못된 정보를 확신하는 경향이 이전 버전과 비슷하거나 오히려 더 악화된 부분도 존재합니다. API 호출 시 사용하는 토큰(TOKEN) 소모량은 줄었으나 단가 인상으로 인해 결과적으로 순비용은 약 20% 상승하여 실무자들은 도입 시 비용 대비 성능과 모델의 신뢰도를 신중하게 따져야 합니다.

GPT-5.5 AI 환각 API 비용
TD
The Decoder 36일 전
IMP 8

GPT-5.5 벤치마크 1위, 환각 문제와 20% 인상된 비용

OpenAI의 최신 모델 GPT-5.5가 Artificial Analysis 지능 지수 60점을 기록하며 클로드 오퍼스 4.7(Claude Opus 4.7)과 제미나이 3.1 프로 프리뷰(Gemini 3.1 Pro Preview)를 제치고 종합 1위를 탈환했습니다. 토큰(token) 소모량 감소에도 불구하고 API 가격이 실질적으로 약 20% 인상되었으며, 특히 정답률은 높음에도 불구하고 모르는 것을 인정하지 않고 답변을 지어내는 '환각(hallucination)' 비율이 86%에 달해 개선이 시급한 과제로 꼽힙니다.

GPT-5.5 벤치마크 API 비용
WR
Wired AI 45일 전
IMP 8

당신의 생각을 읽는 '머리글'의 등장

실리콘밸리 스타트업 사비(Sabi)가 사용자의 생각(내면의 언어)을 텍스트로 변환하는 비침습적 웨어러블 뇌-컴퓨터 인터페이스(BCI) 기기를 개발 중입니다. 최대 10만 개의 EEG 센서와 뇌 파운데이션 모델(Foundation Model)을 결합하여 이론적인 장벽을 극복하고자 하며, 일론 머스크의 뉴럴링크와 같은 수술 없이도 누구나 일상적으로 사용할 수 있는 차세대 인터페이스로 주목받고 있습니다.

뇌-컴퓨터 인터페이스 웨어러블 기기 사비 (Sabi)
TD
The Decoder 45일 전
IMP 7

구글, 70개 이상 언어를 지원하는 가장 표현력 뛰어난 Gemini 3.1 TTS 공개

구글이 텍스트를 자연스러운 음성으로 변환해주는 'Gemini 3.1 Flash TTS' 모델을 공개했습니다. 이 모델은 70개 이상의 언어를 지원하며, 스타일과 속도, 톤을 세밀하게 조정할 수 있는 새로운 오디오 태그 기능을 제공합니다. 이를 통해 개발자들은 전 세계 다양한 언어권에서 사용자 경험을 크게 향상시키는 고품질 음성 서비스를 구축할 수 있습니다.

음성 생성 (TTS) 구글 (Google) Gemini 3.1
HN
Hacker News 45일 전
IMP 8

구글, 로봇의 물리적 추론 능력 강화한 '제미나이 로보틱스-ER 1.6' 발표

구글이 로봇이 물리적 환경을 이해하고 작업을 수행할 수 있도록 돕는 핵심 모델인 Gemini Robotics-ER 1.6을 공개했습니다. 이번 버전은 다각도 카메라 이해를 바탕으로 한 공간 추론, 계기판 읽기 등의 기능이 대폭 향상되어 복잡한 산업 현장에서 로봇의 자율성을 크게 높였다는 점에서 중요합니다. 개발자들은 현재 Gemini API와 Google AI Studio를 통해 이 모델에 접근하고 활용할 수 있습니다.

로봇 공학 구체화 추론 구글 제미나이
SG
r/singularity 52일 전
IMP 8

메타, 슈퍼인텔리전스 연구소 첫 AI 모델 '뮤즈 스파크' 공개

메타의 슈퍼인텔리전스 연구소(MSL)가 첫 번째 AI 모델인 '뮤즈 스파크(Muse Spark)'를 공식 소개했습니다. 이번 발표는 메타가 본격적인 초지능(ASI) 경쟁에 돌입했음을 알리는 중요한 이정표로 평가받습니다. 관련된 자세한 기술적 배경과 모델의 세부 사항은 메타 공식 블로그를 통해 확인할 수 있습니다.

메타(Meta) 슈퍼인텔리전스 뮤즈 스파크