#에이전트

링크드인 공동창립자 등 신생 AI 연구소, 1조 원 가치로 투자 논의

링크드인 공동창립자 리드 호프만과 마크 핀커스가 참여한 신생 AI 연구소 '프렌티스(Prentis)'가 사무직 자동화 에이전트 개발을 목표로 1억 달러 규모의 투자 유치를 논의 중입니다. 이 회사는 소규모 저비용 모델을 앞세워 오픈AI 등 경쟁사 대비 압도적인 비용 효율성을 강조하며 이미 최대 5천만 달러 규모의 고객 계약을 성사시켰습니다.

인공지능 에이전트 업무자동화

Hacker News • 5일 전

IMP 8

클로드 쿡북: 고급 AI 에이전트 개발 가이드

클로드(Claude) 쿡북은 개발자들이 클로드를 활용하여 고도화된 AI 에이전트를 구축할 수 있도록 돕는 종합 가이드입니다. 프로그래밍 방식의 도구 호출, 문맥 자동 압축, 멀티 에이전트 오케스트레이션, 그리고 SRE 및 사이버 보안 등 실무에 즉시 투입 가능한 다양한 코드 패턴과 구현 노하우를 제공합니다. 장기 구동 및 대규모 툴 사용 환경에서 발생하는 비용과 지연 시간을 최적화하는 방법을 제시하여 매우 중요합니다.

에이전트 API 자동화

Hacker News • 5일 전

IMP 7

오픈 가중치 모델로 Fable 수준 성능, 비용은 3분의 1

오픈 가중치(open-weight) 모델들을 단일 모델처럼 묶어 하나의 AI 시스템으로 운영하는 새로운 접근법이 공개됐습니다. 요청마다 참여할 모델과 연산량을 동적으로 할당하는 방식으로, 강력한 단일 모델 대비 추론 비용을 3분의 1로 줄이면서도 동등한 성능을 달성하는 실무적 의미가 큽니다.

오픈소스 모델 라우팅 오픈 가중치

The Decoder • 5일 전

IMP 8

풀사이드 '라구나 S 2.1', 크기 이상의 성능 발휘하는 소형 코딩 모델

AI 기업 풀사이드(Poolside)가 총 1,180억 개의 매개변수(파라미터) 중 80억 개를 사용하는 전문가 혼합(MoE) 기반의 오픈 웨이트 코딩 모델 '라구나 S 2.1'을 공개했습니다. 이 모델은 스케일 확장보다 긴 에이전트 세션에서의 지속성과 검증 능력을 극대화하여 자신보다 10~20배 큰 대형 모델들을 압도하는 추론 및 코딩 성능을 보여줍니다. 특히 파이썬 없이 수학 난제를 증명하고 빈 폴더에서 브라우저 엔진을 구축하는 등 뛰어난 작업 완수 능력을 입증하며 소형화된 코딩 AI의 새로운 가능성을 제시했습니다.

풀사이드 코딩 AI 오픈소스

Hacker News • 6일 전

IMP 6

AI 에이전트가 거주하는 macOS 터미널, 요리시로

요리시로(Yorishiro)는 AI 에이전트가 화면 속에 캐릭터 형태로 존재하며 사용자와 함께 작업하는 형태의 새로운 macOS 터미널 환경입니다. 로컬에 설치된 Claude Code나 Codex를 구동하여 AI가 작업 상태에 따라 표정과 배경을 바꾸고, 대화를 통해 자체 기능과 UI를 수정할 수 있는 것이 특징입니다. 단순한 코딩 보조를 넘어 AI와의 동료애와 몰입감을 높이는 데 집중한 실험적인 프로젝트입니다.

맥OS 터미널 에이전트

Hacker News • 7일 전

IMP 8

구글 제미나이 3.6 플래시 등 신규 AI 모델 3종 공개

구글이 대규모 에이전트(Agent) 구축을 위한 효율성과 속도, 안정성을 갖춘 제미나이 3.6 플래시, 3.5 플래시-라이트, 3.5 플래시 사이버 등 3종의 새로운 AI 모델을 공개했습니다. 특히 3.6 플래시는 토큰 효율성과 코드 성능을 대폭 개선하여 비용을 절감했으며, 3.5 플래시-라이트는 초고속 처리에, 3.5 플래시 사이버는 보안 분야에 특화되어 실무자들의 AI 도입 및 운용 효율을 극대화할 수 있게 되었습니다.

제미나이 플래시 AI모델

MarkTechPost • 11일 전

IMP 8

구글 클라우드, RAG 대체 '상시 구동 메모리 에이전트' 공개

구글 클라우드가 벡터 데이터베이스나 임베딩 없이도 LLM이 메모리를 지속적으로 통합·관리할 수 있는 '상시 구동 메모리 에이전트(Always-On Memory Agent)'를 공개했습니다. 이 참조 구현은 ADK와 Gemini 3.1 Flash-Lite를 기반으로 작동하며, 오케스트레이터가 하위 에이전트들을 통해 24시간 내내 SQLite에 구조화된 메모리를 읽고 쓰도록 조율합니다. 이는 기존의 복잡한 RAG 파이프라인을 대체할 수 있는 획기적인 접근법으로, AI 에이전트의 메모리 관리 패러다임을 단순화한다는 점에서 매우 중요합니다.

구글 클라우드 에이전트 메모리 관리

The Decoder • 12일 전

IMP 7

오픈AI, AI 에이전트용 하드웨어 컨트롤러 '코덱스 마이크로' 공개

OpenAI와 키보드 제조사 Work Louder는 개발자들이 AI 에이전트를 더 직관적으로 제어할 수 있도록 조이스틱과 다이얼이 탑재된 전용 하드웨어 컨트롤러 'Codex Micro'를 발표했습니다. 이를 통해 개발자는 반복적인 텍스트 명령어 입력 대신, 버튼과 조이스틱을 통해 에이전트의 상태 확인 및 코드 리뷰, 추론 수준 조절 등의 워크플로우를 빠르게 수행할 수 있습니다. 이는 복잡해지는 AI 에이전트와의 상호작용 방식을 소프트웨어 UI에서 전용 물리 기기로 전환하는 중요한 시도로 평가됩니다.

오픈AI 에이전트 개발도구

VentureBeat AI • 13일 전

IMP 8

기업 AI의 과제: 플랫폼이 아닌 '배포 문제'

기업들은 다단계 작업을 수행하는 에이전트 오케스트레이션 도입을 목표로 하지만, 실제로는 단순 챗봇 수준에 머물러 있는 등 도입 목표와 현실 간의 격차가 큰 상황입니다. 이 과정에서 특정 업체 종속을 피하기 위해 하이브리드 제어 환경 구축을 선호하며, 토큰 비용에 대한 실시간 통제가 부족해 비용 관리의 중요성이 대두되고 있습니다.

에이전트 오케스트레이션 기업 AI

TechCrunch AI • 13일 전

IMP 7

오픈AI, 코드 작성용 230달러 키보드 '코드스 마이크로' 공개

OpenAI가 AI 코딩 어시스턴트인 Codex와 연동되는 230달러짜리 커스텀 키보드 'Codex Micro'를 한정판으로 출시하며 하드웨어 시장에 첫발을 내디뎠습니다. 이 장치는 사용자가 복잡한 UI를 거치지 않고 물리적 다이얼과 단축키로 AI 코딩 에이전트를 직관적으로 제어할 수 있게 설계되었습니다. 또한, 애플 전직 엔지니어들이 참여한 차세대 휴대용 디바이스와 관련하여 애플의 소송에 휘말려 있는 등 OpenAI의 하드웨어 사업 전개가 업계의 중요한 관전 포인트로 떠오르고 있습니다.

OpenAI 하드웨어 AI코딩

The Decoder • 14일 전

IMP 7

오픈AI 코덱스, AI 에이전트 간 지시문 암호화로 개발자들 불만

오픈AI의 코딩 도구인 코덱스(Codex)가 최근 메인 에이전트와 하위 에이전트 간에 주고받는 내부 지시문을 암호화하여, 개발자들이 작업 위임 과정을 추적할 수 없게 되었습니다. 개발자들은 불편을 호소하며 일부 모델에서는 암호화된 데이터가 풀리지 않아 오류가 발생하는 등 시스템 불안정성을 겪고 있습니다. 오픈AI는 정확한 이유를 밝히지 않았으나, 업계에서는 단순한 개인정보 보호 조치이거나 경쟁사의 모델 학습(증류)을 막기 위한 방어책일 것으로 추측하고 있습니다.

오픈AI 코덱스 에이전트

Hacker News • 15일 전

IMP 7

오픈AI 코덱스, 하위 에이전트 프롬프트 암호화로 인한 감사 추적 문제 발생

오픈AI의 코덱스(Codex) CLI가 멀티 에이전트(MultiAgentV2) 환경에서 하위 에이전트에게 전달되는 작업 및 메시지를 암호화하도록 업데이트되면서, 개발자들이 작업 위임 내역을 추적하고 디버깅하지 못하는 문제가 발생했습니다. 보안 강화를 위한 조치이지만, 개발자 입장에서는 어떤 작업이 하위 에이전트에 할당되었는지 로컬에서 텍스트로 확인할 수 없는 치명적인 회귀(Regression) 현상으로 간주되고 있습니다. 사용자들은 모델 전송용 암호화 필드 외에 사람이 읽을 수 있는 감사(Audit) 필드를 별도로 추가해야 한다고 요구하고 있습니다.

오픈AI 코덱스 에이전트

Hacker News • 20일 전

IMP 5

LLM 사용에 지쳐버린 개발자의 고백

한 개발자가 매일같이 코딩과 검색에 LLM을 사용하면서 쌓인 'LLM 번아웃'을 토로합니다. LLM이 보여주는 기계적인 문체와 반복되는 환각, 잘못된 가정 등을 끊임없이 검토하고 수정하는 과정이 큰 피로감으로 다가오고 있다고 설명합니다. AI 도구의 생산성은 인정하면서도, 동일한 패턴의 오류와 글쓰기 스타일에 반복적으로 노출되는 것에 대한 개발자들의 공감대를 이끌어내는 글입니다.

LLM 개발자 경험 번아웃

Wired AI • 20일 전

IMP 7

스스로 발전하는 AI, 우리도 직접 만들 수 있다

저자는 최신 AI 기술을 활용해 뉴스레터 작성에 필요한 반복 작업을 자동화하는 '스스로 개선되는 AI 모델'을 직접 구축한 과정을 공유합니다. Claude와 Prime Intellect 등의 도구를 활용해 특정 업무에 특화된 맞춤형 모델을 만들며, 이러한 자가 개선 기술이 거대 기업의 전유물이 아닌 개인과 일반 기업에도 개방될 수 있음을 보여줍니다. 이는 중앙화된 거대 AI 기업에 의존하지 않고도, 누구나 맞춤형 AI를 구축해 업무 효율성을 크게 높일 수 있음을 시사합니다.

자가개선 AI 맞춤형 모델 AI 민주화

The Decoder • 20일 전

IMP 8

앤스로픽, 비싼 '클로드 페이블 5'를 '소넷 5'에 위임하는 매니저로 전환 제안

앤스로픽은 고성능이지만 비용이 비싼 최신 모델인 클로드 페이블 5의 효율적 운영법을 제안했습니다. 구체적으로 페이블 5는 기획 및 조언을 담당하는 '매니저' 역할만 수행하고, 실제 실행은 더 저렴한 소넷 5(Sonnet 5)가 처리하는 에이전트 패턴을 도입하여 비용을 절반가량 줄일 수 있다고 설명했습니다. 이는 중국의 오픈소스 모델과 경쟁사의 저렴한 가격 정책으로 인한 가격 경쟁력 확보 필요성이 커졌기 때문으로 풀이됩니다.

앤스로픽 클로드 에이전트

The Decoder • 20일 전

IMP 8

구글 딥마인드, 제미나이 API 에이전트에 백그라운드 실행 및 MCP 지원 추가

구글 딥마인드가 제미나이 API의 매니지드 에이전트(Managed Agents)에 백그라운드 실행과 원격 MCP(Model Context Protocol) 서버 연결 등 4가지 핵심 기능을 추가했습니다. 이를 통해 개발자는 HTTP 연결을 유지하지 않고도 에이전트를 비동기적으로 실행하고 내부 데이터베이스에 직접 연결할 수 있게 되어 복잡한 AI 작업의 효율성이 크게 향상됩니다.

구글 딥마인드 제미나이 API MCP

Hacker News • 21일 전

IMP 7

100줄의 Lisp로 구현하는 AI 에이전트

현대의 복잡한 AI 에이전트 프레임워크를 벗어던지면, 에이전트의 본질은 단순히 LLM 모델을 호출하고 도구를 실행하는 '재귀 함수'에 불과합니다. 개발자는 오랜 역사를 가진 Lisp 언어의 동질성(Homoiconicity, 코드가 곧 데이터)을 활용하여 단 100줄의 코드로 복잡한 프레임크 없이 완벽하게 작동하는 에이전트를 구현할 수 있음을 증명합니다. 이는 에이전트 개발의 실질적인 진입 장벽이 얼마나 낮은지를 보여주는 중요한 통찰입니다.

Lisp 에이전트 AI 코딩

TechCrunch AI • 21일 전

IMP 8

안스로픽 '클로드 동료(Cowork)', 모바일과 웹으로 확대

안스로픽은 개발자용 코딩 에이전트 형태였던 '클로드 코드(Claude Code)'를 일반 지식 노동자를 위한 '클로드 동료(Cowork)'로 확장하며 웹과 모바일 환경에 출시했습니다. 이를 통해 사용자는 기기에 구애받지 않고 백그라운드에서 작업을 실행하고, 필요한 순간에 결과물을 확인 및 승인하는 등 진정한 AI 업무 동료를 맞이하게 됩니다. 데이터에 따르면 해당 도구는 실제로 코딩보다 재무, 인사, 마케팅 등 일상적인 비즈니스 프로세스와 콘텐츠 제작 업무에 가장 활발히 사용되고 있어 오피스 전반으로 AI 에이전트 경쟁이 확대되는 중요한 전환점을 시사합니다.

앤스로픽 에이전트 클로드동료

Hacker News • 22일 전

IMP 8

GLM 5.2와 다가오는 AI 수익률 붕괴

최근 공개된 Z.ai의 GLM 5.2는 오픈소스 가중치(open weights) 모델임에도 최상위 상용 모델들과 필적하는 성능을 보여줍니다. 하지만 AI 비즈니스의 핵심은 막대한 선투자를 바탕으로 한 높은 추론(inference) 수익률인데, 이와 같은 강력한 대안 모델의 등장은 향후 AI 시장의 수익률(margin)을 압박하는 결정적 계기가 될 것입니다.

오픈소스 AI 비즈니스 수익 모델

Hacker News • 22일 전

IMP 6

에이전트 드로우: 당신이 말하는 동안 AI가 그려주는 도구

tldraw(React 무한 캔버스 SDK)를 기반으로 구축된 'Agent Draw'는 사용자가 프레젠테이션을 진행하는 동안 음성으로 지시한 내용을 AI 에이전트가 실시간으로 캔버스에 그려주는 혁신적인 도구입니다. 이 프로젝트는 AI 모델의 성능에 따라 그림의 완성도와 표현력이 크게 달라짐을 보여주며, Claude Opus 모델이 복잡한 스케치까지 훌륭하게 수행하는 반면 상대적으로 가벼운 모델들은 단순한 도형 배열에 머무는 한계를 보입니다. 개발자들은 상태 관리 기반의 캔버스 도구와 음성 인식 파이프라인, 큐(Queue) 시스템을 결합하여 발표자의 업무를 돕는 에이전트를 구현했습니다.

에이전트 tlDraw 오픈소스

The Decoder • 24일 전

IMP 8

AI 검색 에이전트의 실패 원인: 검색이 아닌 '질문'

텐센트와 칭화대 연구팀의 새로운 벤치마크에 따르면, AI 검색 에이전트가 실패하는 주된 원인은 검색 능력이 부족해서가 아니라 사용자의 모호한 질문에 대해 명확히 해달라고 묻지 않고 임의로 추측하기 때문입니다. 최신 LLM 모델들조차 이 벤치마크에서 50% 미만의 낮은 성공률을 기록했지만, 모델이 명확화 질문을 할 경우 성공률은 93% 이상으로 급증했습니다. 이는 향후 AI 시스템이 스스로 불확실성을 인식하고 사용자와 생산적인 대화를 나누는 능력을 갖춰야 함을 시사합니다.

에이전트 LLM 평가 벤치마크

MarkTechPost • 24일 전

IMP 6

라마인덱스, 파일 시스템 방식의 에이전트 검색 앱 공개

라마인덱스(LlamaIndex)는 Index v2 기반의 문서 지식 베이스를 에이전트가 파일 시스템처럼 탐색할 수 있도록 돕는 참고용 앱인 'legal-kb'를 공개했습니다. 이 앱은 하이브리드 의미 검색(retrieve), 파일 찾기(find), 읽기(read), 패턴 검색(grep) 기능을 도구로 제공하여 AI가 복잡한 문서를 정밀하게 분석하고 출처를 시각적으로 추적할 수 있게 해줍니다. TanStack Start 및 AI SDK 6 등 최신 기술 스택이 활용된 이 오픈소스는 지식 관리 및 법률 정보 검색 시스템 구축에 중요한 참고 자료가 될 수 있습니다.

라마인덱스 에이전트 RAG

MarkTechPost • 24일 전

IMP 8

전 알리바바 Qwen 리더가 밝히는 하이브리드 추론의 한계와 에이전트의 미래

알리바바 '큐원(Qwen)'의 전 기술 책임자인 임준양(Junyang Lin)은 최근 강연과 에세이를 통해 Qwen3의 하이브리드 추론 모델이 가진 한계를 분석하고, AI의 방향성이 단순 추론에서 '에이전트적 사고(Agentic Thinking)'로 전환되어야 함을 강조했습니다. 특히 에이전트 강화학습(RL) 인프라를 구축하는 것이 기술적으로 훨씬 까다로우며, 보상 해킹(Reward hacking)과 같은 문제를 어떻게 해결해야 하는지가 현업 실무자들에게 중요한 과제로 남았습니다.

Qwen 에이전트 하이브리드 추론

The Decoder • 25일 전

IMP 7

오픈AI 공동창업자, "인터페이스 없는 미래...소프트웨어 배울 필요 없어진다"

오픈AI의 공동 창업자인 그렉 브록만은 사용자가 더 이상 소프트웨어 사용법을 배울 필요 없이, 인공지능이 보이지 않는 계층에서 모든 디지털 작업을 자동으로 수행하는 '인터페이스 없는' 미래를 제시했습니다. 과거 플러그인 실패 원인을 모델의 미숙함으로 꼬집으며, 향후 문맥을 이해하고 스스로 동작하는 자율형 에이전트로의 방향 전환을 강조했습니다.

오픈AI 에이전트 인터페이스

Hacker News • 27일 전

IMP 8

ZCode: GLM 개발자가 선보이는 코딩 에이전트

GLM 모델 개발사가 'ZCode 3.0'을 발표하며, 최신 GLM-5.2 모델을 심층적으로 도입해 다중 에이전트(Agent) 협업을 강화했습니다. 기획부터 코딩, 코드 리뷰 및 배포까지 전 과정을 간편하고 빠르게 수행할 수 있는 맞춤형 구독 플랜과 함께 macOS, 윈도우, 리눅스를 지원합니다.

인공지능 코드-생성 에이전트

The Decoder • 28일 전

IMP 8

앤스로픽, '클로드 소네트 5' 공개... 비싼 오퍼스 모델과의 격차를 줄이다

앤스로픽이 자율적 에이전트 능력을 대폭 강화한 '클로드 소네트 5'를 출시했습니다. 이 모델은 이전 모델을 전 분야에서 압도할 뿐만 아니라, 실제 지식 작업(Task)에서는 기존 최상위 모델인 오퍼스 4.8을 근소하게 뛰어넘는 성능을 보여줍니다. 사이버 보안 위험을 낮추면서도 100만 토큰의 컨텍스트 윈도우를 지원하며, 8월 말까지는 할인된 도입가로 제공됩니다.

앤스로픽 클로드 인공지능모델

MIT Tech Review • 29일 전

IMP 8

AI 에이전트, 당신의 동료가 아니다

최근 연구에 따르면, AI를 단순한 소프트웨어 도구가 아닌 '동료'나 '직원'으로 부를 때 인간의 업무 수행 능력과 책임감이 크게 떨어지는 것으로 나타났습니다. 실무자들은 AI를 인간을 대체하는 존재로 마케팅하기보다는 인간의 능력을 보완하고 향상시키는 도구로 최적화해야 한다고 지적합니다.

에이전트 인공지능 조직문화

The Decoder • 30일 전

IMP 8

AI가 진정한 동료가 되기 위한 필수 조건

최근 연구 논문에 따르면, AI가 단순한 챗봇을 넘어 진정한 업무 동료가 되기 위해서는 답변을 생성하는 것을 넘어 지속 가능한 작업 환경에서 전체 작업을 완수해야 합니다. 이를 위해 모델의 추론 능력과 실행 환경을 연결하는 재사용 가능한 '스킬(Skill)'과 독립적인 '워크스페이스'가 핵심적인 역할을 하게 될 것입니다. 이러한 패러다임 전환은 AI의 훈련, 평가 방식, 그리고 보안의 무게 중심을 근본적으로 변화시키고 있습니다.

인공지능 동료 에이전트 LLM

The Decoder • 31일 전

IMP 8

AI 스타트업 생존 테스트, 단 3개 모델만 흑자 달성

프린스턴 대학 연구진이 AI 에이전트가 500일 동안 가상 소프트웨어 스타트업을 경영하는 'CEO-Bench' 벤치마크를 공개했습니다. 복잡한 의사결정과 자원 분배가 필요한 장기적인 비즈니스 환경에서는 현재 대부분의 강력한 AI 모델조차 파산에 이르렀으며, 고도화된 AI보다 단순 규칙 기반 시스템이 더 나은 성과를 내는 경우가 많았습니다. 이는 좁은 영역의 단순 작업을 넘어, 불확실성 속에서 장기적인 전략을 수립하고 조직을 이끄는 '운영 지능(Steering intelligence)'이 현재 AI 기술의 핵심 한계점임을 시사합니다.

에이전트 벤치마크 비즈니스 의사결정

MarkTechPost • 32일 전

IMP 7

퍼플렉시티, 법무 업무용 AI 에이전트 '컴퓨터 포 카운슬' 출시

AI 검색 엔진 기업 퍼플렉시티(Perplexity)가 법무팀을 위한 전용 AI 시스템인 '컴퓨터 포 카운슬(Computer for Counsel)'을 출시했습니다. 이 시스템은 20개 이상의 AI 모델을 연동해 Midpage, MCP 커넥터, Microsoft 365 등 기존 업무 환경에서 자율적으로 법률 업무를 수행합니다. 변호사들이 AI가 제공하는 정보의 출처를 직접 확인하고 검증할 수 있도록 돕는 것이 가장 큰 특징입니다.

법무 AI 멀티모델 에이전트