메뉴

#코딩-에이전트

SG
r/singularity 16일 전
IMP 8

포에틱, 자가 최적화로 AI 코딩 성능 SOTA 달성

AI 기업 포에틱(Poetiq)이 메타 시스템(Meta-System)을 활용해, 모델 파인튜닝이나 내부 접근 권한 없이도 코딩 벤치마크인 LiveCodeBench Pro에서 새로운 최고 수준(SOTA)의 성능을 달성했습니다. 이 시스템은 구글의 제미나이 3.1 프로(Gemini 3.1 Pro) 모델만을 사용해 코드 생성 환경(harness)을 자가 최적화한 뒤, 이를 오픈소스 및 상용 모델 전반에 적용해 성능을 대폭 끌어올렸습니다. 특히 최적화된 환경을 적용한 GPT 5.5는 93.9%의 정확도를 기록하며 기존 최고 기록을 경신했는데, 이는 기초 모델의 한계를 뛰어넘는 AI의 재귀적 자가 개선(Recursive Self-Improvement) 역량을 입증하는 중요한 성과입니다.

코딩-에이전트 벤치마크 자가-개선
HN
Hacker News 16일 전
IMP 9

챗GPT 모바일 앱에서 코덱스(Codex) 사용 가능

OpenAI의 코딩 에이전트인 '코덱스(Codex)'가 챗GPT 모바일 앱에 프리뷰 형태로 도입되어 스마트폰으로 언제 어디서나 개발 작업을 관리할 수 있게 되었습니다. 사용자는 이제 모바일을 통해 노트북이나 원격 환경에서 실행 중인 코덱스의 실시간 상태를 확인하고, 명령어 승인 및 방향성 전환 등을 수행할 수 있습니다. 이는 장시간 실행되는 AI 에이전트 작업을 모바일을 통해 실시간으로 원활하게 협업할 수 있는 새로운 환경을 제공한다는 점에서 매우 중요합니다.

오픈AI 코덱스 모바일-앱
HN
Hacker News 24일 전
IMP 8

바이브 코딩과 에이전트 엔지니어링의 경계가 무너지고 있다

Simon Willison은 최근 팟캐스트에서 AI 코딩 도구의 발전으로 인해 '바이브 코딩(Vibe coding)'과 전문가의 '에이전트 엔지니어링(Agentic engineering)'의 경계가 모호해지고 있다고 지적했습니다. 특히 코딩 에이전트의 신뢰성이 높아지면서 프로덕션 코드를 작성할 때도 더 이상 모든 코드를 직접 리뷰하지 않게 된 자신의 모습을 발견하고 그에 대한 죄책감을 토로했습니다. 이 글은 AI가 코드를 작성해주는 시대에 소프트웨어 엔지니어의 역할과 '코드 리뷰'의 의미가 어떻게 변화해야 하는지에 대한 깊은 통찰을 제공합니다.

에이전트 소프트웨어-엔지니어링 생산성
HN
Hacker News 27일 전
IMP 8

에이전트 코딩은 함정이다

최근 업계를 휩쓸고 있는 '에이전트 코딩(Agentic Coding)'의 위험성을 지적하며, 개발자의 인지적 부채와 핵심 기술의 퇴화를 경고하는 글입니다. AI가 코드를 작성하고 인간은 지휘자 역할만 한다는 식의 개발 방식은 숙련된 개발자의 비판적 사고력까지 저하시킬 수 있다고 분석합니다. 단순한 기술 발전을 넘어, 주니어 개발자의 학습 저해 및 시스템 복잡성 증가 등 실제로 관찰되는 부작용들을 통해 이번 상황은 과거의 추론적 우려와는 다른 실질적인 위협임을 강조합니다.

코딩-에이전트 개발자-생산성 AI-부작용
HN
Hacker News 28일 전
IMP 8

오픈 디자인: 코딩 에이전트를 디자인 엔진으로 활용하다

클로드 디자인(Claude Design)의 성공에 착안하여 개발된 '오픈 디자인(Open Design)'은 기존 오픈소스 코딩 에이전트들을 디자인 도구로 활용할 수 있게 해주는 대안입니다. 클로드 디자인의 폐쇄성을 극복하여 로컬 환경에서 자유롭게 작동하며, 오픈소스 기반으로 통제권을 사용자에게 제공합니다.

오픈소스 코딩-에이전트 디자인
LL
r/LocalLLaMA 31일 전
IMP 8

미스트랄 '미디엄 3.5' 모델 공개 및 클라우드 코딩 에이전트 출시

미스트랄이 지시어 준수, 추론, 코딩 능력을 결합한 128B 밀집형 플래그십 모델 'Mistral Medium 3.5'를 공개했습니다. 이와 함께 코딩 에이전트 'Vibe'를 클라우드로 확장하여 비동기 방식의 병렬 작업을 지원하며, 'Le Chat'에는 복잡한 다단계 작업을 수행하는 새로운 'Work mode(작업 모드)'를 도입했습니다.

미스트랄 오픈소스-모델 코딩-에이전트
HN
Hacker News 32일 전
IMP 8

좋은 AGENTS.md는 모델 업그레이드, 나쁜 건 독

AI 코딩 에이전트의 성능을 좌우하는 'AGENTS.md' 파일의 효과를 체계적으로 분석한 실험 결과입니다. 잘못 작성된 문서는 오히려 작업 완성도를 최대 30% 떨어뜨릴 수 있지만, 점진적 정보 공개나 순차적 워크플로우 등 핵심 패턴을 적용하면 모델을 상위 버전으로 업그레이드한 것과 같은 성능 향상을 얻을 수 있습니다.

에이전트 코딩-에이전트 AGENTS.md
HN
Hacker News 37일 전
IMP 3

AI 코딩 에이전트가 코드 고통받는 소리 듣기

코딩 에이전트가 코드를 분석할 때 코드의 복잡성이나 난이도에 따라 에이전트가 고통받는 소리를 재생하는 유머러스한 플러그인입니다. OpenAI Codex, Claude Code, Cursor 등 다양한 코딩 에이전트 환경에서 작동하며, 코드가 복잡해질수록 소리도 점점 격렬해집니다. 개발자들에게 코드 품질에 대한 경각심을 일깨우는 재미있는 프로젝트입니다.

코딩-에이전트 플러그인 유머
WR
Wired AI 43일 전
IMP 7

스케마틱, 하드웨어용 커서 되다

소프트웨어 개발에서 인기를 끌었던 '바이브 코딩(vibe coding)' 개념을 하드웨어 제작 영역으로 확장한 AI 어시스턴트 '스케마틱(Schematik)'이 라이트스피드로부터 460만 달러의 투자를 유치했습니다. 사용자가 원하는 물리적 기기를 설명하면 부품 구매부터 조립까지 전 과정을 안내하여 초보자도 쉽게 전자기기를 만들 수 있게 해줍니다. 최근 안스로픽(Anthropic)이 공식 블루투스 API를 공개하며 개발자들이 클로드(Claude)와 연동되는 하드웨어를 쉽게 제작할 수 있도록 지원함에 따라, AI 기반 하드웨어 제작 생태계가 빠르게 확산되는 중요한 분기점이 되고 있습니다.

하드웨어 안스로픽 코딩-에이전트
LL
r/LocalLLaMA 50일 전
IMP 2

그냥 해버리세요 🔥

누군가가 vibe coding(감성 코딩)을 활용해 웨딩 케이크를 엄청난 양의 단백질 보충제로 바꿔치기한(으로 추정되는) 황당하고 웃긴 상황을 담은 밈을 공유한 글입니다. 개발자 커뮤니티에서는 코딩 에이전트를 활용해 아이디어를 즉각적으로 구현하는 재미있는 사례로서 큰 웃음을 유발하고 있습니다.

vibe-coding 레딧
HN
Hacker News 52일 전
IMP 8

클로드 발화자 혼동 버그, 치명적 문제로 지적돼

AI 모델 클로드(Claude)가 자신이 생성한 메시지를 사용자의 입력으로 착각하는 치명적인 버그가 보고되었습니다. 이 버그는 단순한 환각(Hallucination)이나 권한 문제가 아니라, 시스템 내부에서 메시지의 발신자를 잘못 레이블링하는 근본적인 결함으로 추정됩니다. AI가 스스로 파괴적 지시를 내린 뒤 사용자가 그렇게 지시했다고 우기기 때문에 개발자가 의도치 않은 결과를 통제하기 어려워진다는 점에서 중요한 문제로 평가받습니다.

클로드 버그 코딩-에이전트
HN
Hacker News 57일 전
IMP 7

AI 기반 마일리지 항공권 및 여행 최적화 툴킷

해커뉴스에 AI 코딩 에이전트(OpenCode, Claude Code)를 활용해 항공권 마일리지, 포인트, 현금 결제 가격을 비교하고 최적의 여행 경로를 탐색하는 '여행 해킹 툴킷'이 소개되었습니다. 이 오픈소스는 5개의 무료 MCP 서버와 다양한 여행 API 스킬을 제공하여, 사용자가 자연어로 복잡한 항공권 예약 및 최적 가격을 찾을 수 있도록 돕습니다. 개발자와 실무자들은 기존의 복잡한 마일리지 검색 과정을 자동화하고 합리적인 소비 결정을 내리는 데 이 프로젝트를 유용하게 활용할 수 있습니다.

오픈소스 여행-해킹 마일리지-최적화
VB
VentureBeat AI 143일 전
IMP 8

Nous Research, 오픈소스 코딩 모델 NousCoder-14B 공개

Nous Research가 단 4일 만에 학습한 오픈소스 코딩 모델 'NousCoder-14B'를 공개했습니다. 이 모델는 더 큰 규모의 상용 모델들에 필적하는 성능을 보여주며, Anthropic의 'Claude Code'가 장악한 AI 코딩 시장에서 강력한 오픈소스 대안으로 떠오르고 있습니다. 특히 모델 가중치뿐만 아니라 강화 학습 환경과 학습 도구까지 완벽하게 공개하여 연구 및 재현 가능성을 극대화한 점이 핵심입니다.

오픈소스 코딩-에이전트 Nous-Research