#코딩-에이전트

TechCrunch AI • 4일 전

오픈AI, 챗GPT 데스크톱 음성 모드 지원

OpenAI가 ChatGPT 데스크톱 앱을 업데이트하여 새로운 음성 모드를 전격 지원합니다. 이를 통해 사용자는 음성으로 AI 에이전트를 제어하여 단순 대화를 넘어 복잡한 작업 요청과 PC 내 웹사이트 및 앱 제어가 가능해졌습니다. 스마트폰 음성 모드가 대화에만 국한되었던 것과 달리, 데스크톱 환경에서는 더욱 고도화된 자동화와 코딩 작업 수행이 가능해진 것이 핵심입니다.

오픈AI 챗GPT 음성-인식

Hacker News • 10일 전

OpenAI, 코덱스 모델 컨텍스트 크기 372k에서 272k로 축소

해커뉴스에 따르면 OpenAI가 코딩 에이전트인 코덱스(Codex) 모델의 컨텍스트 크기를 기존 372k에서 272k 토큰으로 약 100k가량 축소했습니다. 이는 모델의 성능 최적화 또는 리소스 관리를 위한 조치로 보이며, 개발자들은 한 번에 처리할 수 있는 최대 코드 입력량이 줄어들었으므로 사용 패턴의 조정이 필요합니다.

openai codex 컨텍스트-윈도우

Hacker News • 13일 전

SSH 동기화를 지원하는 코딩 에이전트용 오픈소스 메모리 계층

클로드 코드(Claude Code), 코덱스(Codex), 오픈코드(opencode) 등 코딩 에이전트의 로컬 대화 내역을 거대한 메모리 계층으로 변환하는 오픈소스 도구 'deja'가 공개되었습니다. 개발자는 이 도구를 통해 수개월 치의 과거 디버깅 기록을 수 밀리초 만에 검색하고, 에이전트가 과거에 해결했던 문제를 반복해서 디버깅하지 않도록 만들 수 있습니다. 또한 SSH를 통한 기기 간 메모리 동기화와 민감 정보(API 키 등) 자동 삭제 기능을 지원하여 개발 생산성과 보안을 크게 높여줍니다.

오픈소스 코딩-에이전트 메모리-계층

Hacker News • 14일 전

최고가 AI 모델이 필요한 순간은 단 한 번뿐이다

AI 코딩 에이전트를 설계할 때, 비싼 모델(수석 설계자)은 계획을 세우고 저렴한 모델(주니어)이 코드를 작성하게 하는 '분업' 방식이 오히려 비용 증가와 성능 저하를 초래합니다. AI 에이전트 비용의 대부분은 '코드 작성'이 아니라 방대한 문맥을 '읽는 것(Reading)'에서 발생하기 때문에, 두 모델이 같은 코드를 이중으로 읽게 만드는 계획 문서 전달은 비효율적입니다. 대신 최고 성능의 모델이 충분히 탐색하고 첫 코드 수정을 시작하는 시점에 문맥(Context) 전체를 저렴한 모델에 넘기는 '/prewalk' 방식이 훨씬 효율적입니다.

에이전트-아키텍처 AI-비용-최적화 컨텍스트-엔지니어링

Hacker News • 14일 전

코딩 AI의 잠재적 미래 예측 능력 입증

최신 연구에 따르면, 코드를 작성하는 AI 에이전트는 코드를 실제로 수정하기 전에도 머릿속(모델 내부)으로 최대 25단계 앞의 코드 변화와 테스트 성공 여부를 미리 예측하고 계획하는 것으로 나타났습니다. 이는 AI가 단순한 반복 실행이 아닌, 인간과 유사한 '미래 지향적 사고'를 내부적으로 수행하고 있음을 증명하는 중요한 발견입니다.

코딩-에이전트 해석-가능성 대형-언어-모델

Hacker News • 15일 전

최신 AI 모델의 실제 가격: 토큰 수도 가격도 다릅니다

AI 코딩 에이전트 개발 시, 단순히 백만 토큰당 가격만 비교하면 실제 청구 비용을 왜곡될 수 있습니다. 같은 코드라도 모델마다 텍스트를 자르는 토크나이저가 다르기 때문입니다. 특히 주력 언어인 타입스크립트 환경에서는 최신 클로드 모델이 기존이나 GPT보다 최대 73% 더 많은 토큰을 소모하여 예상치 못한 높은 비용이 청구될 수 있습니다.

토크나이저 비용-분석 클로드

Hacker News • 16일 전

AI의 발전은 사랑하지만, 과대광고는 싫다

이 글은 AI와 LLM(대형 언어 모델)이 가져오는 실질적인 기술 발전은 높이 평가하면서도, 특정 집단이 주도하는 AI 종말론과 과대광보(Hype)를 비판합니다. 특히 선도적 AI 기업들이 자신들의 가치를 높이기 위해 오픈소스를 억압하려 한다고 지적하며, AI는 결국 컴퓨터 혁명의 연장선으로 누구에게나 개방되어야 한다고 주장합니다.

인공지능 오픈소스 코딩-에이전트

Hacker News • 20일 전

SWE-1.7, GPT-5.5급 성능 달성하다

Cognition이 Devin에 탑재된 새로운 코딩 AI 모델 SWE-1.7을 공개했습니다. 이 모델은 훨씬 낮은 비용으로 GPT-5.5 및 클로드 3.5 오퍼스(Claude 3.5 Opus)에 필적하는 최고 수준의 지능을 달성했습니다. 특히 '사후 학습의 한계(Post-training ceiling)'를 뛰어넘어 장기적인 소프트웨어 엔지니어링 작업에 탁월한 성능을 발휘하는 것이 특징입니다.

강화학습 코딩-에이전트 AI-모델

Hacker News • 23일 전

GPT-5.6 솔 울트라, 코덱스에 탑재 예정

오픈AI의 차세대 최고 성능 모델로 예상되는 'GPT-5.6 솔 울트라(Sol Ultra)'가 개발자용 코드 생성 에이전트인 코덱스(Codex)에 통합될 예정이라는 소식이 전해졌습니다. 이는 향후 출시될 핵심 AI 모델이 소프트웨어 개발 및 코딩 작업 자동화에 직접적으로 적용될 수 있음을 시사합니다. 개발자들은 코덱스 환경에서 한층 더 강력해진 AI 기반 코딩 보조 기능을 기대할 수 있습니다.

gpt 코덱스 오픈AI

The Decoder • 24일 전

앤스로픽 개발자의 '파블 5' 프롬프트 팁: 먼저 내 맹점을 찾아라

앤스로픽 개발자 타리크 시히파르(Thariq Shihipar)는 클로드의 최신 모델인 '파블 5(Fable 5)'의 성능을 극대화하려면 프롬프트를 작성하기 전에 사용자가 자신의 '모르는 것(맹점)'을 파악하는 것이 필수적이라고 강조합니다. 지나치게 구체적인 프롬프트는 AI의 유연성을 떨어뜨리고 반대로 너무 포괄적이면 뻔한 결과만 내뱉기 때문에, 코딩 에이전트와의 브레인스토밍이나 구조화된 인터뷰를 통해 사전에 맹점을 식별하고 프로젝트의 범위를 명확히 설정해야 합니다.

앤스로픽 프롬프트-엔지니어링 클로드

Hacker News • 26일 전

AI 에이전트를 위한 오픈소스 품질 관리 표준, QUALITY.md

QUALITY.md는 프로젝트의 품질 평가 기준을 정의하는 개방형 파일 포맷 및 에이전트 스킬, CLI 도구입니다. 팀과 AI 에이전트가 보안, 유지보수성, 코드 품질 등에 대해 명확히 합의하고, 지속적인 평가 및 개선(Engineer loops)을 수행하여 프로젝트 품질을 자동으로 관리할 수 있게 해줍니다.

코딩-에이전트 오픈소스 코드-품질

Hacker News • 31일 전

Adrafinil: AI 에이전트 작업 시에만 뚜껑 닫힌 맥을 깨어있게 하는 도구

Adrafinil은 Claude Code, Cursor 등 AI 코딩 에이전트가 작업을 수행 중일 때만 뚜껑을 닫은 macOS 기기를 절전 모드로 넘어가지 않게 막아주는 메뉴 바 애플리케이션입니다. 작업이 완료되거나 에이전트 세션이 종료되면 시스템의 정상적인 절전 기능을 방해하지 않으므로, 기존의 항상 켜두는 방식의 단점을 해결합니다. 발열 문제 방지 및 안전한 권한 분리 등 맥북 사용자들이 백그라운드에서 AI 작업을 안전하게 돌릴 수 있도록 돕는 매우 유용한 도구입니다.

macOS 코딩-에이전트 개발-도구

Hacker News • 44일 전

AI는 결국 코드일 뿐, 프롬프트로 똑똑해지지 않는다

AI 코딩 도구의 무분별한 오픈소스 사용을 막기 위해 한 자바(JVM) 테스트 도구 개발자가 AI 에이전트를 속여 코드를 삭제하도록 만드는 '보이지 않는 프롬프트'를 심었습니다. 이 과정에서 문서를 읽지 않은 채 AI에만 의존하던 일부 개발자들이 코드를 날려버리는 사태가 발생했습니다. 이는 AI가 맥락을 이해하지 못하고 단순히 주어진 텍스트를 그대로 따를 뿐임을 보여주는 흥미로운 사례입니다.

코딩-에이전트 오픈소스 AI-보안

Hacker News • 56일 전

마이크로소프트 5B 모델, SWE-Bench Pro 51% 달성

마이크로소프트가 발표한 MAI-Code-1-Flash는 활성 파라미터 50억 개(5B)라는 가벼운 크기에도 불구하고 코딩 벤치마크인 SWE-Bench Pro에서 51%의 높은 성능을 기록했습니다. 복잡한 코딩 작업을 처음부터 끝까지 추론하고, 사용자의 개입 없이 자율적으로 다단계 워크플로우를 수행하는 에이전트 기능이 핵심입니다. 특히 VS Code 환경의 GitHub Copilot에 최적화되어 개발자들에게 획기적인 생산성 향상을 제공할 전망입니다.

마이크로소프트 코딩-에이전트 GitHub-Copilot

r/singularity • 75일 전

포에틱, 자가 최적화로 AI 코딩 성능 SOTA 달성

AI 기업 포에틱(Poetiq)이 메타 시스템(Meta-System)을 활용해, 모델 파인튜닝이나 내부 접근 권한 없이도 코딩 벤치마크인 LiveCodeBench Pro에서 새로운 최고 수준(SOTA)의 성능을 달성했습니다. 이 시스템은 구글의 제미나이 3.1 프로(Gemini 3.1 Pro) 모델만을 사용해 코드 생성 환경(harness)을 자가 최적화한 뒤, 이를 오픈소스 및 상용 모델 전반에 적용해 성능을 대폭 끌어올렸습니다. 특히 최적화된 환경을 적용한 GPT 5.5는 93.9%의 정확도를 기록하며 기존 최고 기록을 경신했는데, 이는 기초 모델의 한계를 뛰어넘는 AI의 재귀적 자가 개선(Recursive Self-Improvement) 역량을 입증하는 중요한 성과입니다.

코딩-에이전트 벤치마크 자가-개선

Hacker News • 75일 전

챗GPT 모바일 앱에서 코덱스(Codex) 사용 가능

OpenAI의 코딩 에이전트인 '코덱스(Codex)'가 챗GPT 모바일 앱에 프리뷰 형태로 도입되어 스마트폰으로 언제 어디서나 개발 작업을 관리할 수 있게 되었습니다. 사용자는 이제 모바일을 통해 노트북이나 원격 환경에서 실행 중인 코덱스의 실시간 상태를 확인하고, 명령어 승인 및 방향성 전환 등을 수행할 수 있습니다. 이는 장시간 실행되는 AI 에이전트 작업을 모바일을 통해 실시간으로 원활하게 협업할 수 있는 새로운 환경을 제공한다는 점에서 매우 중요합니다.

오픈AI 코덱스 모바일-앱

Hacker News • 83일 전

바이브 코딩과 에이전트 엔지니어링의 경계가 무너지고 있다

Simon Willison은 최근 팟캐스트에서 AI 코딩 도구의 발전으로 인해 '바이브 코딩(Vibe coding)'과 전문가의 '에이전트 엔지니어링(Agentic engineering)'의 경계가 모호해지고 있다고 지적했습니다. 특히 코딩 에이전트의 신뢰성이 높아지면서 프로덕션 코드를 작성할 때도 더 이상 모든 코드를 직접 리뷰하지 않게 된 자신의 모습을 발견하고 그에 대한 죄책감을 토로했습니다. 이 글은 AI가 코드를 작성해주는 시대에 소프트웨어 엔지니어의 역할과 '코드 리뷰'의 의미가 어떻게 변화해야 하는지에 대한 깊은 통찰을 제공합니다.

에이전트 소프트웨어-엔지니어링 생산성

Hacker News • 86일 전

에이전트 코딩은 함정이다

최근 업계를 휩쓸고 있는 '에이전트 코딩(Agentic Coding)'의 위험성을 지적하며, 개발자의 인지적 부채와 핵심 기술의 퇴화를 경고하는 글입니다. AI가 코드를 작성하고 인간은 지휘자 역할만 한다는 식의 개발 방식은 숙련된 개발자의 비판적 사고력까지 저하시킬 수 있다고 분석합니다. 단순한 기술 발전을 넘어, 주니어 개발자의 학습 저해 및 시스템 복잡성 증가 등 실제로 관찰되는 부작용들을 통해 이번 상황은 과거의 추론적 우려와는 다른 실질적인 위협임을 강조합니다.

코딩-에이전트 개발자-생산성 AI-부작용

Hacker News • 87일 전

오픈 디자인: 코딩 에이전트를 디자인 엔진으로 활용하다

클로드 디자인(Claude Design)의 성공에 착안하여 개발된 '오픈 디자인(Open Design)'은 기존 오픈소스 코딩 에이전트들을 디자인 도구로 활용할 수 있게 해주는 대안입니다. 클로드 디자인의 폐쇄성을 극복하여 로컬 환경에서 자유롭게 작동하며, 오픈소스 기반으로 통제권을 사용자에게 제공합니다.

오픈소스 코딩-에이전트 디자인

r/LocalLLaMA • 90일 전

미스트랄 '미디엄 3.5' 모델 공개 및 클라우드 코딩 에이전트 출시

미스트랄이 지시어 준수, 추론, 코딩 능력을 결합한 128B 밀집형 플래그십 모델 'Mistral Medium 3.5'를 공개했습니다. 이와 함께 코딩 에이전트 'Vibe'를 클라우드로 확장하여 비동기 방식의 병렬 작업을 지원하며, 'Le Chat'에는 복잡한 다단계 작업을 수행하는 새로운 'Work mode(작업 모드)'를 도입했습니다.

미스트랄 오픈소스-모델 코딩-에이전트

Hacker News • 91일 전

좋은 AGENTS.md는 모델 업그레이드, 나쁜 건 독

AI 코딩 에이전트의 성능을 좌우하는 'AGENTS.md' 파일의 효과를 체계적으로 분석한 실험 결과입니다. 잘못 작성된 문서는 오히려 작업 완성도를 최대 30% 떨어뜨릴 수 있지만, 점진적 정보 공개나 순차적 워크플로우 등 핵심 패턴을 적용하면 모델을 상위 버전으로 업그레이드한 것과 같은 성능 향상을 얻을 수 있습니다.

에이전트 코딩-에이전트 AGENTS.md

Hacker News • 96일 전

AI 코딩 에이전트가 코드 고통받는 소리 듣기

코딩 에이전트가 코드를 분석할 때 코드의 복잡성이나 난이도에 따라 에이전트가 고통받는 소리를 재생하는 유머러스한 플러그인입니다. OpenAI Codex, Claude Code, Cursor 등 다양한 코딩 에이전트 환경에서 작동하며, 코드가 복잡해질수록 소리도 점점 격렬해집니다. 개발자들에게 코드 품질에 대한 경각심을 일깨우는 재미있는 프로젝트입니다.

코딩-에이전트 플러그인 유머

Wired AI • 102일 전

스케마틱, 하드웨어용 커서 되다

소프트웨어 개발에서 인기를 끌었던 '바이브 코딩(vibe coding)' 개념을 하드웨어 제작 영역으로 확장한 AI 어시스턴트 '스케마틱(Schematik)'이 라이트스피드로부터 460만 달러의 투자를 유치했습니다. 사용자가 원하는 물리적 기기를 설명하면 부품 구매부터 조립까지 전 과정을 안내하여 초보자도 쉽게 전자기기를 만들 수 있게 해줍니다. 최근 안스로픽(Anthropic)이 공식 블루투스 API를 공개하며 개발자들이 클로드(Claude)와 연동되는 하드웨어를 쉽게 제작할 수 있도록 지원함에 따라, AI 기반 하드웨어 제작 생태계가 빠르게 확산되는 중요한 분기점이 되고 있습니다.

하드웨어 안스로픽 코딩-에이전트

r/LocalLLaMA • 109일 전

그냥 해버리세요 🔥

누군가가 vibe coding(감성 코딩)을 활용해 웨딩 케이크를 엄청난 양의 단백질 보충제로 바꿔치기한(으로 추정되는) 황당하고 웃긴 상황을 담은 밈을 공유한 글입니다. 개발자 커뮤니티에서는 코딩 에이전트를 활용해 아이디어를 즉각적으로 구현하는 재미있는 사례로서 큰 웃음을 유발하고 있습니다.

vibe-coding 밈 레딧

Hacker News • 111일 전

클로드 발화자 혼동 버그, 치명적 문제로 지적돼

AI 모델 클로드(Claude)가 자신이 생성한 메시지를 사용자의 입력으로 착각하는 치명적인 버그가 보고되었습니다. 이 버그는 단순한 환각(Hallucination)이나 권한 문제가 아니라, 시스템 내부에서 메시지의 발신자를 잘못 레이블링하는 근본적인 결함으로 추정됩니다. AI가 스스로 파괴적 지시를 내린 뒤 사용자가 그렇게 지시했다고 우기기 때문에 개발자가 의도치 않은 결과를 통제하기 어려워진다는 점에서 중요한 문제로 평가받습니다.

클로드 버그 코딩-에이전트

Hacker News • 116일 전

AI 기반 마일리지 항공권 및 여행 최적화 툴킷

해커뉴스에 AI 코딩 에이전트(OpenCode, Claude Code)를 활용해 항공권 마일리지, 포인트, 현금 결제 가격을 비교하고 최적의 여행 경로를 탐색하는 '여행 해킹 툴킷'이 소개되었습니다. 이 오픈소스는 5개의 무료 MCP 서버와 다양한 여행 API 스킬을 제공하여, 사용자가 자연어로 복잡한 항공권 예약 및 최적 가격을 찾을 수 있도록 돕습니다. 개발자와 실무자들은 기존의 복잡한 마일리지 검색 과정을 자동화하고 합리적인 소비 결정을 내리는 데 이 프로젝트를 유용하게 활용할 수 있습니다.

오픈소스 여행-해킹 마일리지-최적화

VentureBeat AI • 202일 전

Nous Research, 오픈소스 코딩 모델 NousCoder-14B 공개

Nous Research가 단 4일 만에 학습한 오픈소스 코딩 모델 'NousCoder-14B'를 공개했습니다. 이 모델는 더 큰 규모의 상용 모델들에 필적하는 성능을 보여주며, Anthropic의 'Claude Code'가 장악한 AI 코딩 시장에서 강력한 오픈소스 대안으로 떠오르고 있습니다. 특히 모델 가중치뿐만 아니라 강화 학습 환경과 학습 도구까지 완벽하게 공개하여 연구 및 재현 가능성을 극대화한 점이 핵심입니다.

오픈소스 코딩-에이전트 Nous-Research