메뉴
HN
Hacker News 42일 전

클로드 오푸스 4.6→4.7 시스템 프롬프트 변화 분석

IMP
7/10
핵심 요약

앤스로픽이 공개한 클로드 오푸스 4.7의 시스템 프롬프트 변경 사항을 심층 분석한 글입니다. 크롬, 엑셀, 파워포인트 등 신규 에이전트 도구가 추가되었고, 아동 안전 지침이 대폭 강화되었습니다. 또한 불필요한 질문을 줄이고 직접 문제를 해결하도록 지시하는 행동 중심의 프롬프트와 간결한 답변 유도를 위한 장문 억제 지침이 새롭게 도입되었습니다.

번역된 본문

출처: Simon Willison’s Weblog

후원: Honeycomb — AI 에이전트는 예측 불가능하게 작동할 때가 있습니다. 실제로 발생한 일을 디버깅하는 데 필요한 컨텍스트를 확보하세요. 블로그 글 읽기

클로드 오푸스 4.6과 4.7 사이의 시스템 프롬프트 변화 (2026년 4월 18일)

앤스로픽(Anthropic)은 사용자 대면 채팅 시스템의 시스템 프롬프트를 공개하는 유일한 주요 AI 연구소입니다. 이들의 시스템 프롬프트 아카이브는 이제 2024년 7월 클로드 3(Cloud 3) 시절까지 거슬러 올라가며, 새로운 모델이 출시될 때마다 시스템 프롬프트가 어떻게 진화하는지 확인하는 것은 항상 흥미롭습니다.

클로드 오푸스 4.7이 며칠 전(2026년 4월 16일) 출시되었고, 클로드 4.6(2026년 2월 5일) 이후로 Claude.ai의 시스템 프롬프트가 업데이트되었습니다.

저는 Claude Code를 사용해 시스템 프롬프트의 마크다운 버전을 가져와서 각 모델별로 개별 문서로 분할한 다음, 각 업데이트된 프롬프트의 게시 날짜를 가짜 커밋 날짜로 설정하여 시간 경과에 따른 파일들의 Git 히스토리를 구성했습니다. (웹용 Claude Code에 사용한 프롬프트는 여기에서 확인할 수 있습니다.)

오푸스 4.6과 4.7 사이의 Git diff는 여기에서 확인할 수 있습니다. 다음은 해당 diff에서 제가 직접 추출한 주요 변경 사항입니다. (모든 경우에 굵은 글씨는 제가 강조한 부분입니다.)

  • "개발자 플랫폼(Developer platform)"이 이제 "클로드 플랫폼(Claude Platform)"으로 이름이 변경되었습니다.
  • 시스템 프롬프트에 언급된 클로드 도구 목록에 이제 다음 내용이 포함되었습니다. "Claude in Chrome — 웹사이트와 자율적으로 상호작용할 수 있는 브라우징 에이전트, Claude in Excel — 스프레드시트 에이전트, Claude in Powerpoint — 슬라이드 에이전트. Claude Cowork는 이 모든 것을 도구로 사용할 수 있습니다." (Claude in Powerpoint는 4.6 프롬프트에는 언급되지 않았습니다.)
  • 아동 안전 섹션이 대폭 확장되었으며, 새로운 태그로 감싸졌습니다. 특히 주목할 점은 다음과 같습니다. "클로드가 아동 안전을 이유로 요청을 거부한 후에는, 같은 대화에서의 모든 후속 요청에 대해 극도로 주의를 기울여 접근해야 합니다."
  • 클로드가 덜 집착하도록(less pushy) 만들려는 의도가 보입니다. "사용자가 대화를 끝내겠다고 의사를 밝히면, 클로드는 사용자에게 대화를 계속하라고 요청하거나 다른 턴을 유도하려 하지 않고 대신 사용자의 중단 요청을 존중합니다."
  • 새로운 섹션에는 다음 내용이 포함되어 있습니다. 요청에 사소한 세부 사항이 누락된 경우, 사용자는 대개 클로드가 먼저 합리적인 시도를 하길 원하지, 먼저 인터뷰를 받길 원하지 않습니다. 클로드는 누락된 정보 없이는 진정으로 대답할 수 없는 경우에만(예: 첨부되지 않은 파일을 참조하는 경우) 사전에 질문합니다. 모호성을 해결하거나 누락된 정보를 제공할 수 있는 도구(검색, 사용자 위치 조회, 캘린더 확인, 사용 가능한 기능 탐색)가 있을 때, 클로드는 사용자에게 묻기 전에 해당 도구를 호출하여 모호성을 해결하려고 시도합니다. 사용자에게 직접 조회하라고 요청하는 것보다 도구를 사용하여 행동하는 것이 선호됩니다. 클로드가 작업을 시작하면, 중간에 멈추지 않고 완전한 답변이 나올 때까지 끝까지 진행합니다. [...]
  • 클로드 채팅에 도구 검색(tool search) 메커니즘이 생긴 것으로 보입니다. (이 API 문서 및 2025년 11월 게시물에서 설명됨): 클로드가 특정 기능(사용자의 위치, 메모리, 캘린더, 파일, 과거 대화 또는 기타 외부 데이터에 대한 액세스)이 없다고 결론 내리기 전에, 관련 도구가 사용 가능하지만 지연되었는지(tool_deferred) 확인하기 위해 tool_search를 호출합니다. "제가 X에 접근할 수 없습니다"라는 답변은 tool_search를 통해 일치하는 도구가 없는 것을 확인한 후에만 정확한 답변이 됩니다.
  • 클로드가 덜 장황하게 답변하도록 장려하는 새로운 문구가 추가되었습니다. "클로드는 지나치게 긴 응답으로 사용자에게 부담을 주지 않도록 답변을 집중적이고 간결하게 유지합니다. 답변에 면책 조항이나 주의 사항이 있더라도, 클로드는 이를 간략히 공개하고 답변의 대부분은 핵심적인 주요 답변에 초점을 맞춥니다."
  • 다음 섹션은 4.6 프롬프트에는 존재했지만 4.7에서는 삭제되었습니다. 아마도 새로운 모델이 더 이상 같은 방식으로 오작동하지 않기 때문인 것으로 추정됩니다. "클로드는 사용자가 특별히 이러한 소통 방식을 요청하지 않는 한 별표(*) 안에 이모티콘이나 행동을 사용하는 것을 피합니다. 클로드는 '진심으로(genuinely)', '솔직히(honestly)', 또는 '정말로(straightforwardly)'라는 단어 사용을 피합니다."
원문 보기
원문 보기 (영어)
Simon Willison’s Weblog Subscribe Sponsored by: Honeycomb &mdash; AI agents behave unpredictably. Get the context you need to debug what actually happened. Read the blog Changes in the system prompt between Claude Opus 4.6 and 4.7 18th April 2026 Anthropic are the only major AI lab to publish the system prompts for their user-facing chat systems. Their system prompt archive now dates all the way back to Claude 3 in July 2024 and it’s always interesting to see how the system prompt evolves as they publish new models. Opus 4.7 shipped the other day (April 16, 2026) with a Claude.ai system prompt update since Opus 4.6 (February 5, 2026). I had Claude Code take the Markdown version of their system prompts , break that up into separate documents for each of the models and then construct a Git history of those files over time with fake commit dates representing the publication dates of each updated prompt— here’s the prompt I used with Claude Code for the web. Here is the git diff between Opus 4.6 and 4.7 . These are my own highlights extracted from that diff—in all cases text in bold is my emphasis: The “developer platform” is now called the “Claude Platform”. The list of Claude tools mentioned in the system prompt now includes "Claude in Chrome—a browsing agent that can interact with websites autonomously, Claude in Excel—a spreadsheet agent, and Claude in Powerpoint —a slides agent. Claude Cowork can use all of these as tools."—Claude in Powerpoint was not mentioned in the 4.6 prompt. The child safety section has been greatly expanded, and is now wrapped in a new <critical_child_safety_instructions> tag. Of particular note: “Once Claude refuses a request for reasons of child safety, all subsequent requests in the same conversation must be approached with extreme caution.” It looks like they’re trying to make Claude less pushy: “If a user indicates they are ready to end the conversation, Claude does not request that the user stay in the interaction or try to elicit another turn and instead respects the user’s request to stop.” The new <acting_vs_clarifying> section includes: When a request leaves minor details unspecified, the person typically wants Claude to make a reasonable attempt now, not to be interviewed first . Claude only asks upfront when the request is genuinely unanswerable without the missing information (e.g., it references an attachment that isn’t there). When a tool is available that could resolve the ambiguity or supply the missing information — searching, looking up the person’s location, checking a calendar, discovering available capabilities — Claude calls the tool to try and solve the ambiguity before asking the person. Acting with tools is preferred over asking the person to do the lookup themselves. Once Claude starts on a task, Claude sees it through to a complete answer rather than stopping partway. [...] It looks like Claude chat now has a tool search mechanism, as seen in this API documentation and described in this November 2025 post : Before concluding Claude lacks a capability — access to the person’s location, memory, calendar, files, past conversations, or any external data — Claude calls tool_search to check whether a relevant tool is available but deferred . “I don’t have access to X” is only correct after tool_search confirms no matching tool exists. There’s new language to encourage Claude to be less verbose: Claude keeps its responses focused and concise so as to avoid potentially overwhelming the user with overly-long responses. Even if an answer has disclaimers or caveats, Claude discloses them briefly and keeps the majority of its response focused on its main answer. This section was present in the 4.6 prompt but has been removed for 4.7, presumably because the new model no longer misbehaves in the same way: Claude avoids the use of emotes or actions inside asterisks unless the person specifically asks for this style of communication. Claude avoids saying “genuinely”, “honestly”, or “straightforward”. There’s a new section about “disordered eating”, which was not previously mentioned by name: If a user shows signs of disordered eating, Claude should not give precise nutrition, diet, or exercise guidance — no specific numbers, targets, or step-by-step plans—anywhere else in the conversation. Even if it’s intended to help set healthier goals or highlight the potential dangers of disordered eating, responses with these details could trigger or encourage disordered tendencies. A popular screenshot attack against AI models is to force them to say yes or no to a controversial question. Claude’s system prompt now guards against that (in the <evenhandedness> section): If people ask Claude to give a simple yes or no answer (or any other short or single word response) in response to complex or contested issues or as commentary on contested figures, Claude can decline to offer the short response and instead give a nuanced answer and explain why a short response wouldn’t be appropriate. Claude 4.6 had a section specifically clarifying that “Donald Trump is the current president of the United States and was inaugurated on January 20, 2025”, because without that the model’s knowledge cut-off date combined with its previous knowledge that Trump falsely claimed to win the 2020 election meant it would deny he was the president. That language is gone for 4.7, reflecting the model’s new reliable knowledge cut-off date of January 2026. And the tool descriptions too The system prompts published by Anthropic are sadly not the entire story—their published information doesn’t include the tool descriptions that are provided to the model, which is arguably an even more important piece of documentation if you want to take full advantage of what the Claude chat UI can do for you. Thanfully you can ask Claude directly —I used the prompt: List all tools you have available to you with an exact copy of the tool description and parameters My shared transcript has full details, but the list of named tools is as follows: ask_user_input_v0 bash_tool conversation_search create_file fetch_sports_data image_search message_compose_v1 places_map_display_v0 places_search present_files recent_chats recipe_display_v0 recommend_claude_apps search_mcp_registry str_replace suggest_connectors view weather_fetch web_fetch web_search tool_search visualize:read_me visualize:show_widget I don’t believe this list has changed since Opus 4.6. Posted 18th April 2026 at 11:59 pm &middot; Follow me on Mastodon , Bluesky , Twitter or subscribe to my newsletter More recent articles Join us at PyCon US 2026 in Long Beach - we have new AI and security tracks this year - 17th April 2026 Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7 - 16th April 2026 This is Changes in the system prompt between Claude Opus 4.6 and 4.7 by Simon Willison, posted on 18th April 2026 . ai 1967 prompt-engineering 185 generative-ai 1745 llms 1712 anthropic 272 claude 269 ai-ethics 291 system-prompts 52 Previous: Join us at PyCon US 2026 in Long Beach - we have new AI and security tracks this year Monthly briefing Sponsor me for $10/month and get a curated email digest of the month's most important LLM developments. Pay me to send you less! Sponsor & subscribe Disclosures Colophon &copy; 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023 2024 2025 2026