클로드 코드, 악성코드 의심에 개발자 통제 논란
한 해커뉴스 유저가 매월 200달러를 내는 최고 등급 구독자임에도 불구하고, AI 모델이 악의적 활동을 한다고 지나치게 의심하여 정상적인 개발 업무를 방해하고 작업을 거부하는 문제를 제기했습니다. 이는 지나친 AI 안전망(guardrails)이 정당한 사용자의 업무 효율성을 떨어뜨리고 통제감을 느끼게 만드는 대표적인 사례로, AI 윤리와 실무자의 작업 자유도 사이의 충돌을 보여줍니다.
개발 중에 새로운 작업을 시작할 때마다 다음과 같은 문구가 계속 나타납니다:
내 버그 파일 — 악성코드(Malware)가 아님.
이 모델이 악성코드를 제작하고 있는지 강박적으로 검사하고 있는 것 같습니다.
다른 상황에서 JS(자바스크립트)가 포함된 HTML 문서의 파서를 개발하고 있었는데, 보안 시스템을 우회하려 한다고 판단하여 작업을 거부했습니다.
저는 AI가 제가 하는 일을 도와주는 보조적인 역할을 해야 한다고 생각합니다. AI가 제가 잘못된 일을 하거나 시스템을 남용하고 있는지 지나치게 집요하게 검사할 때, 저는 통제받고 있다는 느낌을 받습니다. 저는 가드레일(guardrails, 안전장치)이 있어야 한다는 점과 사람들이 이 새로운 기술을 나쁜 일에 악용하지 못하게 막는 것이 매우 중요하다는 것을 이해합니다.
저는 한 달에 200달러를 지불하는 맥스(Max) 구독자입니다. 서비스 제공자는 제가 누구인지 이미 알고 있습니다. 클로드(Claude)는 제가 스크래핑(scraping) 기술 분야에서 일하고 있으며, 우리 고객이 우리가 스크래핑하는 대상 기업들이라는 것도 알고 있습니다.
이제 Opus 4.7에서는 크롬 확장 프로그램을 통해 쿠키 생성을 자동화해 달라고 요청했더니, 작업을 계속할 수 없다고 거부하는 상황이 발생했습니다.
누군가 시스템을 남용하는 경우, 예를 들어 악의적인 의도로 악성코드를 만들거나 해킹을 하는 경우라면, 그 사람의 의도에 대해 평가를 내릴 수 있는 어떤 신호 시스템이나 알고리즘이 있을 것이라고 상상할 수 있습니다. 하지만 지금 AI가 저의 업무를 제한하고 있어서 약간 방해를 받고 있다는 느낌이 듭니다. 이 시스템이 도대체 누구길래 나를 제한하는 겁니까?
앞으로 이것을 받아들여야 할까요? 제 권한이 불충분하거나 제가 잘못된 일을 하고 있다고 믿기 때문에 계속할 수 없다고 시스템이 말하는 것을요.
블랙웰(Blackwell) GPU의 로컬 AI에서는 문제 없이 잘 작업할 수 있습니다. 하지만 당연히 최신 기술, 최신 AI, 그리고 사용 가능한 최고의 모델을 사용하고 싶습니다. 이것이 분기의 시작일까요? 착한 사람과 나쁜 사람이 각기 다른 선택을 하게 되는? 내가 지금 나쁜 놈이 된 건가요?
작년에 마흔이 넘었습니다. 저는 케빈 미트닉(Kevin Mitnick)에 대해 읽고 이야기를 나누며 자랐습니다. 지역 컴퓨터 동호회 회원이었고, 14살 소년으로서 해킹을 하던 아이였는데