메뉴
HN
Hacker News 16일 전

일관된 AI 정책을 세워야 하는 이유

IMP
7/10
핵심 요약

최근 소프트웨어 개발 조직에서 AI 도입을 강요하며 토큰 사용량을 평가 지표로 삼는 '토큰맥싱(Tokenmaxxing)' 현상을 비판합니다. 저자는 AI 도구 사용을 강제하지 않되, 생성된 코드를 완벽히 이해하고 도구가 사라져도 업무를 수행할 수 있어야 한다는 명확한 팀 AI 정책을 제안합니다. 이는 가장 중요한 목표가 유행을 따르는 것이 아니라 고객을 돕는 것임을 강조한 실무적인 가이드입니다.

번역된 본문

대학을 졸업하고 맡은 첫 직장은 수백 명의 법률 사무원을 둔 법률 사무소였습니다. 그곳은 주택 담보 대출 차압 및 파산 사건을 관리하는 사내 워크플로우 시스템을 운영하고 있었습니다. 주택 버블이 꺼지면서 저는 운 좋게도 급성장하는 산업에 발을 들일 수 있었습니다. 절정기에는 1년에 각각 10만 건이 넘는 사건을 처리했습니다.

업무는 아주 세밀하게 잘게 나뉘어 있었습니다. 법률 사무원들은 주로 비슷한 성격의 작업이 담긴 대기열에서 작업을 꺼내 처리했습니다. 법원 제출 서류를 위한 컨베이어 벨트 시스템이었으며, 법률 업무에 도입된 테일러리즘이었습니다.

제가 입사하기 전, 새 임원이 한 명 부임했습니다. 그녀의 임무 중 하나는 업무 프로세스를 간소화하는 것이었습니다. 그녀의 계획은 단순했습니다. 직원 뒤에 서서 스톱워치로 작업 완료 시간을 재는 것이었습니다. 그런 다음 이 측정값을 바탕으로 핵심 성과 지표(KPI)를 설정하겠다는 것이었죠. 예상하실 수 있듯이 결과는 처참했습니다. 임원이 스톱워치를 들고 뒤에 서서 지켜볼 때, 사람들은 평소와 같은 방식으로 작업을 수행하지 않습니다. 그녀는 이 방식이 얼마나 무의미한지 빠르게 깨달았습니다.

이 모든 것은 소프트웨어 엔지니어링의 최악의 쓰레기 KPI인 '토큰맥싱(Tokenmaxxing)'과 제가 우리 팀을 위해 작성한 AI 정책에 대한 본론으로 넘어가기 위한 서론이었습니다.

도대체 토큰맥싱(Tokenmaxxing)이란 무엇인가? 토큰맥싱은 주님의 해 2026년이 된 지금도 '모든 지표는 결국 농간(Gamed)을 부린다'는 사실을 이해하지 못하는 경영진에게서 나온 최신 유행입니다. 스톱워치를 들었던 그 임원은 20여 년 전에 그 사실을 이해하지 못했고, 오늘날의 많은 리더들은 아직도 그 사실을 전혀 모르는 것 같습니다.

이 개념은 누가 가장 많은 토큰(Tokens)을 사용하는지 보여주는 리더보드를 만들어 AI 도입을 장려하겠다는 것입니다. 순진한 평가 지표가 그렇듯, 엔지니어들은 즉시 이 지표를 농간으로 조작합니다. 토큰을 낭비하는 무한 루프만 만들어서 리더보드 정상에 올라갈 수 있습니다. 아니면 AI를 '사용하고' 있다는 것을 보여줄 만큼만 적당히 낭비하면서도 사용량을 설명할 수 없을 정도는 아닌 타이밍을 잡을 수도 있습니다.

이것이 현시대 리더십이라고 불리는 것입니다. 팀을 위한 쉽게 조작 가능한 지표를 만들고, 그것은 순식간에 사람들을 돕는다는 본질과 멀어집니다. 결국 우리의 진짜 목적은 무엇일까요? 고객을 돕기 위해 이곳에 있는 것 아닐까요? 저도 그렇습니다. 저는 고객이 목표를 달성하도록 돕기 위해 이곳에 있습니다. 특정 수의 토큰을 사용하기 위해 이곳에 있는 것이 아닙니다. 토큰맥싱은 리더십인 척하는 허영심 지표일 뿐입니다.

왜 AI 정책이 필요한가? 저는 AI에 매우 회의적인 팀을 관리하고 있으며, 그것에는 타당한 이유가 있습니다. 여기서 윤리적 우려를 일일이 나열할 필요는 없습니다. 그에 관한 심도 있는 글은 이미 충분히 많았습니다. 생산성에 대한 우려도 굳이 나열할 필요가 없습니다. 어느 쪽 바람이 부는지, 황도에서 목성의 위치가 어떤지에 따라 이 도구들이 얼마나 유용한지는 천차만별일 것입니다. 보는 관점에 따라 0.1배에서 10배까지 생산성이 달라진다는 그럴듯한 예를 얼마든지 찾을 수 있습니다.

하지만 제가 확신하는 것은, 현재 세대의 LLM이 제 거의 20년의 경력 중 소프트웨어 엔지니어링 분야에서 겪은 가장 큰 격변을 일으키고 있다는 것입니다. 그리고 팀의 관리자로서 이에 대한 명확한 입장을 갖는 것은 제 업무의 일부입니다. 그래서 팀원들과 충분히 논의한 끝에, 우리의 AI 철학을 설명하는 가이드를 빠르게 정리했습니다. 이 가이드를 공개한 후, 직장에 이런 문서조차 없는 개발자가 얼마나 많은지 알게 되어 놀랐습니다. 그저 최대한 AI를 쓰라고 강요할 뿐, 알아서 잘 되길 바라는 식이었습니다.

핵심 요약

  • AI 사용을 강제하지 않습니다.
  • AI가 생성한 코드가 어떤 역할을 하는지 반드시 이해해야 합니다.
  • 만약 AI 도구가 사라지더라도 본인의 업무를 수행할 수 있어야 합니다.
  • 팀원과 고객을 소중히 여기십시오.

이제 이 항목들을 조금 더 자세히 살펴보겠습니다.

언제 AI 도구를 사용해야 하는가 AI 도구를 사용하라는 강제 명령은 없습니다. 이 도구를 얼마나 사용하는지를 기반으로 여러분의 평가가 이루어지지도 않을 것입니다. 그렇긴 하지만, 이 도구들은 우리 업계가 수십 년 동안 겪은 가장 큰 격변입니다. 매일 사용하지 않더라도, 이 도구들이 어떻게 발전하고 있는지 아는 것은 큰 도움이 됩니다. 이 분야는 너무 빠르게 변하고 있어서 6개월 전의 경험은 더 이상 유효하지 않을 수 있습니다. 이러한 기술의 빠른 교체 주기의 부작용 중 하나는, 6개월 전에 얻지 못한 전문 지식이...

원문 보기
원문 보기 (영어)
Have a Coherent AI Policy 2026-05-14 leadership AI My very first job out of college was at a law firm with hundreds of paralegals. They were running an in-house workflow system to manage foreclosure and bankruptcy cases. I lucked into a boom industry when the housing bubble burst. At the peak, we were doing over 100K of each a year. The work was broken down into finely sliced tasks. Paralegals worked out of a queue of tasks, mostly of the same flavor. It was an assembly line for court filings; Taylorism brought to legal work. Before I started, a new executive had been brought in. One of her jobs was to streamline process. Her plan was simple: she was going to stand behind employees with a stopwatch and time how long it took them to complete tasks. KPIs would be set up based on those measurements. This went as well as you would expect. People don’t perform tasks the same way they normally do when an executive is standing behind them with a stopwatch. She quickly learned how worthless this was. All that is a segue to the latest garbage KPI in software engineering, tokenmaxxing, and the AI policy I wrote for my team. WTF is Tokenmaxxing? Tokenmaxxing is the latest fad to come out of management who still, in the Year of our Lord 2026, do not understand that every metric will be gamed. That executive with the stopwatch didn’t understand 20+ years ago and there are clearly leaders today who have not received the memo. The idea is that the company will encourage the adoption of AI tools by creating a leaderboard of who is using the most tokens. Much like any other naive metric , engineers immediately game it . Just create a loop that wastes tokens and shoot to the top of the leaderboard. Or waste just enough to show that you’re “using” AI, but not enough to explain your usage. This is what passes for leadership apparently. Creating easily gamed metrics for your team that are quickly divorced from actually helping people. Because at the end of the day, that’s what we’re here for, right? You’re here to help people, right? That’s what I’m here for. I’m here to help our customers accomplish their goals. I’m not here to use a certain number of tokens. Tokenmaxxing is a vanity metric masquerading as leadership. Why an AI Policy? I manage a team that is very skeptical of AI, and for good reason. I don’t need to enumerate the ethical concerns here. There have been enough think pieces about that. I also don’t need to enumerate the productivity concerns. Depending on which way the wind blows and the position of Jupiter in the zodiac, your mileage will vary on how useful these tools are for you. You can find credible examples of anywhere from 0.1x -> 10x productivity depending on how you hold it. But what I am confident of is that the current generation of LLMs is causing the biggest upheaval in software engineering in my almost twenty year career. And as the manager of a team, it’s part of my job to have some position on that. So, after much discussion with the team, I quickly put together a guide describing our AI philosophy. Since putting this together, I’ve been surprised by how many developers I’ve spoken with who have no such document at work. The mandate is simply to AI as hard as possible and hope it all works. TL;DR No AI mandate You must understand what your AI generated code does You must be able to do your job if your AI tooling disappears Care about your teammates and our customers Let’s go over these in more detail. When To Use AI Tools There is no mandate to use AI tools. You will not be reviewed based on how much you are using these tools. That being said, these tools are the largest upheaval our industry has seen in decades. Even if you are not using them on a daily basis, you are well served to be aware of how they are evolving. This space is moving so fast that your experience from six months ago is likely no longer relevant. A side effect of this large turnover in skills is that any expertise you didn’t gain six months ago is probably irrelevant today. Senior+ engineers are encouraged to use these tools in whatever way works best for them. That could be as an integral part of your daily workflow or just an occasional tool for proof of concepts for non-production code. There is an inherent contradiction in AI boosters. If you don’t get on the AI train now, you’re going to be left behind. AI is moving so fast that everything you know today will be worthless in six months. It cannot be true that I have to be an AI maximalist at this very moment and also that everything I know today will be worthless in six months. Why can’t I just wait until six months from now and use the better models and techniques? I won’t have to unlearn techniques that only exist to work around the immaturity of current tooling then. (I’m looking at you, Ralph Loops.) We hire smart people and we trust them to do the job. I don’t care what OS they use. I don’t care what editor they use. I don’t care what LSP they use. And I don’t care what AI tooling they use. I don’t care if they’re dipping their toe in for a prototype or if they’re running a full-blown Gas Town. I care that they’re delivering for our customers. But as the policy says, the upheaval is real. You do have a professional duty to try these tools on occasion. The tooling I tried in June 2025 is much worse than the tooling I came back to in January 2026. I expect the tooling I’m using in June 2026 to be even better. It’s Still Your Code Any code generated by AI tools is your code. It does not matter how much of your PR that AI wrote for you, you are expected to understand what the code does. It is expected that the code fits into our existing patterns. Our AGENTS.md file should help with this, but does not guarantee anything. You are responsible for making sure the code you submit for review is up to snuff. Do not put undue burden on reviewers. We all submit questionable PRs at times. This could be because of time constraints around a incident level production bug or because we’re in new design space. It is still the responsibility of the PR submitter to call this out. Using AI tools is not an excuse to call out all of your PRs as questionable. Humans ultimately make our architecture decisions, not AI. When there is a choice between accepting code that makes it easier for machines vs. code that is easier for humans, we prefer humans. If AI tooling is constantly spitting out code that does not conform to our coding standards, the AI tooling is what needs to change, possibly by improving our AGENTS.md file. AI maximalists will read this section and scoff. They’re already vibe coding everything and have little to no idea what the generated code looks like. If we were a greenfield startup, I might take this approach as well. We are not a greenfield startup. We have a ten year old codebase full of contradicting styles brought in by different teams. Sometimes it’s full-blown code archaeology to figure out why something is the way it is. The AI maximalist bet is that models will improve at a rate that exceeds the tech debt they are accruing. This is similar to the bet that startups have made for years. It doesn’t matter how bad the initial code is. The focus is on finding product-market fit and worrying about sustainability later. We have product-market fit though. We care about being able to work on this codebase for the next decade. Our customers care that our current features keep working. If you are an AI maximalist, where is the bottleneck shifting to? Is it code review? Is it knowing what your customers even want? Is it the rate of change your customers can absorb? Being able to theoretically write 10x more code does not mean that you are providing 10x more value to your customers. If Claude goes down tomorrow, can you still do your job? Can you understand the code in front of you? If OpenAI goes bankrupt next week, will you gaze upon the horrors in your codebase and weep? I spent a decade as a consultant. I’ve parach