메뉴
HN
Hacker News 33일 전

지능의 사회적 모순: 개인의 이익, 집단의 손실

IMP
8/10
핵심 요약

AI 도입이 개인의 생산성은 높이지만 전체적인 다양성과 창의성은 저하시키는 '공유지의 비극'을 초래할 수 있음을 보여주는 연구 결과를 다룬 칼럼입니다. 단순한 인력 감축을 넘어 AI를 인간 상호작용을 촉진하는 도구로 활용해야 한다는 점을 강조하며, AI의 진정한 지능은 결국 과거 인류의 사회적 사유 데이터에 의존한다고 지적합니다.

번역된 본문

지능의 사회적 모순 작성자: 브라이트 사이먼스 2026년 4월 16일 | The Ideas Letter 62

AI는 실제로 '생각'하지 않습니다. 오히려 우리가 함께 생각했던 방식을 기억할 뿐입니다. 그런데 우리는 이제 막 AI가 기억할 만한 가치 있는 것들을 제공하지 않으려 하고 있습니다.

우리는 인간의 중복성(대체 가능성)의 시대로 진입하고 있습니다. 2023년, IBM의 최고경영자는 블룸버그와의 인터뷰에서 곧 약 7,800개의 직무가 AI로 대체될 수 있다고 말했습니다. 그 다음 해, 듀오링고는 계약직 직원의 10분의 1을 감원했습니다. AI를 위한 자리를 마련하기 위해서였습니다. 아틀라시안(Atlassian)이 뒤를 이었고, 클라르나(Klarna)는 자사의 AI 어시스턴트가 고객 서비스 직원 700명과 동일한 업무를 수행하고 있으며, 직원 수를 2,000명 이하로 줄이는 것이 현재의 목표(North Star)라고 발표했습니다. 잭 도시(Jack Dorsey) 역시 AI가 성장을 견인하는 동안 블록(Block)의 직원 수는 동결하겠다는 의지를 숨기지 않았습니다.

이러한 궤적에는 강력한 내재적 논리가 있습니다. 일상적인 인지적 업무가 자동화되고, 주니어 직무가 줄어들며, 생산성 향상이 매년 복리로 쌓이게 됩니다. 비용 구조를 검토하는 이사회에게 이는 내연기관이 말을 대체했던 이래 가장 깔끔한 투자 안건이며, 일종의 도의적 추진력까지 더해져 있습니다. 주저하면 뒤처진다는 것이 그들의 지론입니다.

하지만 영국 연구팀의 결과는 우리에게 경각심을 일깨워 줍니다. 2024년 봄, 그들은 약 300명의 작가에게 단편 소설을 쓰도록 했습니다. 일부는 GPT-4의 도움을 받았고 나머지는 혼자 작업했습니다. 연구진이 알고 싶었던 것은 어느 쪽의 소설이 더 창의적일 것인가 였습니다. 평균적으로 AI의 도움을 받은 작가들이 독립적인 심사위원들로부터 더 창의적이라는 평가를 받았습니다. 지금까지는 익숙한 메시지입니다. 지능적인 기계의 필연적인 장악에 관한 친숙한 이야기입니다.

하지만 연구진이 개별 작품이 아닌 전체 소설을 살펴보았을 때, 그림은 달라졌습니다. AI의 도움을 받은 소설들은 서로 더 비슷했습니다. 각 작가는 개별적으로 수준이 높아졌지만, 집단적으로는 동질화(converge)된 것입니다. 'Science Advances'에 이 연구를 발표한 아닐 R 도시(Anil R Doshi)와 올리버 하우저(Oliver Hauser)는 생태학의 용어를 빌려 이를 설명했습니다. 바로 '공유지의 비극(Tragedy of the commons)'입니다.

이 결과를 명심하십시오. 개인의 이익, 집단의 손실. 이는 단순한 글쓰기 실험보다 훨씬 더 중대한 무언가를 설명합니다. 즉, 인공지능과 우리의 전체적인 관계에 숨겨진 논리를 설명하는 것입니다. 그리고 이는 앞으로 10년 동안 가장 성공적인 조직은 매우 반직관적인 일을 하는 조직이 될 것임을 시사합니다. 즉, 수많은 직원을 해고하여 인간 상호작용을 제거하기 위해 AI를 사용하는 대신, 더 많은 인간 상호작용을 만들기 위해 AI를 사용할 것이라는 뜻입니다. IBM은 초기의 인간 중복성 환상에서 방향을 바꿨습니다. 저는 조만간 더 많은 기업이 그럴 것이라 확신합니다.

기원전 3000년의 이집트로 시간 여행을 떠나, 모든 신전 도서관의 내용물, 모든 건축 도면, 모든 사제 매뉴얼, 모든 상업 장부를 완벽한 상형문자로 복사할 수 있다고 가정해 봅시다. 그런 다음 메소포타미아로 가서 설형문자로 똑같은 일을 했다고 칩시다. 그 시대의 언어로 된 모든 것을 취합한 다음, 이를 바탕으로 대규모 언어 모델(LLM, Large Language Model)을 학습시킵니다. 완전한 트랜스포머(Transformer) 아키텍처에, 셀프 어텐션(Self-attention) 메커니즘을 포함한 모든 것을 갖추고 말입니다.

그 결과는 특정 종류의 지능을 갖춘 시스템이 될 것입니다. 천문학적 주기에서 홍수를 예측할 수 있을 것이고, 행정 서신을 작성할 수 있을 것이며, 그럴듯한 종교적 논평을 생성할 수 있을 것입니다. 하지만 그리스인들이 훗날 '삼단논법(Syllogism)'이라 부를 만한 능력은 전혀 없을 것입니다. 로마 법률의 추상화의 흔적도 담고 있지 않을 것이며, 앞으로 4천 년이 지나야 나타날 경험적 방법론에 대한 개념도 없을 것입니다.

이제 실험을 확장해 봅시다. 기원전 300년 아테네의 서면 산출물(아리스토텔레스, 유클리드, 히포크라테스, 지중해 무역의 상업 기록 등)로 새로운 모델을 학습시킵니다. 기원후 300년의 로마, 기원후 1000년의 바그다드, 기원후 1500년의 피렌체에 대해 각각 다른 모델을 학습시키고, 마지막으로 현대 사회의 전체 인터넷 규모의 텍스트 산출물로 하나의 모델을 학습시킵니다. 이 연속된 모델들 각각은 이전 모델보다 질적으로 더 똑똑할 것입니다. 하지만 그것이 본질적으로 더 똑똑해지는 것은 아닙니다.

원문 보기
원문 보기 (영어)
The Social Edge of Intelligence Bright Simons April 16, 2026 | The Ideas Letter 62 AI doesn't really “think.” Rather, it remembers how we thought together. And we're about to stop giving it anything worth remembering. We are on the verge of the age of human redundancy. In 2023, IBM’s chief executive told Bloomberg that soon some 7,800 roles might be replaced by AI. The following year, Duolingo cut a tenth of its contractor workforce; it needed to free up desks for AI. Atlassian followed . Klarna announced that its AI assistant was performing work equivalent to 700 customer-service employees and that reducing the size of its workforce to under 2000 is now its North Star. And Jack Dorsey has been forthright about wanting to hold Block’s headcount flat while AI shoulders the growth . The trajectory has a compelling internal logic. Routine cognitive work gets automated; junior roles thin out; productivity gains compound year on year. For boards reviewing cost structures, it is the cleanest investment proposition since the internal combustion engine retired the horse, topped up with a kind of moral momentum. Hesitate, the thinking goes, and fall behind. But the research results of a team in the UK should give us pause. In the spring of 2024, they asked around 300 writers to produce short fiction. Some were aided by GPT-4 and others worked alone. Which stories, the researchers wanted to know, would be more creative? On average, the writers with AI help produced stories that independent judges rated as more creative than those written without it. So far, so on message: a familiar story about the inevitable takeover by intelligent machines. But when the researchers examined the full body of stories rather than individual ones, the picture became murky. The AI-assisted stories were more similar to each other . Each writer had been individually elevated; collectively, they had converged. Anil R Doshi and Oliver Hauser, who published the study in Science Advances , reached for a phrase from ecology to explain this: a tragedy of the commons . Hold that result in mind: individual gain, collective loss. It describes something far more consequential than a writing experiment—it describes the hidden logic of our entire relationship with artificial intelligence. And it suggests that the most successful organizations of the coming decade will be the ones that do something profoundly counterintuitive: instead of using AI to eliminate human interaction by firing droves of workers, they will use it to create more human interaction. IBM has reversed course on its earlier human redundancy fantasies. I bet more will in due course. I. Suppose you could travel to Egypt in 3000 BC and copy, in flawless hieroglyphics, the contents of every temple library, every architectural plan, every priestly manual, every commercial ledger. Then suppose you travelled to Mesopotamia and did the same in cuneiform. Consolidate everything you could find in the languages of that era, and then proceed to train a large language model on it. Full transformer architecture, self-attention, the whole enchilada. The result would be a system capable of a certain kind of intelligence. It could predict floods from astronomical cycles. It could draft administrative correspondence. It could generate plausible religious commentary. But it would have no capacity for what the Greeks would later call the syllogism . It would carry no trace of Roman legal abstraction, and have no conception of the empirical method that wouldn't emerge for another four millennia. Now, let’s extend the experiment. Train a new model on the written output of 300 BC Athens: Aristotle, Euclid, Hippocrates, the commercial records of Mediterranean trade, etc. Another on 300 AD Rome, another on 1000 AD Baghdad, another on 1500 AD Florence, and finally one on the full internet-scale text production of the modern world. Each model in this chain would be qualitatively smarter than the last. But it wouldn’t be smarter because you changed the architecture of the underlying technology (you didn't). The reason would be that the civilization feeding the tech had changed. The 300 BC model would demonstrate logical inference that its Egyptian predecessor couldn't approach. The 1500 AD model would handle probability and navigational calculation. And the 2025 model would exhibit the argumentative density, cross-domain reasoning, and multi-perspectival sophistication that characterize today's frontier systems. What the chain reveals is a dependency the AI industry has largely declined to examine. The underlying intelligence of a large language model isn’t a function of its architecture, its parameter count, or the volume of compute thrown at its training. It is not even about the training data. It is a function of the social complexity of the civilization whose language it digested . Each epoch advanced the cognitive frontier through something far richer and more complex than the isolated genius of an individual guru or machine. It did so through new forms of collective problem-solving. Think new institutions (the Greek agora, the Roman lex, the medieval university, the scientific society, the modern corporation, and the social internet) that demanded and rewarded ever more sophisticated uses of language. The cognitive anthropologist Edwin Hutchins studied how Navy navigation teams actually think. In his 1995 book Cognition in the Wild , he wrote something that reads today like an accidental prophecy. The physical symbol system, he observed, is “a model of the operation of the sociocultural system from which the human actor has been removed.” That is, with eerie precision, a description of what a large language model (LLM) really is, stripped of all the unapproachable jargon and mathematical wizardry. An LLM like ChatGPT is a model of human social reasoning with the human wrangled out. And the question nobody in Silicon Valley is asking with sufficient urgency is: What happens to the model when the social reasoning that produced its training data begins to thin? II. In 2024, Ilia Shumailov and colleagues published a paper in Nature with a straight-talking title: AI models collapse when trained on recursively generated data . They demonstrated, with alarming mathematical precision, that language models trained on text generated by other language models start to degenerate partly because the distribution of the output narrows over successive generations. Minority viewpoints, rare knowledge, unusual formulations, and edge-case perspectives gradually vanish. The model converges on a kind of statistical average—fluent, plausible, and hollow. The tails of the distribution disappear first. Consider what those tails represent. They are the traces of intellectual disagreement, of minority expertise, of Cassandra warnings , of institutional friction, and of the awkward and valuable fact that different people know different things and express them differently. They are, in other words, the signature of social complexity. Model collapse is social mind compression presented as a technical phenomenon. Around the same time, the AI researcher Andrew Peterson analyzed what he called “ knowledge collapse ”: the harmful effect on public knowledge due to widespread reliance on AI-generated content. Even with a modest discount on AI-sourced information, public beliefs deviated 2.3 times further from ground truth. When people and organizations rely on AI summaries rather than engaging with primary sources, the diversity of available perspectives narrows. Similarly, there is a variant of the Dunning Krueger effect, I suggest, that is found in those conversing with service chatbots that spare them the social bruises of hard conversations. When people choose to “ask Grok” to settle messy debates on Twitter/X, they are spreading this syndrome of overconfidence in one’s understanding of complex issues. It is easier to inflate your knowledge and understanding when you don’t h