메뉴
BL
Wired AI 39일 전

AI 탐지 도구, 교황의 AI 경고조차 AI가 썼다고 주장

IMP
7/10
핵심 요약

AI 탐지 스타트업 팬그램 랩스(Pangram Labs)가 99.98%의 높은 정확도를 자랑하는 AI 탐지 크롬 확장 프로그램을 공개했습니다. 이 도구는 소셜 미디어와 커뮤니티를 실시간으로 스캔하여 인터넷 상에 범람하는 AI 생성 콘텐츠(AI Slop)를 색출해 내며, 온라인상의 신뢰도를 검증하는 데 중요한 역할을 할 것으로 보입니다.

번역된 본문

이번 주 월요일, 널리 읽히는 레딧(Reddit) 포럼 'r/AmItheAsshole(내가 나쁜 놈일까요?)'에 새로운 계정 하나가 나타났습니다. 이 포럼은 이용자들이 자신의 개인적인 갈등을 낯선 사람들에게 맡겨 판단을 받는 곳입니다. 이 특정 이용자는 '내게도 직장과 책임져야 할 일이 있는데 계모의 아이들을 돌보는 것을 거절했다'며 선을 넘었는지 물었습니다. 게시물 자체는 간결하고 명확하며 문법적으로도 완벽했습니다. 그는 계모와 아버지가 종종 통보도 없이 아이를 봐주길 원했고 결국 다투게 된 상황을 설명했습니다. "지금 집 안에 긴장감이 흐르고, 내가 잘못 처리한 건 아닌지 궁금해지기 시작했습니다"라고 이 레딧 이용자는 마무리했습니다. "아이를 키우는 것이 스트레스라는 건 이해하지만, 내 역할이 아닐 때 그 책임을 져야 할 의무는 없다고 느낍니다."

이에 대한 반응은 대체로 지지적이었습니다. 많은 사람들이 아이를 돌보는 것은 그 사람의 몫이 아니며, 집에서 나가는 것이 가장 좋은 해결책이라고 답했습니다. 하지만 팬그램 랩스(Pangram Labs)에서 개발한 AI 탐지 소프트웨어에 따르면, 이 가족 간의 불화에 대한 원본 이야기는 AI가 생성한 것이었습니다. 이 소프트웨어는 99.98%의 정확도와 10,000분의 1의 오탐지율(False Positive Rate)을 주장합니다. 이번 주 대중에 공개된 팬그램의 최신 크롬(Chrome) 확장 프로그램 덕분에 저는 페이지를 스크롤하면서 이 글이 AI 콘텐츠로 플래그가 지정된 것을 발견했습니다. 월 20달러의 유료 요금제에서 이 도구는 레딧, 엑스(X), 링크드인(LinkedIn), 미디엄(Medium), 서브스택(Substack) 등 소셜 사이트의 게시물을 실시간으로 스캔하여 사람이 직접 쓴 글인지, AI가 생성한 것인지, 아니면 AI의 도움을 받아 작성된 것인지 분류합니다. 또한 이 분석에는 팬그램이 그 결론에 얼마나 확신을 가지는지(낮음, 중간, 높음)에 대한 수치도 포함됩니다.

연구원들은 인터넷 곳곳에서 AI로 생성된 쓰레기 데이터(AI slop)를 발견했습니다. 이는 저널리즘과 소셜 플랫폼 모두에 악영향을 미칩니다. 스탠퍼드 대학교, 런던 제국 대학교(Imperial College of London), 인터넷 아카이브(Internet Archive) 연구원들이 이번 달에 발표한 연구에 따르면, 2025년 현재 적어도 부분적으로 AI가 생성한 텍스트가 모든 신규 웹사이트의 3분의 1 이상을 차지하는 것으로 나타났습니다. (연구원들은 이러한 결과를 도출하기 위해 팬그램의 초기 도구를 사용했습니다.) 바로 이 지저분한 상황을 '쓰레기 청소부(slop janitor)'를 자처하는 팬그램의 최대스페로(Max Spero) CEO가 해결하고자 합니다. 그는 회사의 브라우저 확장 프로그램에 즉각적인 분석 기능을 추가하면, 사람들이 자주 방문하는 사이트에서 AI 콘텐츠를 더 매끄럽게 확인할 수 있다고 와이어드(WIRED)에 말했습니다. 스페로는 "사전 검사 기능을 제공함으로써 쓰레기 콘텐츠를 보고 싶지 않은 일반인들에게 훨씬 더 유용할 수 있다"고 설명합니다. "외부 도구에 텍스트를 복사해서 붙여넣는 것은 큰 부담입니다. 사람들은 그냥 그러지 않을 겁니다."

물론 'r/AmItheAsshole' 같은 서브레딧에서 지어낸 시나리오는 결코 새로울 것이 없습니다. 이곳에서는 트롤들이 특히 터무니없는 허구로 구성된 참여 유도용 게시물(Engagement Bait)을 올리는 것으로 알려져 있습니다. 그럼에도 불구하고 식별력 있는 독자라 할지라도 앞서 설명한 것과 같은 비교적 평범한 이야기가 가짜일 것이라고는 의심하지 않을 수 있습니다. (이 글을 공유했던 레딧 이용자는 AI를 사용했는지 여부나 이 게시물로 무엇을 얻고자 했는지에 대한 코멘트 요청에 응답하지 않았으며, 해당 게시물은 나중에 삭제되었습니다.)

AI 탐지 시스템이 완벽하지는 않지만, 팬그램의 시스템은 여러 대학의 제3자 연구원들에게 가장 일관성 있고 정확한 것으로 평가받고 있습니다. 2025년 시카고 대학교의 AI 탐지 소프트웨어 감사 연구는 팬그램에 최고 등급을 부여했으며, 특히 긴 글에서 오탐지율이 거의 0에 가깝다고 지적했습니다. 스페로는 경쟁사보다 뛰어난 이유 중 하나가 'AI와 인간의 경계에 더 가까운 더 어려운 예시들'을 바탕으로 부분적으로 학습되었기 때문이라고 말합니다. 와이어드에 게재된 기사로 테스트했을 때 이 도구가 오탐지를 발생시키는 것을 확인할 수 없었습니다. 팬그램의 성능이 강화된 크롬 도구는 인터넷에서 매일 접하는 콘텐츠 중 얼마나 많은 부분이 AI 생성일 가능성이 있는지 빠르게 보여줍니다. 한 가지 특히 놀라운 예는 다음과 같습니다. 팬그램의 도구는 교황의 AI에 대한 경고 조차 AI가 작성한 것일 수 있다고 제안합니다.

원문 보기
원문 보기 (영어)
Comment Loader Save Story Save this story Comment Loader Save Story Save this story On Monday, a brand-new Reddit account popped up on the widely read forum r/AmItheAsshole, where users have their personal disputes arbitrated by strangers. This particular user asked if they had crossed a line by “refusing to babysit my stepmother’s kids because I have my own job and responsibilities.” The post itself was succinct, straightforward, and grammatically clean, explaining a situation in which the person’s stepmother and father often expected them to provide childcare on little notice, eventually leading to an argument. “Now there’s tension at home, and I’m starting to wonder if I handled it the wrong way,” the redditor concluded. “I do understand that raising kids is stressful, but I also feel like I shouldn’t be obligated to take on that responsibility when it’s not my role.” The responses to this individual were largely supportive: The kids were not theirs to look after, many people replied, and moving out of the house would be the best course of action. But according to AI detection software developed by Pangram Labs —which claims an accuracy rate of 99.98 percent and a false positive rate of just one in 10,000—the original story of family discord was AI-generated. I saw it flagged as AI content while scrolling the page thanks to the latest version of Pangram’s Chrome extension, which rolls out to the public this week; at the paid tier of $20 per month, the tool scans posts on social sites including Reddit, X, LinkedIn, Medium, and Substack in real time, labeling them as human-written, AI-generated, or drafted with assistance from AI. The analysis also includes a measure of Pangram’s confidence in the conclusion: low, medium, or high. Researchers have found AI slop everywhere online. It undermines journalism and social platforms alike. Text generated at least in part by AI accounts for more than a third of all new websites as of 2025, according to a study published this month by researchers at Stanford University, the Imperial College of London, and the Internet Archive. (The researchers used earlier Pangram tools to arrive at their findings.) It’s this mess that Max Spero, CEO of Pangram and a self-professed “ slop janitor ,” wants to help clean up. He tells WIRED that adding instant analysis to the company’s browser extension offers people a more seamless way of checking for AI content across the sites they frequent. “By providing proactive checks, it can be a lot more useful to people who just generally care about not seeing slop,” Spero explains. “It's a big lift to go paste some text into an external tool. People just aren't going to do that.” Of course, made-up scenarios are nothing out of the ordinary on subreddits like r/AmItheAsshole, where trolls have been known to post engagement bait consisting of especially absurd fictions. Yet even a discerning reader may not suspect a relatively unremarkable narrative like the one described above to potentially be fake. (The redditor who shared it did not respond to a request for comment regarding whether they had used AI or what they hoped to achieve with the post, which they later deleted.) While no AI detection system is perfect, Pangram’s is regarded as the most consistent and accurate by third-party researchers at several universities; a 2025 University of Chicago study auditing AI detection software gave Pangram its highest rating and noted that its false positive rate was nearly zero, especially on longer passages. Spero says that one reason it outperforms competitors is that it’s trained in part on “harder examples that are closer to the boundary between AI and human.” I was unable to make it generate a false positive when testing it on articles published in WIRED. Pangram’s souped-up Chrome tool quickly reveals how much of what you encounter on a daily basis across the internet is likely AI-generated. One particularly surprising example: Pangram’s tool suggests the Pope’s official X account seems to be rife with AI text, even in threads where the pontiff discusses the danger that AI poses to the sacred human spirit. On April 17, the @Pontifex account shared a message that began with the claim that Catholics “can form pioneers of a new humanism in the context of the digital revolution.” Pangram’s browser extension labels this post as human-written. The three posts that follow, however—describing how artificial intelligence shapes mentality and social structures—get flagged by the extension as AI-generated. “When simulation becomes the norm, it weakens the human capacity for discernment,” the final AI-tagged post warns. Other X posts from Pope Leo XIV, including thoughts on the ongoing wars in Ukraine and the Middle East as well as a call for “a more equitable distribution of wealth,” were hits for the AI detector as well. “Clearly he doesn't run his Twitter account himself,” Spero says of the Pope. “They have a social media person. But it's also obvious that they use at least some degree of AI.” The Vatican did not return a request for comment on the matter. X users suspicious of lengthy posts from blue-check influencers may feel validated to learn that Pangram frequently identifies these, too, as AI-written. Similarly, there’s no shortage of AI slop on Medium or LinkedIn . And even a cursory glance at some of Substack’s top-trending authors turns up plenty of AI-flagged posts. While some writers would scoff at using AI , many authors are loud and proud about their use of AI-assisted tools. Tech reporter Alex Heath uses Claude Cowork to help him write his articles, which he publishes on Substack . He has even trained Claude to write like him by giving it specific instructions to match his style and voice. In some ways, the content of social feeds are just the tip of the iceberg. Using the original function of the Pangram extension, which allows you to highlight any text online to conduct a manual AI check, you’ll find that a far wider range of writing—including, say, the message from outgoing Apple CEO Tim Cook on the occasion of the company’s 50th anniversary on April 1—gets tagged as positive. (Apple did not immediately respond to a request for comment.) Still, ongoing real-time detection across a handful of popular platforms has the potential to change how people passively absorb information from their screens. Not only will it alert them to specific accounts that pump out AI-generated junk, it will constantly remind them of just how much of that stuff is out in the ether. That, in turn, could make readers more discerning and skeptical—qualities it never hurts to have in an age of deceptive artifice.