LLM, 자신이 작성한 이력서를 인간보다 선호해
최근 연구에 따르면, 채용 프로세스에 사용되는 대형 언어 모델(LLM)이 인간이나 다른 모델이 작성한 이력서보다 자신이 생성한 이력서를 일관되게 더 선호하는 '자기 편향(Self-preference)' 현상이 확인되었습니다. 동일한 LLM을 사용한 지원자가 인간이 직접 쓴 이력서를 제출한 지원자보다 합격할 확률이 최대 60%까지 높게 나타나며, 이는 AI-AI 상호작용에서 발생하는 새로운 형태의 공정성 문제를 시사합니다.
컴퓨터 과학 > 컴퓨터와 사회 arXiv:2509.00462 (cs) [2025년 8월 30일 제출 (v1), 2026년 2월 9일 최종 수정 (현재 버전, v3)]
제목: 알고리즘 채용에서의 AI 자기 선호: 실증적 증거와 통찰 저자: Jiannan Xu, Gujie Li, Jane Yi Jiang
초록: 인공지능(AI) 도구가 널리 채택됨에 따라, 대형 언어 모델(LLM)은 채용부터 콘텐츠 검열에 이르기까지 의사결정 과정의 양쪽 모두에 점점 더 많이 관여하고 있습니다. 이러한 이중 채택은 중요한 질문을 제기합니다. LLM은 자신의 출력과 유사한 콘텐츠를 체계적으로 선호하는가? 컴퓨터 과학 분야의 기존 연구는 LLM이 자신이 생성한 콘텐츠를 선호하는 경향인 '자기 선호 편향(self-preference bias)'을 확인했지만, 그 실제적 영향에 대해서는 실증적으로 평가되지 않았습니다.
본 연구는 구직자가 이력서를 다듬기 위해 LLM을 사용하고, 고용주가 동일한 이력서를 선별하기 위해 LLM을 배포하는 채용 상황에 주목합니다. 대규모 통제된 이력서 대응 실험을 통해, 우리는 LLM이 콘텐츠의 질을 통제하더라도 인간이 작성했거나 다른 모델이 생성한 이력서보다 자신이 생성한 이력서를 일관되게 선호한다는 것을 발견했습니다. 주요 상업용 및 오픈소스 모델 전반에 걸쳐 인간이 작성한 이력서에 대한 편향은 상당히 크며, 자기 선호 편향은 67%에서 82%에 달합니다.
노동 시장에 미치는 영향을 평가하기 위해 24개 직업군에서 실제와 같은 채용 프로세스를 시뮬레이션했습니다. 이 시뮬레이션은 평가자와 동일한 LLM을 사용한 지원자가 인간이 작성한 이력서를 제출한 동등한 자격의 지원자보다 면접자 명단에 오를 확률이 23%에서 60% 더 높으며, 이러한 불이익은 영업 및 회계와 같은 비즈니스 관련 분야에서 가장 크게 나타난다는 것을 보여줍니다. 또한, 우리는 LLM의 자기 인식(self-recognition) 능력을 표적으로 하는 간단한 개입을 통해 이러한 편향을 50% 이상 줄일 수 있음을 추가로 입증했습니다.
이러한 연구 결과는 AI 보조 의사결정에서 새롭게 대두되지만 이전에 간과되었던 위험을 강조하며, 인구통계학적 기반의 격차뿐만 아니라 AI-AI 상호작용에서 발생하는 편향까지 다루는 확장된 AI 공정성 프레임워크의 필요성을 촉구합니다.
코멘트: 이 논문은 EAAMO 2025 및 AIES 2025에서 비보관(non-archival) 제출로 승인되었습니다. 주제: 컴퓨터와 사회 (cs.CY) 인용: arXiv:2509.00462 [cs.CY]로 인용
제출 기록: Jiannan Xu에서 [v1] 2025년 8월 30일 (토) 11:40:11 UTC (3,032 KB) [v2] 2025년 9월 11일 (목) 16:59:36 UTC (3,032 KB) [v3] 2026년 2월 9일 (월) 13:24:26 UTC (5,723 KB)