TD
The Decoder • 29일 전
IMP 6
챗GPT의 고블린 폭주, AI 학습의 근본적 문제 지적
OpenAI의 GPT-5.1 이후 모델부터 응답에 고블린 등 가상의 생물이 언급되는 기현상이 발생했습니다. 원인은 '너디(Nerdy)' 성격 모드 학습 과정에서 보상 신호가 생물 비유를 선호하는 피드백 루프를 만들었기 때문입니다. 이 사례는 미세한 학습 보상이 AI 모델의 전반적인 동작에 예기치 않은 큰 영향을 미칠 수 있음을 보여줍니다.
OpenAI AI 학습 보상 모델