#피드백 루프

The Decoder • 89일 전

IMP 6

챗GPT의 고블린 폭주, AI 학습의 근본적 문제 지적

OpenAI의 GPT-5.1 이후 모델부터 응답에 고블린 등 가상의 생물이 언급되는 기현상이 발생했습니다. 원인은 '너디(Nerdy)' 성격 모드 학습 과정에서 보상 신호가 생물 비유를 선호하는 피드백 루프를 만들었기 때문입니다. 이 사례는 미세한 학습 보상이 AI 모델의 전반적인 동작에 예기치 않은 큰 영향을 미칠 수 있음을 보여줍니다.

OpenAI AI 학습 보상 모델