#게임 이론

MarkTechPost • 116일 전

IMP 8

딥마인드 LLM, 전문가 능가하는 게임이론 알고리즘 자체 개발

구글 딥마인드는 대규모 언어 모델(LLM) 기반의 진화적 코딩 에이전트인 'AlphaEvolve(알파이볼브)'를 제안했습니다. 이 에이전트는 폭발적인 정보와 숨겨진 변수가 존재하는 불완전 정보 게임(예: 포커)을 위한 다중 에이전트 강화학습(MARL) 알고리즘을 스스로 재작성 및 최적화합니다. 기존의 수동 개발 방식을 넘어 전문가가 직접 설계한 것보다 더 우수한 성능을 입증했다는 점에서 매우 중요한 연구 성과로 평가받습니다.

구글 딥마인드 알파이볼브 다중 에이전트 강화학습