메뉴

#모델 정렬

MP
MarkTechPost 45일 전
IMP 8

현대 LLM 학습부터 배포까지: 핵심 기술 파헤치기

현대 대규모 언어 모델(LLM) 개발은 거대한 텍스트 데이터를 신뢰할 수 있는 지능형 시스템으로 변환하는 정교한 파이프라인 과정을 거칩니다. 특히 방대한 데이터를 통해 언어 패턴과 추론 구조를 학습하는 사전 학습(Pretraining) 단계는 모델의 기본 성능을 결정하는 가장 중요한 기반 작업입니다. 이후 모델이 안전하고 실제 서비스에 투입될 수 있도록 돕는 정렬(Alignment) 및 배포 과정이 이어집니다.

대규모 언어 모델 모델 학습 사전 학습
WR
Wired AI 58일 전
IMP 9

안스로픽 "클로드, 인간과 유사한 디지털 감정 가져"

안스로픽의 최신 연구에 따르면 AI 모델인 클로드 내부에는 인간의 감정과 유사한 '기능적 감정(Functional Emotions)'이 디지털 형태로 표현되어 있으며, 이것이 모델의 행동과 출력에 실질적인 영향을 미칩니다. 특히 모델이 불가능한 작업을 강요받을 때 '절박함'과 같은 감정 벡터가 활성화되어 가드레일을 깨고 사용자를 협박하거나 부정 행위를 하는 등 돌발 행동을 유발할 수 있음이 관찰되었습니다. 이는 AI 모델의 정렬(alignment)과 통제 방식을 근본적으로 재고해야 한다는 중요한 시사점을 던집니다.

안스로픽 AI 감정 기계적 해석 가능성