메뉴

#캐글(Kaggle)

HN
Hacker News 11일 전
IMP 8

뇌졸중·당뇨 임상 AI, '허술한 데이터'로 학습된 실태

구글이 운영하는 데이터 플랫폼인 캐글(Kaggle)에 올라온 근거 없는 질병 데이터셋이 실제 의학 논문과 임상 예측 모델 학습에 무분별하게 사용되고 있는 실태가 적발되었습니다. 영국 퀸즐랜드 공과대학교 연구진은 뇌졸중 및 당뇨병 예측 모델을 분석한 결과, 유명 연예인 사진이나 중복 환자 데이터, 출처 불명의 정보가 섞여 있는 등 데이터의 품질과 윤리적 기준이 심각하게 미달하는 것을 확인했습니다. 이로 인해 관련 논문들이 속속 철회되고 있으며, 온라인 데이터셋을 활용하는 머신러닝 및 의료 AI 연구에서 데이터 검증의 엄밀성이 시급히 요구되고 있습니다.

데이터 품질 임상 AI 논문 철회