의료계에 도입된 AI, 환자에게 실제 도움이 될까?
최근 병원을 비롯한 의료 현장에서 AI의 도입이 급증하고 있지만, 이것이 실제로 환자의 건강과 치료 결과(Health outcomes) 향상으로 이어지는지는 아직 검증되지 않았습니다. 전문가들은 의료진의 업무 편의성과 만족도 개선에만 집중할 것이 아니라, AI가 의사의 임상적 의사결정이나 인지적 정보 처리에 미치는 영향과 잠재적 부작용을 체계적으로 평가해야 한다고 경고하고 있습니다.
AI가 어디에나 있다는 사실이나, 병원에서 AI의 사용이 점점 늘어나고 있다는 사실을 굳이 제가 말씀드릴 필요는 없을 것입니다. 의사들은 기록 작성을 돕기 위해 AI를 사용하고 있습니다. AI 기반 도구들은 환자 기록을 샅샅이 뒤져 특정 지원이나 치료가 필요할 수 있는 사람들을 표시합니다. 또한 의학 검사 결과와 엑스레이(X-ray)를 해석하는 데에도 사용됩니다. 점점 더 많은 연구에 따르면 이러한 도구들 중 다수가 정확한 결과를 제공할 수 있다고 합니다. 하지만 여기에는 더 큰 질문이 있습니다. 이를 사용하는 것이 실제로 환자의 더 나은 건강 결과로 이어지는가? 우리는 아직 이에 대한 명확한 답을 가지고 있지 않습니다. 이것이 바로 이번 주 '네이처 메디신(Nature Medicine)' 저널에 발표된 논문에서 미시간 대학교의 컴퓨터 과학자 제나 위엔스(Jenna Wiens)와 토론토 대학교의 안나 골든버그(Anna Goldenberg)가 주장하는 바입니다.
위엔스는 기자에게 자신이 AI가 의료에 어떻게 도움이 될 수 있는지 조사하는 데 수년을 보냈다고 말했습니다. 그녀는 경력의 첫 10년 동안 임상의들에게 이 기술을 도입하려고 설득해 왔습니다. 지난 몇 년 동안, 마치 "스위치가 켜진 것처럼" 상황이 바뀌었다고 그녀는 말합니다. 의료 제공자들은 이러한 기술의 가능성에 훨씬 더 관심을 보일 뿐만 아니라, 이를 빠르게 배치하고 사용하기 시작했습니다. 문제는 많은 의료 기관이 이 기술들이 실제로 얼마나 잘 작동하는지 엄격하게 평가하지 않고 있다는 것입니다.
예를 들어, '앰비언트 AI(Ambient AI)' 도구를 살펴보겠습니다. AI 서기(AI scribes)라고도 불리는 이 도구들은 의사와 환자 간의 대화를 "듣고" 그것을 전사하여 요약합니다. 여러 도구가 이미 시장에 나와 있으며, 의료 기관들에 의해 널리 채택되고 있습니다. 몇 달 전, 의사들을 위한 AI 도구를 개발하는 뉴욕의 한 주요 의료 센터 직원은 내게 일화를 통해 의사들이 이 기술에 "열광"하고 있다고 말했습니다. 이를 통해 진료 시간에 환자에게 모든 주의를 기울일 수 있고, 시간이 많이 걸리는 서류 작업에서 벗어날 수 있기 때문입니다. 초기 연구들은 이러한 일화를 뒷받침하며, 이 도구들이 임상의의 소진(burnout)을 줄일 수 있다고 시사합니다. 지금까지는 모든 것이 순조롭고 좋습니다. 하지만 환자의 건강 결과는 어떨까요? "[연구자들은] 의료진이나 환자의 만족도는 평가했지만, 이러한 도구들이 임상적 의사결정에 어떻게 영향을 미치는지는 실제로 평가하지 않았습니다."라고 위엔스는 말합니다. "우리는 그저 알지 못합니다."
이는 의료 환경에서 사용되는 다른 AI 기반 기술들에도 마찬가지로 적용됩니다. 일부는 환자의 건강 궤적을 예측하는 데 사용되고, 다른 일부는 치료를 권장하는 데 사용됩니다. 이러한 도구들은 의료를 보다 효과적이고 효율적으로 만들도록 설계되었습니다. 하지만 "정확한" 도구라고 해서 반드시 건강 결과를 향상시키는 것은 아닙니다. 예를 들어, AI는 흉부 엑스레이 해석 속도를 높일 수 있습니다. 하지만 의사는 그 분석에 얼마나 의존할까요? 그 도구는 의사가 환자와 상호작용하거나 치료를 권장하는 방식에 어떤 영향을 미칠까요? 그리고 궁극적으로, 이것이 환자들에게 무엇을 의미할까요? 이러한 질문에 대한 대답은 병원이나 부서에 따라 다를 수 있으며, 임상 업무 흐름에 따라 달라질 수 있다고 위엔스는 말합니다. 또한 다양한 경력 단계에 있는 의사들에 따라서도 다를 수 있습니다.
또 다른 예로 AI 서기를 생각해 보십시오. 교육 분야에서 AI 사용에 관한 일부 연구에 따르면, 이러한 도구가 사람들이 정보를 인지적으로 처리하는 방식에 영향을 미칠 수 있다고 합니다. 이것이 의사가 환자의 정보를 처리하는 방식에 영향을 줄 수 있을까요? 이 도구들은 의료진이 환자 데이터를 생각하는 방식에 영향을 미쳐 결과적으로 치료에 영향을 미칠까요? 이러한 질문들은 탐구될 필요가 있다고 위엔스는 말합니다. "우리는 시간을 절약해 주는 것을 좋아하지만, 이로 인해 발생할 수 있는 의도치 않은 결과에 대해서도 생각해야 합니다."라고 그녀는 덧붙였습니다.
미네소타 대학교의 페이지 논(Paige Nong)과 동료들이 2025년 1월에 발표한 연구에 따르면, 미국 병원의 약 65%가 AI 보조 예측 도구를 사용하고 있었습니다. 그 병원들 중 3분의 2만이 그 정확도를 평가했습니다. 편향성(bias)에 대해 평가한 곳은 훨씬 더 적었습니다. 위엔스에 따르면 이러한 도구를 사용하는 병원의 수는 그 이후에도 계속 증가했을 가능성이 높습니다. 이러한 병원이나 도구 개발 회사가 아닌 다른 주체들은 이러한 도구가 특정 환경에서 얼마나 도움이 되는지 구체적으로 평가할 필요가 있습니다. 의도치 않은 결과로 인해 환자의 상태가 더 악화될 가능성도 존재합니다.