생명과학 연약용 AI 모델 GPT-Rosalind 공개
OpenAI가 생명과학 연구 및 신약 개발을 가속하기 위해 특화된 최신 추론 모델 'GPT-Rosalind'를 연구 프리뷰로 공개했습니다. 이 모델은 문헌 리뷰, 가설 생성, 실험 계획 등 복잡한 다단계 연구 워크플로우를 지원하며, 암젠, 모더나 등 글로벌 제약·바이오 기업들과 협력하여 실제 연구에 적용되고 있습니다.
2026년 4월 16일 연구 릴리스: 생명과학 연구를 위한 GPT-Rosalind 소개. 과학적 연구와 신약 개발을 가속하기 위해 특별히 구축된 새로운 목적형 모델입니다.
오늘, 우리는 생물학, 신약 개발, 전환 의학(Translational medicine) 분야의 연구를 지원하기 위해 구축된 최첨단 추론 모델인 GPT-Rosalind를 소개합니다. 이 생명과학 모델 시리즈는 과학적 워크플로우에 최적화되어, 향상된 도구 활용 능력과 화학, 단백질 공학, 유전체학에 대한 더 깊은 이해를 결합했습니다.
미국에서 새로운 신약이 표적 발견부터 규제 승인을 받기까지 평균적으로 약 10~15년이 걸립니다. 발견의 가장 초기 단계에서 얻은 성과는 하류 과정에서 더 나은 표적 선정, 더 강력한 생물학적 가설, 그리고 더 높은 품질의 실험으로 복합적인 이득을 창출합니다.
생명과학의 발전은 기초 과학의 난이도 때문일 뿐만 아니라 연구 워크플로우 자체의 복잡성에 의해 제약을 받습니다. 과학자들은 새로운 아이디어를 생성하고 평가하기 위해 방대한 문헌, 전문 데이터베이스, 실험 데이터, 그리고 끊임없이 변화하는 가설을 다루어야 합니다. 이러한 워크플로우는 시간이 많이 소요되고, 파편화되어 있으며, 확장하기가 어렵습니다.
우리는 고도화된 AI 시스템이 연구자들이 이러한 워크플로우를 더 빠르게 진행할 수 있도록 도울 수 있다고 믿습니다. 단순히 기존 작업을 더 효율적으로 만드는 것을 넘어, 과학자들이 더 많은 가능성을 탐색하고, 그렇지 않으면 놓칠 수 있는 연관성을 발굴하며, 더 빠르게 더 나은 가설에 도달할 수 있도록 돕는 것입니다.
증거 종합, 가설 생성, 실험 계획 및 기타 다단계 연구 작업을 지원함으로써, 이 모델은 연구자들이 발견의 초기 단계를 가속화하도록 설계되었습니다. 시간이 지남에 따라 이러한 시스템은 생명과학 조직이 기존에는 불가능했던 획기적인 발견을 훨씬 더 높은 성공률로 이루어낼 수 있도록 도울 것입니다.
GPT-Rosalind는 현재 신뢰할 수 있는 액세스 프로그램(Trusted Access Program)을 통해 ChatGPT, Codex 및 API에서 자격을 갖춘 고객에게 연구 프리뷰로 제공됩니다. 또한 과학자들이 모델을 50개 이상의 과학 도구 및 데이터 소스에 연결할 수 있도록 돕는 무료 접근 가능한 Codex용 생명과학 연구 플러그인도 도입했습니다.
우리는 암젠(Amgen), 모더나(Moderna), 앨런 연구소(Allen Institute), 서모 피셔 사이언티픽(Thermo Fisher Scientific) 및 기타 고객들과 협력하여 연구 및 발견을 가속화하는 워크플로우 전반에 GPT-Rosalind를 적용하고 있습니다.
이 모델의 이름은 엄격한 연구를 통해 DNA의 구조를 밝히고 현대 분자생물학의 기초를 닦아낸 로절린드 프랭클린(Rosalind Franklin)의 이름을 따서 지어졌습니다.
과학적 워크플로우를 위해 구축됨 GPT-Rosalind 생명과학 모델 시리즈는 출판된 증거, 데이터, 도구 및 실험에 이르는 현대 과학 연구를 위해 구축되었습니다. 우리의 평가 결과, 이 모델은 분자, 단백질, 유전자, 경로(Pathways) 및 질병 관련 생물학에 대한 추론이 필요한 작업에서 최고의 성능을 발휘합니다. 또한 문헌 리뷰, 염기서열-기능 해석(Sequence-to-function interpretation), 실험 계획 및 데이터 분석과 같은 다단계 워크플로우에서 과학적 도구와 데이터베이스를 더욱 효과적으로 사용합니다.
이번 출시는 GPT-Rosalind 생명과학 모델 시리즈의 첫 번째 릴리스이며, 앞으로도 긴 시간이 소요되고 도구 사용이 많은 과학적 워크플로우 전반에 걸쳐 모델의 생화학적 추론 기능의 한계를 계속 확장해 나갈 것입니다.
OpenAI의 컴퓨팅 인프라는 실제 과학 작업을 기반으로 점점 더 유능한 도메인 특화 모델을 지속적으로 훈련, 평가 및 개선할 수 있는 능력을 제공합니다. 이는 워크플로우 자체가 더 복잡해짐에 따라 이러한 시스템이 더욱 유용해지도록 도와줍니다.
고객 및 생태계 우리는 선도적인 제약사, 바이오테크 기업, 연구 고객뿐만 아니라 생명과학 기술 조직들과 협력하여 발견을 주도하는 워크플로우 전반에 걸쳐 생명과학 모델을 적용하고 있습니다.