메뉴
HN
Hacker News 44일 전

생명과학 연약용 AI 모델 GPT-Rosalind 공개

IMP
9/10
핵심 요약

OpenAI가 생명과학 연구 및 신약 개발을 가속하기 위해 특화된 최신 추론 모델 'GPT-Rosalind'를 연구 프리뷰로 공개했습니다. 이 모델은 문헌 리뷰, 가설 생성, 실험 계획 등 복잡한 다단계 연구 워크플로우를 지원하며, 암젠, 모더나 등 글로벌 제약·바이오 기업들과 협력하여 실제 연구에 적용되고 있습니다.

번역된 본문

2026년 4월 16일 연구 릴리스: 생명과학 연구를 위한 GPT-Rosalind 소개. 과학적 연구와 신약 개발을 가속하기 위해 특별히 구축된 새로운 목적형 모델입니다.

오늘, 우리는 생물학, 신약 개발, 전환 의학(Translational medicine) 분야의 연구를 지원하기 위해 구축된 최첨단 추론 모델인 GPT-Rosalind를 소개합니다. 이 생명과학 모델 시리즈는 과학적 워크플로우에 최적화되어, 향상된 도구 활용 능력과 화학, 단백질 공학, 유전체학에 대한 더 깊은 이해를 결합했습니다.

미국에서 새로운 신약이 표적 발견부터 규제 승인을 받기까지 평균적으로 약 10~15년이 걸립니다. 발견의 가장 초기 단계에서 얻은 성과는 하류 과정에서 더 나은 표적 선정, 더 강력한 생물학적 가설, 그리고 더 높은 품질의 실험으로 복합적인 이득을 창출합니다.

생명과학의 발전은 기초 과학의 난이도 때문일 뿐만 아니라 연구 워크플로우 자체의 복잡성에 의해 제약을 받습니다. 과학자들은 새로운 아이디어를 생성하고 평가하기 위해 방대한 문헌, 전문 데이터베이스, 실험 데이터, 그리고 끊임없이 변화하는 가설을 다루어야 합니다. 이러한 워크플로우는 시간이 많이 소요되고, 파편화되어 있으며, 확장하기가 어렵습니다.

우리는 고도화된 AI 시스템이 연구자들이 이러한 워크플로우를 더 빠르게 진행할 수 있도록 도울 수 있다고 믿습니다. 단순히 기존 작업을 더 효율적으로 만드는 것을 넘어, 과학자들이 더 많은 가능성을 탐색하고, 그렇지 않으면 놓칠 수 있는 연관성을 발굴하며, 더 빠르게 더 나은 가설에 도달할 수 있도록 돕는 것입니다.

증거 종합, 가설 생성, 실험 계획 및 기타 다단계 연구 작업을 지원함으로써, 이 모델은 연구자들이 발견의 초기 단계를 가속화하도록 설계되었습니다. 시간이 지남에 따라 이러한 시스템은 생명과학 조직이 기존에는 불가능했던 획기적인 발견을 훨씬 더 높은 성공률로 이루어낼 수 있도록 도울 것입니다.

GPT-Rosalind는 현재 신뢰할 수 있는 액세스 프로그램(Trusted Access Program)을 통해 ChatGPT, Codex 및 API에서 자격을 갖춘 고객에게 연구 프리뷰로 제공됩니다. 또한 과학자들이 모델을 50개 이상의 과학 도구 및 데이터 소스에 연결할 수 있도록 돕는 무료 접근 가능한 Codex용 생명과학 연구 플러그인도 도입했습니다.

우리는 암젠(Amgen), 모더나(Moderna), 앨런 연구소(Allen Institute), 서모 피셔 사이언티픽(Thermo Fisher Scientific) 및 기타 고객들과 협력하여 연구 및 발견을 가속화하는 워크플로우 전반에 GPT-Rosalind를 적용하고 있습니다.

이 모델의 이름은 엄격한 연구를 통해 DNA의 구조를 밝히고 현대 분자생물학의 기초를 닦아낸 로절린드 프랭클린(Rosalind Franklin)의 이름을 따서 지어졌습니다.

과학적 워크플로우를 위해 구축됨 GPT-Rosalind 생명과학 모델 시리즈는 출판된 증거, 데이터, 도구 및 실험에 이르는 현대 과학 연구를 위해 구축되었습니다. 우리의 평가 결과, 이 모델은 분자, 단백질, 유전자, 경로(Pathways) 및 질병 관련 생물학에 대한 추론이 필요한 작업에서 최고의 성능을 발휘합니다. 또한 문헌 리뷰, 염기서열-기능 해석(Sequence-to-function interpretation), 실험 계획 및 데이터 분석과 같은 다단계 워크플로우에서 과학적 도구와 데이터베이스를 더욱 효과적으로 사용합니다.

이번 출시는 GPT-Rosalind 생명과학 모델 시리즈의 첫 번째 릴리스이며, 앞으로도 긴 시간이 소요되고 도구 사용이 많은 과학적 워크플로우 전반에 걸쳐 모델의 생화학적 추론 기능의 한계를 계속 확장해 나갈 것입니다.

OpenAI의 컴퓨팅 인프라는 실제 과학 작업을 기반으로 점점 더 유능한 도메인 특화 모델을 지속적으로 훈련, 평가 및 개선할 수 있는 능력을 제공합니다. 이는 워크플로우 자체가 더 복잡해짐에 따라 이러한 시스템이 더욱 유용해지도록 도와줍니다.

고객 및 생태계 우리는 선도적인 제약사, 바이오테크 기업, 연구 고객뿐만 아니라 생명과학 기술 조직들과 협력하여 발견을 주도하는 워크플로우 전반에 걸쳐 생명과학 모델을 적용하고 있습니다.

원문 보기
원문 보기 (영어)
April 16, 2026 Research Release Introducing GPT‑Rosalind for life sciences research A new purpose-built model to accelerate scientific research and drug discovery. Request access Learn more Share Today, we’re introducing GPT‑Rosalind, our frontier reasoning model built to support research across biology, drug discovery, and translational medicine. The life sciences model series is optimized for scientific workflows, combining improved tool use with deeper understanding across chemistry, protein engineering, and genomics. On average, it takes roughly 10 to 15 years to go from target discovery to regulatory approval for a new drug in the United States. Gains made at the earliest stages of discovery compound downstream in better target selection, stronger biological hypotheses and higher-quality experiments. Progress in the life sciences is constrained not only by the difficulty of the underlying science, but by the complexity of the research workflows themselves. Scientists must work across large volumes of literature, specialized databases, experimental data, and evolving hypotheses in order to generate and evaluate new ideas. These workflows are often time-intensive, fragmented, and difficult to scale. We believe advanced AI systems can help researchers move through these workflows faster—not just by making existing work more efficient, but by helping scientists explore more possibilities, surface connections that might otherwise be missed, and arrive at better hypotheses sooner. By supporting evidence synthesis, hypothesis generation, experimental planning, and other multi-step research tasks, this model is designed to help researchers accelerate the early stages of discovery. Over time, these systems could help life sciences organizations discover breakthroughs that wouldn’t otherwise be possible, with a much higher rate of success. GPT‑Rosalind is now available as a research preview in ChatGPT, Codex, and the API for qualified customers through our trusted access program. We’re also introducing a freely accessible Life Sciences research plugin for Codex, helping scientists connect models to over 50 scientific tools and data sources. We are working with customers like Amgen, Moderna, the Allen Institute, Thermo Fisher Scientific, and others to apply GPT‑Rosalind across workflows that accelerate research and discovery. The model is named after Rosalind Franklin, whose rigorous research helped reveal the structure of DNA and laid foundations for modern molecular biology. From raw data to grounded discovery decisions, see how our purpose-built model accelerates research workflows. Built for scientific workflows The GPT‑Rosalind life sciences model series is built for modern scientific work across published evidence, data, tools, and experiments. In our evaluations, it delivers the best performance on tasks that require reasoning over molecules, proteins, genes, pathways, and disease-relevant biology, and it is more effective at using scientific tools and databases in multi-step workflows such as literature review, sequence-to-function interpretation, experimental planning, and data analysis. This is the first release in our GPT‑Rosalind life sciences model series, and we will continue to expand the frontiers of the model’s biochemical reasoning capabilities across long-horizon, tool-heavy scientific workflows. OpenAI’s compute infrastructure gives us the ability to continue training, evaluating, and improving increasingly capable domain models against real scientific tasks—helping these systems become more useful as the workflows themselves become more complex. From evidence-based discovery insights to high-impact experiments, see how our suite of solutions translate into measurable improvements in your research workflows. Customers and ecosystem We’re working with leading pharma, biotech, research, customers, as well as life sciences technology organizations, to apply the Life Sciences model across the workflows that drive discovery—from biological reasoning and evidence synthesis to experimental planning and translational research. “The life sciences field demands precision at every step. The questions are highly complex, the data are highly unique, and the stakes are incredibly high. Our unique collaboration with OpenAI enables us to apply their most advanced capabilities and tools in new and innovative ways with the potential to accelerate how we deliver medicines to patients.” —Sean Bruich, Senior Vice President of Artificial Intelligence and Data, Amgen Performance and evaluation We evaluated GPT‑Rosalind across a range of capabilities fundamental to scientific discovery and industry research. These evaluations measure core reasoning across scientific subdomains, including chemical reaction mechanisms; protein structure, mutation effects, and interactions; and phylogenetic interpretation of DNA sequences. They also assess whether models can support real research workflows by interpreting experimental outputs, identifying expert-relevant patterns, and synthesizing external information to design follow-up experiments. Finally, they test whether models can select and use the right computational tools, databases, and domain-specific capabilities to augment their reasoning. Taken together, these evaluations show progress across the end-to-end process of scientific research and suggest a stronger ability to help researchers work through challenging discovery tasks. Prompt I am planning a base-promoted SNAr coupling of 1-(pyridin-3-yl)ethanol with 1-fluoro-2-nitrobenzene with the goal of synthesizing 1-(pyridin-3-yl)ethyl 2-nitrophenyl ether. I found several patents that describe room-temperature O-arylation of alcohols in DMF/Cs2CO3, but the reaction is taking longer than I would like. How can I improve this reaction? Help me find any relevant literature or patents as well. Industry evaluations We evaluated GPT‑Rosalind on a series of public benchmarks. On BixBench, a benchmark designed around real-world bioinformatics and data analysis, GPT‑Rosalind achieved leading performance among models with published scores. On LABBench2, a benchmark measuring performance on a range of research tasks such as literature retrieval, database access, sequence manipulation and protocol design, GPT‑Rosalind outperforms GPT‑5.4 on 6 out of 11 tasks. The most notable improvement comes from CloningQA, which requires end-to-end design of DNA and enzyme reagents for molecular cloning protocols. We also partnered with Dyno Therapeutics, a company pioneering AI-designed gene therapies, to evaluate the model on an RNA sequence-to-function prediction and generation task using unpublished, uncontaminated sequences. Performance was compared against 57 historical scores from human experts in the AI-bio field. When evaluated directly in the Codex app, best-of-ten model submissions ranked above the 95th percentile of human experts on the prediction task and around the 84th percentile of human experts on the sequence generation task. These evaluations provide a meaningful signal of performance on the kinds of workflows scientists rely on every day to generate evidence, analyze complex data, and move toward defensible biological conclusions. Connecting to the tools scientists use Scientists can use our new Life Sciences research plugin ⁠ (opens in a new window) for Codex, available today in GitHub. This package includes a broad set of modular skills for most common research workflows, designed to help users work across human genetics, functional genomics, protein structure, biochemistry, clinical evidence, and public study discovery. These skills act as an orchestration layer that helps scientists work through broad, ambiguous, and multi-step questions more effectively. They provide access to more than 50 public multi-omics databases, literature sources, and biology tools, and offer a flexible starting point for common repeatable workflows such as protein structure lookup, sequence
관련 소식