메뉴

#빅데이터

MP
MarkTechPost 22일 전
IMP 7

Scanpy를 활용한 단일세포 RNA-seq 분석 파이프라인 구축

본 튜토리얼은 생물정보학의 핵심 기술인 단일세포 RNA 시퀀싱(scRNA-seq) 데이터를 분석하는 전체 파이프라인을 다룹니다. Python의 대표적인 라이브러리인 Scanpy를 활용하여 PBMC-3k 벤치마크 데이터셋을 전처리하고, Leiden 알고리즘으로 세포를 클러스터링하며, 세포 주기를 교정한 뒤 주요 마커를 통해 세포 유형을 주석(annotation) 달아냅니다. 나아가 PAGA와 확산 의사시간(diffusion pseudotime)을 통해 세포의 발달 궤적을 탐색하는 고급 실무 기법까지 제공하므로 데이터 사이언티스트와 생물학 연구자에게 매우 유용합니다.

데이터-사이언스 생물정보학 파이썬
MP
MarkTechPost 48일 전
IMP 7

DuckDB-파이썬 분석 파이프라인 실전 구축 가이드

본 튜토리얼은 DuckDB와 파이썬을 활용하여 고성능 데이터 분석 파이프라인을 구축하는 방법을 다룹니다. SQL, 데이터프레임, Parquet 포맷 통합부터 대용량 데이터 삽입 및 병렬 처리 등 실무적인 성능 최적화 기법까지 코드와 함께 상세히 설명합니다. 데이터 엔지니어와 과학자들에게 빠르고 효율적인 인메모리 분석 엔진인 DuckDB의 활용법을 심도 있게 제공합니다.

데이터 분석 파이썬 DuckDB