#머신러닝

AI 공동 연구원 구축: EGFR 억제제 발견을 위한 QSAR 모델

이 튜토리얼에서는 ChEMBL과 RDKit 등의 도구를 활용하여 EGFR C797S 억제제를 탐색하는 자율 AI 공동 연구원(co-scientist) 시스템을 구축합니다. 단순한 예측 모델을 넘어, SHAP을 통한 결과 해석과 BRICS 기법을 활용한 신규 화합물 생성 및 우선순위 평가까지 신약 후보 물질 발굴의 전 과정을 자동화했다는 점이 핵심입니다. 제약 및 AI 신약 개발 실무자에게 매우 유용한 엔드투엔드(End-to-End) 가이드라인을 제공합니다.

AI 신약 개발 머신러닝 QSAR 모델

Hacker News • 27일 전

자동차 소리로 고장 진단하는 오디오 ML 파이프라인 'cardiag'

스마트폰으로 녹음한 자동차 소리만으로 기계적 고장을 분류하는 엔드투엔드 오디오 머신러닝 파이프라인인 'cardiag'가 공개되었습니다. 이 프로젝트는 YouTube나 TikTok에서 데이터를 수집해 정제한 뒤, 고정된 CLAP(Contrastive Language-Audio Pretraining) 모델로 특징을 추출하고 경량 모델을 학습시켜 고장을 분류합니다. 무엇보다 확신이 없을 때 부정확한 답변 대신 '불확실(UNCERTAIN)'하다고 알려주는 책임감 있는 설계가 돋보이며, 이러한 오디오 전처리 및 정직한 학습 방법론은 다른 오디오 데이터셋에도 재사용할 수 있다는 점에서 가치가 있습니다.

오디오-처리 머신러닝 고장-진단

Hacker News • 28일 전

구글, 표 형식 데이터 제로샷 파운데이션 모델 'TabFM' 공개

구글 리서치가 기존 복잡한 데이터 전처리와 하이퍼파라미터 튜닝 없이도 새로운 표 데이터를 즉시 예측할 수 있는 제로샷 파운데이션 모델 'TabFM'을 발표했습니다. 이 모델은 대규모 언어 모델(LLM)의 맥락 내 학습(ICL) 방식을 표 형식 데이터에 적용하여, 분류 및 회귀 작업을 단 한 번의 실행으로 처리할 수 있게 만들어 데이터 실무자에게 큰 혁신을 가져올 것으로 기대됩니다.

구글 머신러닝 파운데이션모델

Hacker News • 41일 전

x86 아키텍처 AI 연산 가속(ACE) 사양

인텔과 AMD 등이 사용하는 x86 아키텍처를 위해 머신러닝(ML) 작업의 핵심인 행렬 곱셈과 저정밀도 데이터 포맷을 가속하는 확장 명령어 'ACE(AI Compute Extensions)' 사양이 공개되었습니다. 이는 기존 AVX 명령어와 긴밀하게 통합되어 타일(Tile) 기반의 고밀도 연산을 가능하게 하여 AI 모델 학습 및 추론 성능을 크게 높일 수 있는 중요한 기술적 기반입니다.

x86 하드웨어 가속기 명령어 집합

MarkTechPost • 46일 전

그래프 신경망(GNN) PyTorch Geometric 공간 데이터 분석

공간 그래프 신경망으로 도시 기능 추론하기

OpenStreetMap 데이터와 city2graph, PyTorch Geometric 라이브러리를 활용해 도시의 공간 구조를 그래프 형태로 분석하는 엔드투엔드(End-to-End) 학습 파이프라인을 구축한 기술 블로그입니다. 개발자는 도시의 POI(관심 지점)와 도로망 데이터를 수집해 이질적 및 동질적 그래프를 구성하고, GraphSAGE 모델을 학습시켜 공간 구조만으로 POI 카테고리를 예측합니다. 이는 데이터 기반의 스마트시티 분석 및 도시 계획에 있어 실용적인 그래프 AI 구현 방법을 보여준다는 점에서 중요합니다.

Hacker News • 49일 전

머신러닝 하이퍼파라미터 최적화 LLM 에이전트

LLM, 기존 하이퍼파라미터 최적화 알고리즘을 이길 수 있을까?

본 연구는 LLM 에이전트가 기존 하이퍼파라미터 최적화(HPO) 기법보다 우수한지 평가합니다. 실험 결과, 최첨단 LLM 모델을 활용하더라도 CMA-ES나 TPE 같은 고전적 알고리즘의 성능을 넘지 못했습니다. 대신, 연구진이 기존 알고리즘과 LLM의 장점을 결합한 하이브리드 모델인 Centaur를 제안하여 LLM이 기존 최적화 알고리즘을 완전히 대체하기보다는 보완재로 쓰일 때 가장 효과적임을 입증했습니다.

MarkTechPost • 50일 전

ClawHub 보안 신호 분석 및 판정 분류 코딩 가이드

본 튜토리얼은 ClawHub Security Signals 데이터셋을 활용해 보안 스캐너들이 AI 스킬을 어떻게 평가하는지 분석합니다. VirusTotal, 정적 분석, SkillSpector 간의 일치도를 통계 지표로 측정하고, SKILL.md 텍스트와 스캐너 신호를 결합해 최종 보안 판정을 내리는 로지스틱 회귀 모델을 구축하는 과정을 다룹니다. 이 가이드는 AI 스킬의 잠재적 보안 위협을 체계적으로 탐지하고 분류하는 실무적인 엔드투엔드 데이터 분석 방법을 제공한다는 점에서 중요합니다.

보안 분석 데이터 분석 머신러닝

MarkTechPost • 62일 전

사카나 AI, 잔차 네트워크를 독립 훈련 블록으로 변환하는 'DiffusionBlocks' 제안

사카나 AI는 기존의 잔차 네트워크(Residual Networks)를 개별적으로 학습 가능한 독립 모듈로 변환하는 새로운 블록 단위 학습 프레임워크인 DiffusionBlocks를 제안했습니다. 이 프레임워크는 네트워크 내 레이어 업데이트를 역방향 확산(Diffusion)의 노이즈 제거(Denoising) 단계로 해석하여 모델을 분할하는 혁신적인 방식을 제공합니다. 이를 통해 대규모 모델의 효율적인 분산 학습 및 최적화가 가능해져 AI 실무자들에게 획기적인 학습 효율 개선을 기대할 수 있습니다.

머신러닝 모델학습 확산모델

Hacker News • 68일 전

CODA: 트랜스포머 블록을 GEMM 에필로그 프로그램으로 재작성

AI 모델 학습 시 흔히 발생하는 메모리 병목 현상을 해결하기 위해, 개별적으로 처리되던 연산들을 하나의 GPU 커널(GEMM Epilogue)로 통합하여 성능을 극대화하는 새로운 추상화 기법인 CODA를 제안합니다. 이 방식은 데이터 이동을 최소화하면서도 프레임워크 수준의 생산성과 하드웨어 수준의 극적인 효율성을 동시에 달성할 수 있도록 돕습니다.

머신러닝 GPU 최적화 커널 개발

r/singularity • 82일 전

AI로 1만 개 이상의 새로운 외계행성 후보 발견

과학자들이 새로운 머신러닝 알고리즘을 활용해 NASA의 TESS 위성 데이터를 분석, 1만 개 이상의 새로운 외계행성 후보를 발견했습니다. 이는 기존에 확인된 외계행성의 수를 단번에 3배 가까이 늘릴 수 있는 기록적인 성과입니다. 연구팀은 이미 이 중 하나를 실제 망원경 관측을 통해 확인하며 알고리즘의 신뢰성을 입증했습니다.

머신러닝 외계행성 탐사 천문학

Hacker News • 83일 전

디퓨전 모델의 적분 학습과 플로우 맵

디퓨전 모델의 샘플링 속도를 획기적으로 높이기 위해 중간의 반복적인 단계를 건너뛰고 적분값을 직접 예측하는 '플로우 맵(Flow Map)' 기술을 소개하는 글입니다. 플로우 맵은 단순히 샘플링 속도만 개선하는 것을 넘어 보상 기반 학습의 효율성과 샘플링 제어 능력을 향상시키는 등 다양한 장점을 제공합니다. 최근 AI 연구 분야에서 매우 주목받고 있으며, 기존 디퓨전 모델의 한계를 극복할 대안으로 떠오르고 있습니다.

디퓨전 모델 플로우 맵 딥러닝

Hacker News • 88일 전

로컬 100% 실행, 프라이버시 강화 AI 데이터 분석가 'MLJAR Studio'

클라우드 전송 없이 사용자의 PC 환경에서 완벽하게 구동되는 100% 로컬 기반의 AI 데이터 분석 및 머신러닝 도구입니다. 자연어로 데이터에 질문하면 AI가 파이썬 코드를 생성 및 실행하고, 자동으로 최적의 머신러닝 모델을 탐색하며 그 결과를 노트북으로 저장합니다. 민감한 데이터를 다루는 데이터 분석가와 연구자들이 데이터 유출 걱정 없이 안전하게 AI 기능을 활용할 수 있다는 점이 가장 큰 특징입니다.

데이터 분석 로컬 AI 머신러닝

Google AI Blog • 91일 전

구글 번역 20주년: 신기한 기능과 새로운 AI 업데이트

구글 번역이 출시 20주년을 맞이하여 AI 기반의 '발음 연습' 기능 등 신규 기능을 대거 선언했습니다. 2006년 통계적 기계 학습(SML)으로 시작해 2016년 신경망(Neural Network) 도입을 거쳐, 현재는 자체 AI 모델인 제미나이(Gemini)와 TPU 하드웨어를 활용해 전 세계 약 250개 언어를 지원하며 매월 10억 명 이상의 사용자와 1조 단어 이상을 번역하는 핵심 소통 플랫폼으로 자리 잡았습니다.

구글 번역 AI 번역 발음 연습

Hacker News • 95일 전

딥러닝의 과학적 이론이 도래할 것이다

제이미 사이먼(Jamie Simon) 등 14명의 연구진은 딥러닝의 훈련 과정, 가중치, 성능 등을 설명하는 과학적 이론이 등장하고 있음을 주장합니다. 이 논문은 기계 학습 역학(learning mechanics)이라는 새로운 관점을 통해 다섯 가지 주요 연구 흐름을 통합하며, 기존의 '블랙박스'로 여겨지던 신경망의 작동 원리를 수학적, 역학적으로 규명할 수 있는 기반을 마련했다는 점에서 학계와 실무 양쪽에 큰 의의를 갖습니다.

딥러닝 이론 학습 역학 신경망

Hacker News • 96일 전

머신러닝, 역사적 천문 사진 속 미지의 일시적 현상 발견

스푸트니크 발사 전 역사적 천문 관측 사진에서 나타났다 사라지는 미지의 일시적 현상(Transient phenomenon)에 대한 연구입니다. 연구진은 머신러닝 모델을 활용해 기존에 기록된 10만여 개의 일시적 천체를 분석한 결과, 이들이 단순한 사진 결함이 아닌 실제 천문학적 현상일 가능성이 매우 높다는 것을 통계적으로 입증했습니다. 이는 AI가 방대한 역사 데이터에서 숨겨진 천문학적 신호를 찾아내는 데 매우 유용하게 쓰일 수 있음을 보여줍니다.

머신러닝 천문학 데이터 분석

Google AI Blog • 98일 전

에이전트 시대를 위한 두 가지 특수 TPU 공개

사용자를 대신해 복잡한 업무를 수행하는 자율형 AI 에이전트 시대에 맞춰 새로운 두 가지 TPU 칩이 공개되었습니다. AI 에이전트의 빠른 추론 및 실행을 돕는 'TPU 8i'와 방대한 단일 메모리 풀에서 대규모 모델 학습에 최적화된 'TPU 8t'가 출시되어, 일상 사용자들에게도 반응성이 뛰어난 에이전트 AI 제공이 가능해질 전망입니다.

TPU AI 에이전트 인프라

MarkTechPost • 98일 전

r/MachineLearning • 100일 전

Hyperopt와 조건부 베이지안 하이퍼파라미터 최적화

본 튜토리얼에서는 Hyperopt와 TPE(Tree-structured Parzen Estimator) 알고리즘을 활용하여 고급 베이지안 하이퍼파라미터 최적화 워크플로우를 구현합니다. 서로 다른 모델 패밀리 간에 동적으로 전환하는 조건부 검색 공간을 구축하여 Hyperopt가 계층적이고 구조화된 매개변수 그래프를 어떻게 처리하는지 보여줍니다. 또한 scikit-learn 파이프라인 내부에 교차 검증(Cross-validation)을 적용하여 조기 종료(Early Stopping) 기능을 지원하는 프로덕션급 목적 함수(Objective function)를 구축합니다.

머신러닝 하이퍼파라미터 튜닝 베이지안 최적화

매일 쏟아지는 AI 논문: arXiv ML 분야 일일 100~200편 게재

프론티어 AI 모델 경쟁이 치열해지며 머신러닝 및 AI 관련 연구 논문이 매일 폭발적으로 증가하고 있습니다. 최근 5일(4월 14일~20일) 동안 arXiv의 머신러닝 카테고리에만 총 896편의 새로운 논문이 올라왔으며, 하루 평균 약 180편에 달하는 수치입니다. 이는 LLM(대형 언어 모델) 미세조정, 보상 해킹 방지, 신약 개발 등 다양한 산업계 실무 응용 연구가 전 세계적으로 매우 빠르게 진행되고 있음을 시사합니다.

머신러닝 논문 동향 arXiv

MarkTechPost • 100일 전

랜덤포레스트·캣부스트 능가하는 테이블 데이터 AI 'TabPFN'

전통적인 트리 기반 머신러닝 모델(랜덤포레스트, 캣부스트 등)이 장악하던 테이블 데이터(정형 데이터) 분석 분야에서, 사전 학습된 파운데이션 모델인 'TabPFN'이 뛰어난 정확도를 입증했습니다. 이 모델은 대규모 언어 모델(LLM)처럼 문맥 내 학습(In-context learning)을 활용해 별도의 파인튜닝 없이도 빠르고 정확한 예측을 제공합니다. 또한, 예측 결과를 더 작은 모델로 증류(Distillation)하여 실제 서비스 환경에 빠르게 배포할 수 있는 실용성까지 갖추고 있어 데이터 실무자들에게 매우 중요한 대안으로 떠오르고 있습니다.

머신러닝 정형 데이터 TabPFN

MarkTechPost • 100일 전

Magika와 OpenAI를 활용한 파일 탐지 및 보안 분석 파이프라인 구축

이 튜토리얼에서는 구글의 딥러닝 기반 파일 타입 탐지 도구인 Magika와 OpenAI의 언어 모델을 결합하여 실용적인 파일 보안 분석 파이프라인을 구축하는 방법을 다룹니다. 파일 확장자가 아닌 원시 바이트(Raw bytes)를 기반으로 파일의 진짜 형식을 식별하고, GPT 모델을 통해 기술적인 분석 결과를 이해하기 쉬운 보안 인사이트와 요약으로 제공합니다. 이를 통해 대량의 파일 스캔, 변조된 파일 탐지, 업로드 리스크 스코어링 등 실무적인 보안 검역 시스템을 구축할 수 있습니다.

머신러닝 보안 분석 파이프라인 구축

MarkTechPost • 111일 전

시그모이드 vs ReLU: 기하학적 맥락 상실에 따른 추론 비용

딥러닝 모델에서 시그모이드(Sigmoid) 활성화 함수는 입력값을 0과 1 사이로 압축하여 기하학적 맥락을 상실하게 만들어 모델의 깊이가 주는 이점을 제한합니다. 반면, ReLU는 양수 입력값의 크기를 보존하여 심층 신경망이 과도한 너비나 연산량 없이도 풍부한 표현력을 유지할 수 있게 합니다. 이 글은 두 활성화 함수의 신호 전파 방식과 표현 기하학 차이를 실험을 통해 분석하며, 이것이 모델의 추론 효율성과 확장성에 미치는 영향을 설명합니다.

머신러닝 활성화함수 딥러닝

MarkTechPost • 115일 전