메뉴

#머신러닝

MP
MarkTechPost 3일 전
IMP 8

사카나 AI, 잔차 네트워크를 독립 훈련 블록으로 변환하는 'DiffusionBlocks' 제안

사카나 AI는 기존의 잔차 네트워크(Residual Networks)를 개별적으로 학습 가능한 독립 모듈로 변환하는 새로운 블록 단위 학습 프레임워크인 DiffusionBlocks를 제안했습니다. 이 프레임워크는 네트워크 내 레이어 업데이트를 역방향 확산(Diffusion)의 노이즈 제거(Denoising) 단계로 해석하여 모델을 분할하는 혁신적인 방식을 제공합니다. 이를 통해 대규모 모델의 효율적인 분산 학습 및 최적화가 가능해져 AI 실무자들에게 획기적인 학습 효율 개선을 기대할 수 있습니다.

머신러닝 모델학습 확산모델
HN
Hacker News 9일 전
IMP 8

CODA: 트랜스포머 블록을 GEMM 에필로그 프로그램으로 재작성

AI 모델 학습 시 흔히 발생하는 메모리 병목 현상을 해결하기 위해, 개별적으로 처리되던 연산들을 하나의 GPU 커널(GEMM Epilogue)로 통합하여 성능을 극대화하는 새로운 추상화 기법인 CODA를 제안합니다. 이 방식은 데이터 이동을 최소화하면서도 프레임워크 수준의 생산성과 하드웨어 수준의 극적인 효율성을 동시에 달성할 수 있도록 돕습니다.

머신러닝 GPU 최적화 커널 개발
SG
r/singularity 22일 전
IMP 8

AI로 1만 개 이상의 새로운 외계행성 후보 발견

과학자들이 새로운 머신러닝 알고리즘을 활용해 NASA의 TESS 위성 데이터를 분석, 1만 개 이상의 새로운 외계행성 후보를 발견했습니다. 이는 기존에 확인된 외계행성의 수를 단번에 3배 가까이 늘릴 수 있는 기록적인 성과입니다. 연구팀은 이미 이 중 하나를 실제 망원경 관측을 통해 확인하며 알고리즘의 신뢰성을 입증했습니다.

머신러닝 외계행성 탐사 천문학
HN
Hacker News 24일 전
IMP 8

디퓨전 모델의 적분 학습과 플로우 맵

디퓨전 모델의 샘플링 속도를 획기적으로 높이기 위해 중간의 반복적인 단계를 건너뛰고 적분값을 직접 예측하는 '플로우 맵(Flow Map)' 기술을 소개하는 글입니다. 플로우 맵은 단순히 샘플링 속도만 개선하는 것을 넘어 보상 기반 학습의 효율성과 샘플링 제어 능력을 향상시키는 등 다양한 장점을 제공합니다. 최근 AI 연구 분야에서 매우 주목받고 있으며, 기존 디퓨전 모델의 한계를 극복할 대안으로 떠오르고 있습니다.

디퓨전 모델 플로우 맵 딥러닝
HN
Hacker News 29일 전
IMP 7

로컬 100% 실행, 프라이버시 강화 AI 데이터 분석가 'MLJAR Studio'

클라우드 전송 없이 사용자의 PC 환경에서 완벽하게 구동되는 100% 로컬 기반의 AI 데이터 분석 및 머신러닝 도구입니다. 자연어로 데이터에 질문하면 AI가 파이썬 코드를 생성 및 실행하고, 자동으로 최적의 머신러닝 모델을 탐색하며 그 결과를 노트북으로 저장합니다. 민감한 데이터를 다루는 데이터 분석가와 연구자들이 데이터 유출 걱정 없이 안전하게 AI 기능을 활용할 수 있다는 점이 가장 큰 특징입니다.

데이터 분석 로컬 AI 머신러닝
GB
Google AI Blog 32일 전
IMP 6

구글 번역 20주년: 신기한 기능과 새로운 AI 업데이트

구글 번역이 출시 20주년을 맞이하여 AI 기반의 '발음 연습' 기능 등 신규 기능을 대거 선언했습니다. 2006년 통계적 기계 학습(SML)으로 시작해 2016년 신경망(Neural Network) 도입을 거쳐, 현재는 자체 AI 모델인 제미나이(Gemini)와 TPU 하드웨어를 활용해 전 세계 약 250개 언어를 지원하며 매월 10억 명 이상의 사용자와 1조 단어 이상을 번역하는 핵심 소통 플랫폼으로 자리 잡았습니다.

구글 번역 AI 번역 발음 연습
HN
Hacker News 36일 전
IMP 8

딥러닝의 과학적 이론이 도래할 것이다

제이미 사이먼(Jamie Simon) 등 14명의 연구진은 딥러닝의 훈련 과정, 가중치, 성능 등을 설명하는 과학적 이론이 등장하고 있음을 주장합니다. 이 논문은 기계 학습 역학(learning mechanics)이라는 새로운 관점을 통해 다섯 가지 주요 연구 흐름을 통합하며, 기존의 '블랙박스'로 여겨지던 신경망의 작동 원리를 수학적, 역학적으로 규명할 수 있는 기반을 마련했다는 점에서 학계와 실무 양쪽에 큰 의의를 갖습니다.

딥러닝 이론 학습 역학 신경망
HN
Hacker News 36일 전
IMP 6

머신러닝, 역사적 천문 사진 속 미지의 일시적 현상 발견

스푸트니크 발사 전 역사적 천문 관측 사진에서 나타났다 사라지는 미지의 일시적 현상(Transient phenomenon)에 대한 연구입니다. 연구진은 머신러닝 모델을 활용해 기존에 기록된 10만여 개의 일시적 천체를 분석한 결과, 이들이 단순한 사진 결함이 아닌 실제 천문학적 현상일 가능성이 매우 높다는 것을 통계적으로 입증했습니다. 이는 AI가 방대한 역사 데이터에서 숨겨진 천문학적 신호를 찾아내는 데 매우 유용하게 쓰일 수 있음을 보여줍니다.

머신러닝 천문학 데이터 분석
GB
Google AI Blog 39일 전
IMP 8

에이전트 시대를 위한 두 가지 특수 TPU 공개

사용자를 대신해 복잡한 업무를 수행하는 자율형 AI 에이전트 시대에 맞춰 새로운 두 가지 TPU 칩이 공개되었습니다. AI 에이전트의 빠른 추론 및 실행을 돕는 'TPU 8i'와 방대한 단일 메모리 풀에서 대규모 모델 학습에 최적화된 'TPU 8t'가 출시되어, 일상 사용자들에게도 반응성이 뛰어난 에이전트 AI 제공이 가능해질 전망입니다.

TPU AI 에이전트 인프라
MP
MarkTechPost 39일 전
IMP 7

Hyperopt와 조건부 베이지안 하이퍼파라미터 최적화

본 튜토리얼에서는 Hyperopt와 TPE(Tree-structured Parzen Estimator) 알고리즘을 활용하여 고급 베이지안 하이퍼파라미터 최적화 워크플로우를 구현합니다. 서로 다른 모델 패밀리 간에 동적으로 전환하는 조건부 검색 공간을 구축하여 Hyperopt가 계층적이고 구조화된 매개변수 그래프를 어떻게 처리하는지 보여줍니다. 또한 scikit-learn 파이프라인 내부에 교차 검증(Cross-validation)을 적용하여 조기 종료(Early Stopping) 기능을 지원하는 프로덕션급 목적 함수(Objective function)를 구축합니다.

머신러닝 하이퍼파라미터 튜닝 베이지안 최적화
ML
r/MachineLearning 41일 전
IMP 7

매일 쏟아지는 AI 논문: arXiv ML 분야 일일 100~200편 게재

프론티어 AI 모델 경쟁이 치열해지며 머신러닝 및 AI 관련 연구 논문이 매일 폭발적으로 증가하고 있습니다. 최근 5일(4월 14일~20일) 동안 arXiv의 머신러닝 카테고리에만 총 896편의 새로운 논문이 올라왔으며, 하루 평균 약 180편에 달하는 수치입니다. 이는 LLM(대형 언어 모델) 미세조정, 보상 해킹 방지, 신약 개발 등 다양한 산업계 실무 응용 연구가 전 세계적으로 매우 빠르게 진행되고 있음을 시사합니다.

머신러닝 논문 동향 arXiv
MP
MarkTechPost 41일 전
IMP 8

랜덤포레스트·캣부스트 능가하는 테이블 데이터 AI 'TabPFN'

전통적인 트리 기반 머신러닝 모델(랜덤포레스트, 캣부스트 등)이 장악하던 테이블 데이터(정형 데이터) 분석 분야에서, 사전 학습된 파운데이션 모델인 'TabPFN'이 뛰어난 정확도를 입증했습니다. 이 모델은 대규모 언어 모델(LLM)처럼 문맥 내 학습(In-context learning)을 활용해 별도의 파인튜닝 없이도 빠르고 정확한 예측을 제공합니다. 또한, 예측 결과를 더 작은 모델로 증류(Distillation)하여 실제 서비스 환경에 빠르게 배포할 수 있는 실용성까지 갖추고 있어 데이터 실무자들에게 매우 중요한 대안으로 떠오르고 있습니다.

머신러닝 정형 데이터 TabPFN
MP
MarkTechPost 41일 전
IMP 7

Magika와 OpenAI를 활용한 파일 탐지 및 보안 분석 파이프라인 구축

이 튜토리얼에서는 구글의 딥러닝 기반 파일 타입 탐지 도구인 Magika와 OpenAI의 언어 모델을 결합하여 실용적인 파일 보안 분석 파이프라인을 구축하는 방법을 다룹니다. 파일 확장자가 아닌 원시 바이트(Raw bytes)를 기반으로 파일의 진짜 형식을 식별하고, GPT 모델을 통해 기술적인 분석 결과를 이해하기 쉬운 보안 인사이트와 요약으로 제공합니다. 이를 통해 대량의 파일 스캔, 변조된 파일 탐지, 업로드 리스크 스코어링 등 실무적인 보안 검역 시스템을 구축할 수 있습니다.

머신러닝 보안 분석 파이프라인 구축
MP
MarkTechPost 52일 전
IMP 7

시그모이드 vs ReLU: 기하학적 맥락 상실에 따른 추론 비용

딥러닝 모델에서 시그모이드(Sigmoid) 활성화 함수는 입력값을 0과 1 사이로 압축하여 기하학적 맥락을 상실하게 만들어 모델의 깊이가 주는 이점을 제한합니다. 반면, ReLU는 양수 입력값의 크기를 보존하여 심층 신경망이 과도한 너비나 연산량 없이도 풍부한 표현력을 유지할 수 있게 합니다. 이 글은 두 활성화 함수의 신호 전파 방식과 표현 기하학 차이를 실험을 통해 분석하며, 이것이 모델의 추론 효율성과 확장성에 미치는 영향을 설명합니다.

머신러닝 활성화함수 딥러닝
MP
MarkTechPost 56일 전
IMP 6

인간의 비전과 AI가 만나는 크리에이티브 AI 스택

패션 산업은 직관과 경험에 의존하던 트렌드 예측을 알고리즘, 신경망, 머신러닝 등 AI 기술로 전환하고 있습니다. 이 글은 인간의 창의적 비전과 AI가 융합되어 미래 패션을 디자인하는 '크리에이티브 AI 스택'의 내부를 조명합니다. 기존의 수동적이고 후순위적이었던 AI가 이제는 패션 산업의 핵심 동력으로 자리 잡고 있음을 시사합니다.

크리에이티브 AI 패션 디자인 머신러닝