메뉴

#오픈소스 AI

HN
Hacker News 11일 전
IMP 7

클라우드플레어, 오픈소스 AI 모델 '플럭스' 공개

클라우드플레어가 블랙 포레스트 랩스(Black Forest Labs)와 협력하여 오픈소스 기반의 텍스트-투-이미지(T2I) 생성 AI 모델인 '플럭스(Flux)'를 자사 워커스 AI(Workers AI) 플랫폼에 추가했습니다. 이를 통해 개발자들은 별도의 복잡한 설정 없이도 API를 통해 고품질 이미지 생성 기능을 자체 애플리케이션에 빠르고 쉽게 통합할 수 있게 되었습니다. 이번 조치는 개발자 친화적인 에지(edge) 컴퓨팅 환경에 강력한 이미지 생성 도구를 제공하여, 향후 관련 AI 애플리케이션 개발과 대중화를 크게 가속화할 것으로 기대됩니다.

이미지 생성 클라우드플레어 오픈소스 AI
HN
Hacker News 12일 전
IMP 8

최근 6개월 LLM 생태계 핵심 요약

2025년 11월은 코딩 에이전트가 실용적인 수준으로 급부상하며 LLM 생태계의 결정적인 전환점이 된 시기였습니다. 이 기간 동안 주요 빅테크 기업 간의 최고 성능 모델 경쟁이 치열했으며, 개발자들은 이를 활용해 '바이브 코딩(Vibe coding)'과 같은 혁신적인 실험을 주도했습니다. 특히 '오픈클로(OpenClaw)'라는 이름의 개인형 AI 어시스턴트 프로젝트가 등장하며 로컬 환경에서 AI를 구동하는 새로운 개발자 문화를 탄생시켰습니다.

LLM 동향 코딩 에이전트 오픈소스 AI
HN
Hacker News 14일 전
IMP 8

DeepSeek-V4-Flash: LLM 스티어링(조종)이 다시 흥미로워진 이유

오픈소스 로컬 모델인 DeepSeek-V4-Flash의 등장으로, 모델의 내부 상태를 직접 제어하여 출력을 유도하는 '스티어링(Steering)' 기술이 실용화 단계에 접어들었습니다. 개발자 antirez가 이 모델 기반으로 스티어링을 내장한 'DwarfStar 4' 프로젝트를 발표하며, 프롬프트 엔지니어링에 의존하지 않고 모델의 뇌를 직접 제어하는 방식에 대한 기대감이 높아지고 있습니다.

DeepSeek-V4-Flash 스티어링(Steering) 로컬 LLM
MP
MarkTechPost 20일 전
IMP 8

농 리서치 자가 개선 에이전트, 오픈루터 1위 탈환

농 리서치의 오픈소스 자가 개선 에이전트인 '헤르메스 에이전트(Hermes Agent)'가 2026년 5월 10일 기준 오픈루터(OpenRouter) 일일 토큰 랭킹에서 1위를 차지했습니다. 이 에이전트는 오픈AI가 후원하는 플랫폼인 오픈클로(OpenClaw)를 제치며 하루 2,240억 개의 토큰을 생성하는 실제 추론 볼륨을 기록했습니다. 출시 3개월 만에 오픈소스 프로젝트가 빅테크 후원 플랫폼을 실사용량에서 압도한 것은 오픈소스 AI 생태계의 새로운 이정표를 세운 것으로 평가됩니다.

에이전트 농 리서치 오픈루터
MP
MarkTechPost 24일 전
IMP 8

자이프라, AMD 하드웨어 학습 MoE 'ZAYA1-8B' 공개

자이프라(Zyphra)는 활성 파라미터 7억 6천만 개(760M)만 사용하는 경량 추론 MoE(Mixture of Experts) 모델인 ZAYA1-8B를 공개했습니다. 이 모델은 새로운 마르코프 RSA 테스트 타임 컴퓨팅 기법을 적용하여 수학 및 코딩 벤치마크에서 자신보다 훨씬 거대한 모델들을 뛰어넘는 성능을 입증했습니다. 엔드투엔드 AMD 인스팅트 MI300 하드웨어로 학습되었으며 아파치 2.0(Apache 2.0) 라이선스로 배포되어, 소규모 언어 모델 분야의 지능 밀도(Intelligence density) 새로운 기준을 제시했습니다.

소규모 언어 모델(SLM) MoE (Mixture of Experts) AMD AI 하드웨어
LL
r/LocalLLaMA 26일 전
IMP 8

Llama.cpp, MTP(다중 토큰 예측) 베타 지원 공개

로컬 AI 추론 엔진인 Llama.cpp에 여러 개의 토큰을 동시에 예측하여 처리 속도를 비약적으로 높이는 MTP(다중 토큰 예측) 기능이 베타로 추가되었습니다. 개발자는 기존 GGUF 모델 파일 하나만으로 MTP 모델을 자동으로 불러와 별도의 추가 배포 없이도 추론 속도를 2배 이상 크게 향상시킬 수 있습니다. 이는 로컬 환경에서 구동되는 오픈소스 대형 언어 모델(LLM)의 실질적인 응답 성능을 개선하는 중요한 이정표입니다.

Llama.cpp 추론 속도 최적화 MTP(다중 토큰 예측)
MR
MIT Tech Review 30일 전
IMP 8

기독교인 전용 통신망과 LLM 디버깅 기술

미국 내 기독교인들을 타겟으로 한 음란물 및 젠더 관련 콘텐츠 차단 통신망이 새롭게 론칭합니다. AI 스타트업 Goodfire는 LLM 내부를 들여다보고 파라미터를 조정해 원치 않는 출력을 수정할 수 있는 해석 도구를 공개했습니다. 또한 중국 AI 기업들의 오픈소스 전략이 개발자들의 지지를 얻으며 실리콘밸리의 독주를 깨고 다극화된 AI 생태계를 만들고 있습니다.

LLM 해석 가능성 오픈소스 AI 콘텐츠 필터링
MR
MIT Tech Review 34일 전
IMP 9

딥시크 V4의 돌풍과 월드 모델 경쟁

중국 AI 기업 딥시크(DeepSeek)가 오픈소스임에도 폐쇄형 최고 수준 모델들과 맞먹는 성능을 보이는 'V4' 프리뷰를 공개했습니다. 특히 화웨이 스캐리칩(Ascend)에 최적화된 첫 모델이라는 점에서 업계에 큰 파장이 예상됩니다. 또한 기존 LLM의 한계를 극복하고 로봇 공학 등 물리적 세계를 이해하기 위한 '월드 모델(World Model)' 연구가 AI 생태계의 새로운 핵심 과제로 떠오르고 있습니다.

딥시크(DeepSeek) 월드 모델(World Models) 오픈소스 AI
LL
r/LocalLLaMA 35일 전
IMP 7

Qwen3.6 35B 'Heretic' 모델, 압도적 성능 화제

오픈소스 AI 커뮤니티(레딧)에서 'Qwen3.6 35B A3B Heretic'라는 이름의 비공식 파인튜닝(미세조정) 모델이 공개되어 화제입니다. 특히 데이터셋 유사도를 나타내는 지표인 KLD(쿨백-라이블러 발산) 값이 0.0015로 극도로 낮아 원본 모델의 성능을 매우 충실히 보존하면서도 특정 분야에서 강력한 성능을 발휘하는 것으로 평가받고 있습니다. 공유된 코드를 보면 이 모델은 복잡한 채팅 템플릿과 이미지·비디오 처리, 함수 호출(Function Calling) 기능을 완벽하게 지원하도록 고도화된 것으로 확인됩니다.

오픈소스 모델 Qwen 미세조정(Fine-tuning)
TC
TechCrunch AI 36일 전
IMP 9

딥시크, 최신 AI 모델 V4 공개…

중국의 AI 연구소 딥시크(DeepSeek)가 최신 대규모 언어 모델인 DeepSeek V4(Flash 및 Pro)의 프리뷰 버전을 공개했습니다. 이번 모델은 최대 1.6조 개의 파라미터를 갖춘 오픈웨이트 모델로서, 미스트럭스(Mixture-of-experts) 방식을 채택해 추론 비용을 절감하면서도 추론 및 코딩 벤치마크에서 최고 수준의 폐쇄형 모델들과 거의 차이를 좁혔습니다. 특히 기존 최고 성능 모델들과 비교해 압도적으로 저렴한 API 사용 비용을 제공하며 시장의 경쟁력을 확보하고 있습니다.

DeepSeek 오픈소스 AI 대규모 언어 모델
MR
MIT Tech Review 39일 전
IMP 8

지금 AI 분야에서 주목해야 할 10가지 핵심 트렌드

AI 분야의 복잡한 변화 속에서 우리가 반드시 주목해야 할 10가지 핵심 주제를 선정했습니다. 휴머노이드 로봇 학습 데이터 수집, LLM의 진화, AI 기반 사기 및 딥페이크의 무기화 같은 보안 위협부터 중국의 오픈소스 공세, AI 과학자의 등장, 그리고 거센 반발 여론까지 다양한 주제를 다룹니다.

AI 트렌드 휴머노이드 로봇 AI 에이전트
TD
The Decoder 42일 전
IMP 8

차트 복잡해지면 최고 AI 모델도 성능 절반 하락

중국 연구진이 실제 데이터 기반의 복잡한 시각화를 테스트하는 새로운 벤치마크 'RealChart2Code'를 발표했습니다. 기존 단순한 차트에서 뛰어난 성능을 보이던 최고 수준의 상용 AI 모델들조차 복잡한 시각화 작업에서는 성능이 절반 가까이 급락하는 '복잡성 갭(Complexity gap)' 현상이 확인되었습니다. 이는 복잡한 실무 환경에서 현재 AI 모델의 시각적 데이터 처리 및 코드 생성 능력이 아직 큰 한계를 보이고 있음을 시사합니다.

벤치마크 데이터 시각화 AI 코딩
SG
r/singularity 46일 전
IMP 8

엔비디아, 실용적 양자 컴퓨터 가속 위한 최초 오픈 AI 모델 '아이징' 공개

엔비디아가 실용적인 양자 컴퓨터 개발을 가속화하기 위해 세계 최초의 오픈 AI 모델인 '아이징(Ising)'을 발표했습니다. 이 모델을 통해 연구진과 기업은 양자 프로세서 교정(Calibration) 및 양자 오류 정정 디코딩 기능을 갖춘 확장 가능한 고성능 양자 시스템을 구축할 수 있습니다. 결과적으로 AI 기반 워크플로우를 활용해 난관인 양자 오류 문제를 효과적으로 해결하고 양자 컴퓨팅의 상용화를 앞당길 수 있게 되었다는 점에서 매우 중요합니다.

양자 컴퓨팅 엔비디아(NVIDIA) 오픈소스 AI
MP
MarkTechPost 52일 전
IMP 7

ModelScope 실전 가이드: 검색부터 파인튜닝, 배포까지

ModelScope 허브를 활용하여 AI 모델을 검색, 다운로드, 파인튜닝 및 배포하는 방법을 다루는 실전 튜토리얼입니다. IMDB 데이터셋을 이용한 감성 분류기 미세조정 과정을 통해 자연어처리(NLP) 파이프라인을 직접 구축해 봅니다. 허깅페이스(Hugging Face)와의 호환성을 강조하며 연구부터 프로덕션 환경까지 아우르는 통합 워크플로우를 제공합니다.

ModelScope 파인튜닝 오픈소스 AI