메뉴

#오픈소스

MP
MarkTechPost 12시간 전
IMP 8

2026년 최고의 TTS 모델 벤치마크 비교

2026년 텍스트 음성 변환(TTS) 기술이 급격히 발전함에 따라, 주요 상업 및 오픈소스 TTS 모델들의 성능을 종합적으로 비교한 가이드가 공개되었습니다. 이 글은 엔지니어들이 실무에 적합한 모델을 선택할 수 있도록 음질, 지연 시간, 비용, 언어 지원 및 라이선스를 기준으로 모델들을 순위화하여 평가합니다. 관련 엔지니어에게 최신 TTS 모델의 동향과 기술적 장단점을 파악하는 데 매우 중요한 자료입니다.

TTS 벤치마크 AI 모델
MP
MarkTechPost 1일 전
IMP 8

헤르메스 에이전트, MCP 도구 검색 기능 공개

Nous Research의 헤르메스 에이전트가 MCP 환경에서 흔히 발생하는 컨텍스트 과부하 문제를 해결하기 위해 '도구 검색(Tool Search)' 기능을 추가했습니다. 이 기능은 BM25 및 점진적 스키마 공개(Progressive Schema Disclosure) 방식을 활용하여 불필요한 정보를 걸러냅니다. Anthropic의 평가 결과에 따르면, 이 기능 도입으로 Opus 4 모델의 도구 활용 정확도가 49%에서 최대 74%까지 크게 향상되었습니다.

에이전트 MCP 오픈소스
MP
MarkTechPost 1일 전
IMP 8

파이썬으로 170만 건 AI 에이전트 데이터셋 구축하기

에이전트 상호작용 기록(Trace) 170만 건을 포함한 역대 최대 규모의 오픈소스 데이터셋인 'AgentTrove'를 활용하는 파이썬 실전 튜토리얼을 소개합니다. 이 튜토리얼은 대용량 데이터를 전체 다운로드 없이 스트리밍하고, 성공적인 기록만 추출해 고품질 SFT(Supervised Fine-Tuning) 데이터셋으로 변환하는 방법을 다룹니다. AI 에이전트의 파인튜닝을 위한 대규모 학습 데이터를 효율적으로 구축하려는 실무자들에게 매우 유용한 가이드입니다.

데이터셋 에이전트 파인튜닝
HN
Hacker News 1일 전
IMP 8

C++와 CUDA로 구현하는 고성능 LLM 추론 엔진

인기 있는 LLM 추론 프레임워크인 vLLM의 경량화된 버전인 tiny-vLLm을 C++와 CUDA를 사용해 밑바닥부터 직접 구현해 보는 오픈소스 프로젝트 및 강의 자료입니다. 모델 가중치 로딩부터 PagedAttention, 연속 배치(Continuous Batching) 등 실제 운영 환경에서 필요한 핵심 기술들을 직관적으로 학습할 수 있습니다. 개발자와 강사 모두가 LLM의 작동 원리와 추론 서버 구축 과정을 깊이 있게 이해하는 데 매우 유용한 자료입니다.

오픈소스 LLM 추론 vLLM
MP
MarkTechPost 2일 전
IMP 8

다중 GPU/노드 통신 융합 커널 라이브러리 mKernel 공개

UC Berkeley의 UCCL 연구팀이 다중 GPU 및 다중 노드 환경의 통신과 연산을 하나의 지속형 CUDA 커널로 통합한 'mKernel' 라이브러리를 공개했습니다. 이 라이브러리는 노드 내 NVLink, 노드 간 RDMA 통신 및 고밀도 연산을 하나로 융합하여 시스템 오버헤드를 최소화하고 대규모 AI 모델 학습 및 분산 컴퓨팅의 효율성을 극대화하는 데 기여할 수 있습니다.

GPU 컴퓨팅 병렬 처리 분산 시스템
MP
MarkTechPost 2일 전
IMP 8

헥소 랩스, 모델 가중치와 구조 모두를 업데이트하는 자가 개선 에이전트 'SIA' 오픈소스화

Hexo Labs가 MIT 라이선스로 자가 개선 루프 시스템인 SIA를 오픈소스로 공개했습니다. 이 에이전트는 실행 기록을 분석해 스캐폴드 코드(Scaffold)를 재작성하거나 모델의 LoRA 가중치를 업데이트하여 성능을 지속적으로 향상시킵니다. 두 가지 방식을 결합한 결과, 벤치마크 테스트에서 기존 방식 대비 월등한 성능 개선을 입증했다는 점이 핵심입니다.

오픈소스 자가 개선 에이전트 모델 파인튜닝
MP
MarkTechPost 2일 전
IMP 7

플레이북부터 커스텀 모듈까지: 엔드투엔드 Ansible 자동화 랩 설계

이 튜토리얼은 Google Colab이나 Linux 환경에서 완벽하게 동작하는 엔드투엔드 Ansible 자동화 랩을 구축하는 방법을 안내합니다. 인프라 관리 실무자에게 필수적인 정적/동적 인벤토리 구성, 변수 우선순위, 그리고 커스텀 모듈 개발까지 아우르는 실습 위주의 가이드입니다. 체계적인 자동화 환경을 구축하고 인프라 운영 효율을 극대화하려는 엔지니어들에게 매우 유용한 내용을 담고 있습니다.

DevOps Ansible 인프라 자동화
HN
Hacker News 2일 전
IMP 7

오픈 엔벨로프: AI 에이전트 팀 정의 오픈 스키마

AI 에이전트 팀 구성을 표준화된 JSON Schema로 정의할 수 있는 오픈소스 프로젝트가 공개되었습니다. 역할, 권한, 승인 게이트 등을 포함해 팀을 한 번 정의하면 Docker처럼 다양한 런타임에서 실행할 수 있도록 이식성을 확보하는 것이 핵심입니다.

에이전트 다중 에이전트 오픈소스
HN
Hacker News 2일 전
IMP 7

데이터 에이전트용 오픈소스 컨텍스트 레이어, Ktx

Ktx는 데이터 에이전트가 데이터 웨어하우스를 정확하게 쿼리하도록 돕는 자가 개선형 컨텍스트 레이어입니다. 위키, dbt 등의 비즈니스 지식을 자동 수집하고 조인 가능한 컬럼을 매핑하여 에이전트가 승인된 지표 정의를 따르게 합니다. Claude Code, Cursor 등 주요 코딩 에이전트와 MCP 및 CLI로 연동됩니다.

데이터 에이전트 시맨틱 레이어 오픈소스
40
404 Media 2일 전
IMP 7

아우라 웨어러블 월 구독료 없이 이용하는 방법

아우라 링(Oura Ring) 사용자가 월 구독료를 내지 않고도 자신의 건강 데이터를 분석할 수 있는 오픈소스 앱 'Cracked Oura'가 개발자에 의해 공개되었습니다. 이 앱은 기기 내부에 데이터를 저장하고, 기존 공식 앱보다 깊이 있는 인사이트를 제공하며, 구독 결제가 필요 없다는 점에서 의미가 있습니다. 비싼 기기를 구매한 후 건강 데이터를 보려면 매월 추가 요금을 내야 하는 문제에 대한 소비자 불만과 대안을 보여줍니다.

오픈소스 웨어러블 데이터 주권
HN
Hacker News 3일 전
IMP 5

프로그래밍 언어 라켓(Racket) v9.2 정식 출시

언어 지향 프로그래밍 언어인 라켓(Racket)의 최신 버전인 v9.2가 정식 출시되었습니다. 이번 업데이트에서는 비선형 패턴 매칭 검증 강화, Typed Racket의 복소수 타입 처리 수정, 유니코드 17.0 지원 등 핵심 기능이 개선되었습니다. 일부 하위 호환성에 영향을 주는 변경점이 포함되어 있어 기존 사용자는 업데이트 시 코드 호환성을 확인해야 합니다.

라켓 오픈소스 프로그래밍언어
MP
MarkTechPost 3일 전
IMP 7

퍼플렉시티, 휴깅페이스 대비 5배 빠른 토크나이저 오픈소스화

Perplexity AI가 Unigram 기반의 새로운 토크나이저를 오픈소스로 공개했습니다. 이 토크나이저는 널리 쓰이는 Hugging Face 토크나이저 대비 p50 지연 시간을 5배 낮춰 대규모 텍스트 처리 성능을 크게 향상시켰다는 점에서 실무적인 의의가 있습니다. 데이터 전처리 및 AI 서비스 추론 속도 개선에 핵심적인 역할을 할 것으로 기대됩니다.

오픈소스 퍼플렉시티 토크나이저
HN
Hacker News 3일 전
IMP 6

오픈소스 AI 자동차 레이싱 하네스(Harness) 공개

해커뉴스에 자율주행 및 로봇 공학 연구를 위한 '오픈소스 AI 레이싱 하네스'가 소개되었습니다. 소속사인 Elodin은 지구 중력장 모델인 EGM2008의 초고속 구현체를 새롭게 추가하여 성능을 개선하였습니다. 또한 200만 달러(약 27억 원) 규모의 프리시드 투자 유치를 성공적으로 마치고 첫 정규 직원(비행 소프트웨어 엔지니어)을 영입하며 본격적인 기술 고도화에 나섰습니다.

오픈소스 자율주행 ai-에이전트
HN
Hacker News 3일 전
IMP 8

다중 에이전트 LLM 기반 자동 취약점 발견 시스템

소프트웨어 보안 위협이 증가함에 따라, LLM(대형 언어 모델)을 활용해 취약점을 자동으로 탐지하고 재현하는 다중 에이전트 시스템 'FuzzingBrain V2'가 새롭게 발표되었습니다. 이 시스템은 기존 방식의 한계였던 높은 오탐지율과 복잡한 의존성 분석의 어려움을 새로운 제어 흐름 기반 추상화 및 퍼징(Fuzzing) 기술을 통해 해결합니다. 특히 실제 오픈소스 프로젝트에 적용하여 29개의 제로데이 취약점을 발견하고 패치를 이끌어냈다는 점에서 AI 기반 보안 기술의 실용성이 입증되었다는 평가를 받습니다.

보안 다중 에이전트 취약점 탐지
MP
MarkTechPost 3일 전
IMP 8

엔비디아, 에이전트 RL 훈련 프레임워크 'Polar' 공개

엔비디아가 기존 에이전트 구동부 수정 없이도 강화학습 훈련을 가능하게 하는 롤아웃 프레임워크 'Polar'를 발표했습니다. 이 프레임워크는 API 프록시를 통해 토큰 단위의 상호작용을 캡처하여 완벽한 훈련용 궤적을 재구성하는 것이 특징입니다. 실제 SWE-Bench 테스트에서 Codex, Claude Code 등 다양한 환경의 코딩 성능을 크게 향상시키며 그 효용성을 입증했습니다.

에이전트 강화학습 NVIDIA
HN
Hacker News 3일 전
IMP 7

오픈소스 워크스페이스(메일,문서,스프레드시트)

해커뉴스에 메일, 문서, 스프레드시트, 드라이브 기능을 모두 포함한 올인원 오픈소스 워크스페이스 프로젝트가 공개되었습니다. Docker Compose 명령어 한 번으로 15초 내외에 자동 SSL 인증서 적용 및 메일 서버 구축까지 마무리되는 것이 특징입니다. 개인 및 기업이 구글 워크스페이스나 MS 365 등 상용 서비스를 대체할 수 있는 자체 호스팅(Self-hosted) 환경을 손쉽게 구축할 수 있어 실무자들에게 유용합니다.

오픈소스 자체호스팅 워크스페이스
TC
TechCrunch AI 3일 전
IMP 8

클릭하우스, 연간 매출 2.5억 달러 달성…IPO 향한 행보

데이터베이스 스타트업 클릭하우스(ClickHouse)가 연 환산 매출 2억 5천만 달러를 돌파하며 전년 대비 3배 성장을 기록했습니다. 150억 달러에 달하는 높은 기업가치와 빠른 성장세를 바탕으로, 최근 스노플로우(Snowflake) 출신 CFO 영입 등 상장(IPO)을 향한 본격적인 준비를 마쳤습니다. 특히 AI 에이전트용 대규모 데이터 처리에 최적화된 오픈소스 기술력과 공격적인 M&A를 바탕으로 스페이스X 등과 함께 가장 주목받는 상장 후보로 떠올랐다는 점에서 업계의 이목이 집중되고 있습니다.

클릭하우스 데이터베이스 IPO
MP
MarkTechPost 4일 전
IMP 7

EAGLE 3.1: LLM 추론 시 어텐션 드리프트 해결

EAGLE팀, vLLM, TorchSpec가 협력하여 실제 서비스 환경에서 발생하는 추측 디코딩(Speculative Decoding)의 불안정성을 해결하는 EAGLE 3.1을 공개했습니다. 이번 업데이트는 대규모 언어 모델(LLM) 추론 시 발생하는 '어텐션 드리프트(Attention Drift)' 문제를 수정하여 모델의 안정성과 성능을 크게 향상시킵니다. 실무자들에게 LLM의 빠르고 안정적인 상용 배포를 가능하게 하는 핵심적인 기술 발전으로 평가받습니다.

대규모 언어 모델 추론 최적화 추측 디코딩
HN
Hacker News 4일 전
IMP 7

포스트혼: 메일 서버 없는 셀프 호스팅 메일 통합 게이트웨이

셀프 호스팅 프로젝트를 위한 통합 발신 메일 릴레이 계층인 '포스트혼(Posthorn)'이 소개되었습니다. 이 도구는 사용자가 직접 메일 서버를 운영할 필요 없이, 다양한 앱의 발신 메일을 하나의 설정과 자격 증명으로 관리하여 Postmark, Resend 등의 트랜잭셔널 메일 제공자로 안전하게 중계합니다. 단일 Go 바이너리와 TOML 설정만으로 이메일 통합의 복잡성을 크게 줄여주는 오픈소스 솔루션입니다.

오픈소스 셀프 호스팅 이메일 릴레이
MP
MarkTechPost 4일 전
IMP 8

스테이빌리티 AI, 오디오 생성 모델 '스테이블 오디오 3' 공개

스테이빌리티 AI가 악기 및 효과음 생성에 특화된 잠재 확산(Latent Diffusion) 모델인 스테이블 오디오 3(Stable Audio 3)를 공개했습니다. 소형 및 중형 모델의 가중치가 오픈소스로 공개되었으며, 중형 모델은 8GB VRAM을 탑재한 일반 소비자용 GPU에서도 구동될 만큼 가볍고 효율적입니다. 특히 5초 길이의 오디오 생성 벤치마크에서 기존 모든 오픈소스 모델을 뛰어넘는 최고 수준의 성능을 기록한 점이 가장 큰 의의입니다.

음성 생성 오픈소스 Stability AI
AR
Ars Technica 4일 전
IMP 9

오픈소스 취약점으로 수백만 AI 에이전트 해킹 위기

Python 기반 웹 프레임워크인 Starlette에서 'BadHost(CVE-2026-48710)'라는 심각한 인증 우회 취약점이 발견되었습니다. 이 취약점을 통해 해커는 서버에 침투하여 임상시험 데이터, 개인정보 등의 민감한 정보와 외부 서비스 인증 정보를 탈취할 수 있습니다. FastAPI, vLLM 등 주요 생태계뿐만 아니라 이를 기반으로 하는 수백만 대의 AI 에이전트와 도구가 영향을 받으므로 즉시 1.0.1 버전으로 업데이트 및 방화벽 설정 점검이 필요합니다.

보안 취약점 스타렛(Starlette) 패스트API(FastAPI)
LL
r/LocalLLaMA 4일 전
IMP 8

PrismML, 로컬 브라우저 구동 텍스트-이미지 모델 발표

PrismML팀이 1비트와 3진법 가중치를 활용한 텍스트-이미지 디퓨전 트랜스포머인 Binary 및 Ternary Bonsai Image 4B를 공개했습니다. 기존 FLUX.2 Klein 4B 모델(약 16GB)과 비교해 약 3GB 수준으로 크기를 획기적으로 줄이면서도 WebGPU를 통해 브라우저 내에서 완벽하게 로컬 구동이 가능합니다. Apache-2.0 라이선스로 제공되어 누구나 제한 없이 사용하고 변형할 수 있는 오픈소스 모델이라는 점이 가장 큰 의의입니다.

오픈소스 이미지 생성 로컬 구동
HN
Hacker News 4일 전
IMP 8

EAGLE, vLLM, TorchSpec 3사 협업한 추론 속도 혁신

EAGLE, vLLM, TorchSpec 팀이 협력하여 대규모 언어 모델(LLM)의 추론 속도를 획기적으로 높이는 'EAGLE 3.1' 스페큘러티브 디코딩(Speculative Decoding) 알고리즘을 발표했습니다. 이번 업데이트는 긴 문맥이나 다양한 프롬프트 환경에서 발생하는 '어텐션 드리프트(Attention Drift)' 문제를 해결하여, 기존 대비 최대 2배 긴 컨텍스트 수용 길이를 달성하며 모델 배포 안정성을 크게 높였습니다. 또한 실제 서비스 모델인 Kimi K2.6용 드래프트 모델을 오픈소스로 공개하고 vLLM 메인 브랜치에 통합하여 산업계의 실사용성을 강화했다는 점에서 중요합니다.

추론 속도 최적화 스페큘러티브 디코딩 오픈소스
HN
Hacker News 5일 전
IMP 6

웹 브라우저에서 실행되는 컨테이너 빌드

웹 브라우저의 샌드박스 환경 내에서 클라이언트 측 코드만으로 컨테이너 이미지를 직접 빌드하고 내보낼 수 있는 연구용 프로토타입이 공개되었습니다. 이 실험은 컨테이너 스펙에 대한 깊은 이해를 바탕으로 Docker 빌드 등 기존 툴의 한계를 벗어나 맞춤형 도구를 개발할 수 있다는 가능성을 보여줍니다.

컨테이너 웹 기술 데브옵스
LL
r/LocalLLaMA 6일 전
IMP 8

엘론 머스크, 내년 0.5T Grok 모델 공개 예고

일론 머스크가 내년에 0.5조(0.5T) 파라미터 규모의 Grok 모델을 공개할 계획이라고 밝혔습니다. 이와 함께 현재 Grok-3가 오픈소스로 공개되며 업계의 큰 주목을 받고 있습니다. 거대 언어 모델(LLM)의 성능 향상과 오픈소스 생태계 확장에 중요한 이정표가 될 것으로 보입니다.

Grok 오픈소스 인공지능 모델
MP
MarkTechPost 6일 전
IMP 7

랭구스(LLM 관측 플랫폼) 파이프라인 완벽 구축 가이드

오픈소스 LLM 엔지니어링 플랫폼인 Langfuse를 활용하여 트레이싱, 프롬프트 관리, 평가 및 실험을 수행하는 파이프라인 구축 방법을 다룹니다. 유료 API 키가 없어도 내장된 Mock LLM을 통해 모든 핵심 기능을 실습할 수 있어 실무 도입 전 테스트하기 유용합니다. 이를 통해 LLM 애플리케이션의 거동을 관측하고 체계적으로 개선하는 방법을 배울 수 있습니다.

LLM 관측 Langfuse 파이프라인 구축
MP
MarkTechPost 7일 전
IMP 8

마이크로소프트, 코드로 브라우저 제어하는 오픈소스 웹 에이전트 '웹라이트' 공개

마이크로소프트 리서치가 기존의 스크린샷이나 DOM 기반의 단편적인 클릭 방식을 벗어나, 에이전트가 터미널 환경에서 직접 코드를 작성해 브라우저를 제어하는 새로운 프레임워크 '웹라이트(Webwright)'를 오픈소스로 공개했습니다. 이 방식은 자동화 스크립트를 작성하는 개발자의 방식과 유사하며, 복잡한 다단계 웹 상호작용을 압축적인 코드로 처리할 수 있게 해줍니다. 오디세이(Odysseys) 벤치마크에서 기존 기본 GPT-4o 대비 성능을 크게 끌어올리며, 코드 생성 및 디버깅 능력이 뛰어난 최신 LLM의 강점을 극대화한 접근법으로 주목받습니다.

마이크로소프트 리서치 웹라이트 웹 자동화
GP
r/ChatGPT 7일 전
IMP 8

2분 만에 뚝딱 만든 웹사이트가 정부부처 공식 문서를 삭제하게 만든 사연

한 개발자가 2분 만에 제작한 사이트(fix1517.gr)가 그리스 재무부의 잘못된 세금 탈루 신고 안내를 폭로한 결과, 정부 측은 오류를 수정하는 대신 해당 공식 웹페이지를 삭제(404 오류 처리)하는 숨바꼭질을 벌였습니다. 이 사건은 여전히 운영비가 들어가는 1517 콜센터가 실제로는 어떠한 민원도 접수하지 않는 유령 공공기관으로 전락했다는 사실과 정부의 책임 회피를 국민적으로 고발하는 계기가 되었습니다.

웹_개발 정책_비판 공공데이터_오류
MP
MarkTechPost 7일 전
IMP 8

텐센트, 4계층 로컬 메모리 파이프라인 오픈소스화

텐센트가 AI 에이전트를 위한 완전한 로컬 기반 메모리 시스템인 'TencentDB Agent Memory'를 MIT 라이선스로 오픈소스화했습니다. 이 시스템은 심볼릭 단기 메모리와 4계층(L0~L3) 장기 메모리 피라미드를 결합하여 토큰 사용량을 61.38% 줄이고 작업 성공률을 크게 향상시켰습니다. 기본적으로 로컬 환경에서 작동하여 외부 클라우드 종속성 없이 AI 에이전트의 기억력과 효율성을 높일 수 있다는 점이 가장 큰 의의입니다.

텐센트 AI 에이전트 오픈소스
MP
MarkTechPost 8일 전
IMP 6

퍼플렉시티, Bumblebee 오픈소스 공개

퍼플렉시티(Perplexity)가 자사 개발자 시스템을 보호하기 위해 내부적으로 사용하던 보안 도구인 Bumblebee를 오픈소스로 공개했습니다. 이 도구는 macOS와 Linux 환경에서 패키지 매니저를 실행하거나 코드를 작동시키지 않고도 소프트웨어 공급망을 안전하게 스캔하는 읽기 전용 방식이 특징입니다. 개발자 엔드포인트 내의 다양한 패키지와 확장 프로그램의 인벤토리를 수집하여 공급망 보안을 강화하는 데 유용하게 활용될 수 있습니다.

오픈소스 보안 공급망