메뉴

오픈소스

30개 소식

오픈소스 AI 프로젝트

AI 모델코딩 에이전트오픈소스이미지 생성영상 생성정책/규제비즈니스연구
HN
Hacker News 19시간 전
IMP 1

교황 방문을 활용한 레바논 전국 도로 복구 알고리즘

해커뉴스(Hacker News)에 올라온 유머러스한 논문으로, 레바논의 부실한 도로 인프라를 복구하기 위해 교황의 방문 일정을 확률론적으로 이용하는 알고리즘을 제안합니다. 레바논에서는 교황이 지나가는 길만 정비된다는 사회적 풍자를 수학적 모델로 구현한 것이 핵심입니다. 기술적인 내용보다는 개발자 커뮤니티의 유머와 위트를 보여주는 밈(Meme) 성격의 글입니다.

해커뉴스 유머 알고리즘
HN
Hacker News 23시간 전
IMP 6

영국 발코니 태양광 발전량 예측 서비스

영국의 모든 주소에 대해 발코니 설치형(플러그인) 태양광 패널의 예상 발전량과 경제성을 분석해 주는 웹 서비스가 소개되었습니다. LIDAR 및 지형 데이터를 활용해 주변 건물의 그림자를 3차원으로 추적하고, 이를 바탕으로 정확한 연간 발전량과 투자 회수 기간을 예측합니다. 복잡한 설치 없이도 가정에서 쉽게 태양광 에너지를 생산할 수 있는 '플러그인 태양광'의 잠재력을 시각적으로 보여준다는 점에서 주목받습니다.

태양광 발전 공간 데이터 분석 웹 서비스
MP
MarkTechPost 1일 전
IMP 8

헤르메스 에이전트, MCP 도구 검색 기능 공개

Nous Research의 헤르메스 에이전트가 MCP 환경에서 흔히 발생하는 컨텍스트 과부하 문제를 해결하기 위해 '도구 검색(Tool Search)' 기능을 추가했습니다. 이 기능은 BM25 및 점진적 스키마 공개(Progressive Schema Disclosure) 방식을 활용하여 불필요한 정보를 걸러냅니다. Anthropic의 평가 결과에 따르면, 이 기능 도입으로 Opus 4 모델의 도구 활용 정확도가 49%에서 최대 74%까지 크게 향상되었습니다.

에이전트 MCP 오픈소스
MP
MarkTechPost 1일 전
IMP 8

파이썬으로 170만 건 AI 에이전트 데이터셋 구축하기

에이전트 상호작용 기록(Trace) 170만 건을 포함한 역대 최대 규모의 오픈소스 데이터셋인 'AgentTrove'를 활용하는 파이썬 실전 튜토리얼을 소개합니다. 이 튜토리얼은 대용량 데이터를 전체 다운로드 없이 스트리밍하고, 성공적인 기록만 추출해 고품질 SFT(Supervised Fine-Tuning) 데이터셋으로 변환하는 방법을 다룹니다. AI 에이전트의 파인튜닝을 위한 대규모 학습 데이터를 효율적으로 구축하려는 실무자들에게 매우 유용한 가이드입니다.

데이터셋 에이전트 파인튜닝
HN
Hacker News 1일 전
IMP 8

C++와 CUDA로 구현하는 고성능 LLM 추론 엔진

인기 있는 LLM 추론 프레임워크인 vLLM의 경량화된 버전인 tiny-vLLm을 C++와 CUDA를 사용해 밑바닥부터 직접 구현해 보는 오픈소스 프로젝트 및 강의 자료입니다. 모델 가중치 로딩부터 PagedAttention, 연속 배치(Continuous Batching) 등 실제 운영 환경에서 필요한 핵심 기술들을 직관적으로 학습할 수 있습니다. 개발자와 강사 모두가 LLM의 작동 원리와 추론 서버 구축 과정을 깊이 있게 이해하는 데 매우 유용한 자료입니다.

오픈소스 LLM 추론 vLLM
MP
MarkTechPost 2일 전
IMP 8

헥소 랩스, 모델 가중치와 구조 모두를 업데이트하는 자가 개선 에이전트 'SIA' 오픈소스화

Hexo Labs가 MIT 라이선스로 자가 개선 루프 시스템인 SIA를 오픈소스로 공개했습니다. 이 에이전트는 실행 기록을 분석해 스캐폴드 코드(Scaffold)를 재작성하거나 모델의 LoRA 가중치를 업데이트하여 성능을 지속적으로 향상시킵니다. 두 가지 방식을 결합한 결과, 벤치마크 테스트에서 기존 방식 대비 월등한 성능 개선을 입증했다는 점이 핵심입니다.

오픈소스 자가 개선 에이전트 모델 파인튜닝
MP
MarkTechPost 2일 전
IMP 7

플레이북부터 커스텀 모듈까지: 엔드투엔드 Ansible 자동화 랩 설계

이 튜토리얼은 Google Colab이나 Linux 환경에서 완벽하게 동작하는 엔드투엔드 Ansible 자동화 랩을 구축하는 방법을 안내합니다. 인프라 관리 실무자에게 필수적인 정적/동적 인벤토리 구성, 변수 우선순위, 그리고 커스텀 모듈 개발까지 아우르는 실습 위주의 가이드입니다. 체계적인 자동화 환경을 구축하고 인프라 운영 효율을 극대화하려는 엔지니어들에게 매우 유용한 내용을 담고 있습니다.

DevOps Ansible 인프라 자동화
HN
Hacker News 2일 전
IMP 8

코딩 에이전트를 겨냥한 프로테스트웨어의 등장

자바 테스트 라이브러리인 jqwik 1.10.0 버전에 코딩 에이전트를 교란하기 위한 프롬프트 인젝션 문구가 포함되어 논란이 되었습니다. 이 업데이트는 개발자의 터미널에서는 보이지 않도록 ANSI 이스케이프 코드를 활용해 숨겨두고, CI 로그나 AI 에이전트가 읽을 때만 작동하도록 설계되었습니다. 이는 공급망 보안 및 AI 도구 사용에 있어 새로운 형태의 위협으로 평가받고 있습니다.

공급망 보안 프롬프트 인젝션 코딩 에이전트
HN
Hacker News 2일 전
IMP 7

오픈 엔벨로프: AI 에이전트 팀 정의 오픈 스키마

AI 에이전트 팀 구성을 표준화된 JSON Schema로 정의할 수 있는 오픈소스 프로젝트가 공개되었습니다. 역할, 권한, 승인 게이트 등을 포함해 팀을 한 번 정의하면 Docker처럼 다양한 런타임에서 실행할 수 있도록 이식성을 확보하는 것이 핵심입니다.

에이전트 다중 에이전트 오픈소스
HN
Hacker News 2일 전
IMP 6

지그 데이(Zig Days)에서 LLM 사용을 자제해야 하는 이유

Zig 커뮤니티의 핵심 오프라인 행사인 '지그 데이(Zig Days)'의 의미를 살리기 위해, AI 및 LLM 관련 대화와 사용을 자제할 것을 권장하는 글입니다. 행사 참가자들은 AI가 대신해 줄 수 있는 코딩 대신 직접 코드를 작성하고 동료와 소통하며 깊이 있는 소프트웨어 엔지니어링 경험을 쌓아야 합니다. 이는 최근 LLM 열풍 속에서도 시스템의 동작 원리를 이해하는 개발자의 고유한 가치를 지키기 위한 실천적인 조언으로 중요합니다.

Zig LLM 소프트웨어 엔지니어링
HN
Hacker News 2일 전
IMP 7

데이터 에이전트용 오픈소스 컨텍스트 레이어, Ktx

Ktx는 데이터 에이전트가 데이터 웨어하우스를 정확하게 쿼리하도록 돕는 자가 개선형 컨텍스트 레이어입니다. 위키, dbt 등의 비즈니스 지식을 자동 수집하고 조인 가능한 컬럼을 매핑하여 에이전트가 승인된 지표 정의를 따르게 합니다. Claude Code, Cursor 등 주요 코딩 에이전트와 MCP 및 CLI로 연동됩니다.

데이터 에이전트 시맨틱 레이어 오픈소스
40
404 Media 2일 전
IMP 7

아우라 웨어러블 월 구독료 없이 이용하는 방법

아우라 링(Oura Ring) 사용자가 월 구독료를 내지 않고도 자신의 건강 데이터를 분석할 수 있는 오픈소스 앱 'Cracked Oura'가 개발자에 의해 공개되었습니다. 이 앱은 기기 내부에 데이터를 저장하고, 기존 공식 앱보다 깊이 있는 인사이트를 제공하며, 구독 결제가 필요 없다는 점에서 의미가 있습니다. 비싼 기기를 구매한 후 건강 데이터를 보려면 매월 추가 요금을 내야 하는 문제에 대한 소비자 불만과 대안을 보여줍니다.

오픈소스 웨어러블 데이터 주권
TD
The Decoder 2일 전
IMP 7

구글, Gemma 3 온디바이스 구동 초소형 보드 공개

구글이 자체 NPU를 탑재해 AI 모델을 네트워크 없이 로컬에서 구동할 수 있는 초소형 싱글보드 컴퓨터 'Coral Board'를 공개했습니다. 이 보드는 이어폰, 스마트워치 등 초소형 기기에 적합하며 AI 가속기 파편화 문제를 해결하는 것을 목표로 합니다. 완전한 오프라인 환경에서 실시간 번역 등 다양한 엣지 AI 데모를 성공적으로 선보였다는 점에서 실무자들에게 큰 의미를 갖습니다.

온디바이스 AI 구글 코랄 Coral Board
HN
Hacker News 3일 전
IMP 5

프로그래밍 언어 라켓(Racket) v9.2 정식 출시

언어 지향 프로그래밍 언어인 라켓(Racket)의 최신 버전인 v9.2가 정식 출시되었습니다. 이번 업데이트에서는 비선형 패턴 매칭 검증 강화, Typed Racket의 복소수 타입 처리 수정, 유니코드 17.0 지원 등 핵심 기능이 개선되었습니다. 일부 하위 호환성에 영향을 주는 변경점이 포함되어 있어 기존 사용자는 업데이트 시 코드 호환성을 확인해야 합니다.

라켓 오픈소스 프로그래밍언어
MP
MarkTechPost 3일 전
IMP 7

퍼플렉시티, 휴깅페이스 대비 5배 빠른 토크나이저 오픈소스화

Perplexity AI가 Unigram 기반의 새로운 토크나이저를 오픈소스로 공개했습니다. 이 토크나이저는 널리 쓰이는 Hugging Face 토크나이저 대비 p50 지연 시간을 5배 낮춰 대규모 텍스트 처리 성능을 크게 향상시켰다는 점에서 실무적인 의의가 있습니다. 데이터 전처리 및 AI 서비스 추론 속도 개선에 핵심적인 역할을 할 것으로 기대됩니다.

오픈소스 퍼플렉시티 토크나이저
HN
Hacker News 3일 전
IMP 6

오픈소스 AI 자동차 레이싱 하네스(Harness) 공개

해커뉴스에 자율주행 및 로봇 공학 연구를 위한 '오픈소스 AI 레이싱 하네스'가 소개되었습니다. 소속사인 Elodin은 지구 중력장 모델인 EGM2008의 초고속 구현체를 새롭게 추가하여 성능을 개선하였습니다. 또한 200만 달러(약 27억 원) 규모의 프리시드 투자 유치를 성공적으로 마치고 첫 정규 직원(비행 소프트웨어 엔지니어)을 영입하며 본격적인 기술 고도화에 나섰습니다.

오픈소스 자율주행 ai-에이전트
LL
r/LocalLLaMA 3일 전
IMP 5

역대급 근성으로 조립한 로컬 AI 서버

여러 개의 중고 서버 부품과 엔비디아 테슬라 V100 GPU 3장을 조합해 총 96GB의 VRAM을 갖춘 로컬 AI 서버 구축기입니다. 노트북용 램 어댑터 사용, 벽면 직결 팬 등 파격적인 수동 조립(일명 짬처리) 과정을 거쳤습니다. 대용량 로컬 AI 추론 환경을 최소 비용으로 구축하려는 실무자 및 하드웨어 마니아들에게 흥미로운 사례입니다.

로컬 AI 하드웨어 VRAM
HN
Hacker News 3일 전
IMP 6

HTTPS를 넘어선 대안적 인터넷 생태계

구글 크로미움 엔진에 의존하는 현재의 웹 독과점 및 단일화 문제를 지적하며, 탈중앙화된 대안적 인터넷 프로토콜을 소개하는 글입니다. 1971년 최초의 소셜 미디어 프로필과도 같았던 Finger부터 터미널 기반의 가벼운 생태계를 자랑하는 Gopher, 그리고 2019년에 만들어진 현대적인 텍스트 프로토콜 Gemini까지 세 가지 생태계를 조명합니다. 자바스크립트나 무거운 GUI 없이 터미널 환경에서 작동하는 이 프로토콜들은 거대 기업 중심의 웹 생태계에서 벗어날 수 있는 대안을 제시합니다.

인터넷 프로토콜 탈중앙화 웹 아카이브
HN
Hacker News 3일 전
IMP 7

오픈소스 워크스페이스(메일,문서,스프레드시트)

해커뉴스에 메일, 문서, 스프레드시트, 드라이브 기능을 모두 포함한 올인원 오픈소스 워크스페이스 프로젝트가 공개되었습니다. Docker Compose 명령어 한 번으로 15초 내외에 자동 SSL 인증서 적용 및 메일 서버 구축까지 마무리되는 것이 특징입니다. 개인 및 기업이 구글 워크스페이스나 MS 365 등 상용 서비스를 대체할 수 있는 자체 호스팅(Self-hosted) 환경을 손쉽게 구축할 수 있어 실무자들에게 유용합니다.

오픈소스 자체호스팅 워크스페이스
HN
Hacker News 4일 전
IMP 7

포스트혼: 메일 서버 없는 셀프 호스팅 메일 통합 게이트웨이

셀프 호스팅 프로젝트를 위한 통합 발신 메일 릴레이 계층인 '포스트혼(Posthorn)'이 소개되었습니다. 이 도구는 사용자가 직접 메일 서버를 운영할 필요 없이, 다양한 앱의 발신 메일을 하나의 설정과 자격 증명으로 관리하여 Postmark, Resend 등의 트랜잭셔널 메일 제공자로 안전하게 중계합니다. 단일 Go 바이너리와 TOML 설정만으로 이메일 통합의 복잡성을 크게 줄여주는 오픈소스 솔루션입니다.

오픈소스 셀프 호스팅 이메일 릴레이
MP
MarkTechPost 4일 전
IMP 7

고정밀 검색-재순위 파이프라인 구축하기

이 튜토리얼은 40억(4B) 파라미터 규모의 Qwen3 기반 크로스 인코더 재순위 모델(reranker)인 'zeroentropy/zerank-2-reranker'를 활용해 검색 품질을 극대화하는 방법을 다룹니다. 빠른 바이 인코더(bi-encoder)로 먼저 후보 문서를 검색하고, 제로랭크-2 모델이 이를 정밀하게 재정렬하는 2단계 검색 파이프라인을 구축하는 실무 과정을 설명합니다. 정보 검색 및 RAG(검색 증강 생성) 시스템의 정확도를 높이고자 하는 AI 실무자들에게 필수적인 최적화 가이드를 제공합니다.

재순위 모델 (Reranker) 검색 증강 생성 (RAG) 정보 검색 (IR)
AR
Ars Technica 4일 전
IMP 9

오픈소스 취약점으로 수백만 AI 에이전트 해킹 위기

Python 기반 웹 프레임워크인 Starlette에서 'BadHost(CVE-2026-48710)'라는 심각한 인증 우회 취약점이 발견되었습니다. 이 취약점을 통해 해커는 서버에 침투하여 임상시험 데이터, 개인정보 등의 민감한 정보와 외부 서비스 인증 정보를 탈취할 수 있습니다. FastAPI, vLLM 등 주요 생태계뿐만 아니라 이를 기반으로 하는 수백만 대의 AI 에이전트와 도구가 영향을 받으므로 즉시 1.0.1 버전으로 업데이트 및 방화벽 설정 점검이 필요합니다.

보안 취약점 스타렛(Starlette) 패스트API(FastAPI)
HN
Hacker News 4일 전
IMP 8

EAGLE, vLLM, TorchSpec 3사 협업한 추론 속도 혁신

EAGLE, vLLM, TorchSpec 팀이 협력하여 대규모 언어 모델(LLM)의 추론 속도를 획기적으로 높이는 'EAGLE 3.1' 스페큘러티브 디코딩(Speculative Decoding) 알고리즘을 발표했습니다. 이번 업데이트는 긴 문맥이나 다양한 프롬프트 환경에서 발생하는 '어텐션 드리프트(Attention Drift)' 문제를 해결하여, 기존 대비 최대 2배 긴 컨텍스트 수용 길이를 달성하며 모델 배포 안정성을 크게 높였습니다. 또한 실제 서비스 모델인 Kimi K2.6용 드래프트 모델을 오픈소스로 공개하고 vLLM 메인 브랜치에 통합하여 산업계의 실사용성을 강화했다는 점에서 중요합니다.

추론 속도 최적화 스페큘러티브 디코딩 오픈소스
HN
Hacker News 5일 전
IMP 8

슬래시 하나로 AWS API 인증 우회, 1.2만 달러 버그바운티 획득

보안 연구원이 핀테크 기업의 모바일 API를 테스트하던 중 URL 끝에 슬래시(/) 하나를 추가해 AWS API Gateway의 인증을 우회할 수 있는 취약점을 발견했습니다. AWS HTTP API의 탐욕적 경로 매칭(Greedy path matching) 과정에서 경로 재작성(Path rewrite) 시 인증 컨텍스트가 소실되는 설계적 모순이 원인으로, 이를 통해 계좌 정보 탈취 및 무단 이체까지 가능했습니다. 해당 기업은 다음 날 REST API로 전환하고 백엔드에 userId 검증 로직을 추가하여 문제를 신속히 해결했으며, 연구원은 1만 2천 달러의 포상금을 받았습니다.

버그바운티 보안취약점 AWS
LL
r/LocalLLaMA 5일 전
IMP 5

Qwen3.5 35B 비검열 모델 다양한 포맷 출시

알리바바의 오픈소스 모델 Qwen3.5 35B A3B를 기반으로 한 비검열(UnCensored) 커스텀 모델과 Native MTP(다음 토큰 예측)가 완벽히 보존된 버전이 공개되었습니다. 이 모델은 Safetensors, GGUF, NVFP4, GPTQ-Int4 등 다양한 형식과 양자화 포맷을 지원하여 로컬 환경에서의 활용성을 극대화한 것이 특징입니다.

오픈소스 모델 로컬 AI 양자화
LL
r/LocalLLaMA 5일 전
IMP 7

변호사의 로컬 AI 법률 문서 작성기: V100 클러스터 구축기

한 변호사가 V100 12개와 RTX 3090 등 총 16개의 GPU를 활용해 법률 문서 초안을 자동 작성하는 로컬 AI 시스템을 완성했습니다. 실험 결과 V100 환경에서는 일반적인 Dense 모델보다 MoE(Mixture of Experts) 모델이 압도적인 처리 속도를 보여주어 시스템 전체를 MoE 중심으로 재구성했습니다. 여러 로컬 모델이 각자의 역할을 나누어 수행하는 오케스트레이터 구조를 통해 고수준의 법률 문서를 빠르고 정확하게 생성해 내는 것이 이 프로젝트의 핵심입니다.

로컬 AI 법률 AI 자동화 오픈소스 LLM
HN
Hacker News 5일 전
IMP 6

웹 브라우저에서 실행되는 컨테이너 빌드

웹 브라우저의 샌드박스 환경 내에서 클라이언트 측 코드만으로 컨테이너 이미지를 직접 빌드하고 내보낼 수 있는 연구용 프로토타입이 공개되었습니다. 이 실험은 컨테이너 스펙에 대한 깊은 이해를 바탕으로 Docker 빌드 등 기존 툴의 한계를 벗어나 맞춤형 도구를 개발할 수 있다는 가능성을 보여줍니다.

컨테이너 웹 기술 데브옵스
MP
MarkTechPost 6일 전
IMP 7

랭구스(LLM 관측 플랫폼) 파이프라인 완벽 구축 가이드

오픈소스 LLM 엔지니어링 플랫폼인 Langfuse를 활용하여 트레이싱, 프롬프트 관리, 평가 및 실험을 수행하는 파이프라인 구축 방법을 다룹니다. 유료 API 키가 없어도 내장된 Mock LLM을 통해 모든 핵심 기능을 실습할 수 있어 실무 도입 전 테스트하기 유용합니다. 이를 통해 LLM 애플리케이션의 거동을 관측하고 체계적으로 개선하는 방법을 배울 수 있습니다.

LLM 관측 Langfuse 파이프라인 구축
MP
MarkTechPost 7일 전
IMP 8

마이크로소프트, 코드로 브라우저 제어하는 오픈소스 웹 에이전트 '웹라이트' 공개

마이크로소프트 리서치가 기존의 스크린샷이나 DOM 기반의 단편적인 클릭 방식을 벗어나, 에이전트가 터미널 환경에서 직접 코드를 작성해 브라우저를 제어하는 새로운 프레임워크 '웹라이트(Webwright)'를 오픈소스로 공개했습니다. 이 방식은 자동화 스크립트를 작성하는 개발자의 방식과 유사하며, 복잡한 다단계 웹 상호작용을 압축적인 코드로 처리할 수 있게 해줍니다. 오디세이(Odysseys) 벤치마크에서 기존 기본 GPT-4o 대비 성능을 크게 끌어올리며, 코드 생성 및 디버깅 능력이 뛰어난 최신 LLM의 강점을 극대화한 접근법으로 주목받습니다.

마이크로소프트 리서치 웹라이트 웹 자동화
MP
MarkTechPost 7일 전
IMP 8

텐센트, 4계층 로컬 메모리 파이프라인 오픈소스화

텐센트가 AI 에이전트를 위한 완전한 로컬 기반 메모리 시스템인 'TencentDB Agent Memory'를 MIT 라이선스로 오픈소스화했습니다. 이 시스템은 심볼릭 단기 메모리와 4계층(L0~L3) 장기 메모리 피라미드를 결합하여 토큰 사용량을 61.38% 줄이고 작업 성공률을 크게 향상시켰습니다. 기본적으로 로컬 환경에서 작동하여 외부 클라우드 종속성 없이 AI 에이전트의 기억력과 효율성을 높일 수 있다는 점이 가장 큰 의의입니다.

텐센트 AI 에이전트 오픈소스