#오픈소스-모델

네이티브(Nativ): 맥에서 로컬 AI 모델을 실행하는 방법

네이티브(Nativ)는 구글, 코히어, 리퀴드 AI의 최신 오픈소스 모델을 맥(Mac) 환경에서 로컬로 구동할 수 있게 해주는 도구입니다. 사용자의 맥 하드웨어 사양을 분석하여 최적의 파트너 모델을 추천해 주는 것이 핵심 특징입니다. 개발자와 실무자들이 별도의 클라우드 비용 없이 자신의 기기에서 다양한 최신 AI 모델을 테스트하고 활용할 수 있다는 점에서 의미가 있습니다.

로컬-ai 오픈소스-모델 맥-mac

Hacker News • 10일 전

IMP 9

올라마(Ollama), 오픈 모델의 대중화를 이끌다

Docker Desktop 개발진이 나서서 만든 올라마(Ollama)는 복잡한 설정 없이 로컬 환경에서 오픈소스 AI 모델을 손쉽게 실행할 수 있는 플랫폼입니다. 개발자들에게 모델의 완전한 소유권, 무료 활용, 데이터 프라이버시를 제공하며 포춘 500대 기업의 85%가 사용할 정도로 업계 표준으로 자리 잡았습니다. 최근 8,800만 달러(약 1,200억 원)의 시리즈 B 투자를 유치하며, 강력한 클라우드 환경 구축과 오픈소스 AI 생태계 확장에 박차를 가하고 있습니다.

올라마 오픈소스-모델 로컬-AI

The Decoder • 20일 전

IMP 8

데이터브릭스, 저렴한 비용의 中 오픈소스 모델 GLM 5.2를 기본 코딩 엔진으로 선택

데이터브릭스가 자체 코드베이스 테스트 결과, 중국의 오픈소스 모델인 GLM 5.2가 앤스로픽의 오푸스 4.8(Opus 4.8)과 통계적으로 동등한 성능을 내면서도 비용은 훨씬 저렴하다는 사실을 확인했습니다. 이에 따라 데이터브릭스는 개발자들의 일상적인 업무용 코딩 모델로 GLM 5.2를 기본 도입할 계획이며, 코인베이스 등 다른 기업들 또한 비용 절감을 위해 중국산 모델로 빠르게 전환하고 있습니다.

데이터브릭스 GLM-5.2 오픈소스-모델

Hacker News • 30일 전

IMP 9

Ornith-1.0: 자가 개선형 에이전트 코딩 LLM 공개

에이전트 코딩(Agentic Coding) 작업에 특화된 오픈소스 모델인 Ornith-1.0이 공개되었습니다. 이 모델은 스스로 문제 해결을 위한 구조(Scaffold)를 생성하고 최적화하는 '자가 개선형 학습 프레임워크'를 적용하여, 동급의 타 오픈소스 모델은 물론 Claude Opus 4.7을 넘어서는 최고 수준의 벤치마크 성능을 기록했습니다. 엣지 기기에 배포 가능한 9B 소형 모델부터 397B 대규모 MoE 모델까지 다양한 버전을 제공하는 것이 특징입니다.

오픈소스-모델 에이전트-코딩 강화학습

Hacker News • 30일 전

IMP 8

세그렙 벤치마크: GLM 5.2가 클로드 제쳐

Semgrep의 보안 취약점(IDOR) 탐지 테스트 결과, 중국 Z.ai의 오픈웨이트 모델인 GLM 5.2가 단순 프롬프트만으로도 Claude Code보다 뛰어난 성능을 기록했습니다. 이는 복잡한 하네스(정적 분석 스캐폴딩) 없이도 최신 오픈소스 모델이 프롬프트만으로 프론티어(최고 수준) 코딩 에이전트를 앞지를 수 있음을 증명하는 결과입니다. 특히 1M 토큰의 긴 문맥 처리와 MIT 라이선스 기반의 자체 구축 가능성 덕분에 민감한 데이터를 다루는 보안 실무자들에게 중요한 대안으로 떠오르고 있습니다.

보안 오픈소스-모델 GLM-5.2

Hacker News • 44일 전

IMP 6

M1 Max와 로컬 ML 모델로 669GB 고프로 영상 인덱싱하기

한 개발자가 자전거 주행 중 촬영한 방대한 고프로 영상에서 유의미한 순간을 찾기 위해 오픈소스 ML 모델을 활용했습니다. 이 로컬 기반 파이프라인은 영상 내 장면을 검색하고, 최적의 클립을 다빈치 리졸브 타임라인으로 바로 전송하는 등 영상 편집 워크플로우를 획기적으로 자동화합니다.

로컬-머신러닝 비디오-인덱싱 오픈소스-모델

Hacker News • 45일 전

IMP 8

파산 걱정 없는 가정용 AI 코딩 가이드

거액의 하드웨어 구매 부담 없이 개인이 AI 코딩을 활용하는 세 가지 전략과 최적의 하이브리드 방식을 제시합니다. 단순 API(API) 호출과 프론티어 정기 구독을 혼합하고 명세서 주도 개발을 적용하면, 소규모 팀의 한 달 치 작업량을 단 1천 달러로 처리할 수 있습니다.

AI코딩 오픈소스-모델 API

Hacker News • 55일 전

IMP 9

바이오허브, 단백질 생물학 월드 모델 공개

바이오허브(Biohub)가 생명체의 모든 단백질 구조를 예측하고, 실험실에서 기능이 검증된 새로운 단백질을 설계할 수 있는 '단백질 생물학 월드 모델'을 오픈소스로 공개했습니다. 이번에 발표된 핵심 모델인 ESMFold2는 항암 및 면역학 치료제 타겟에 대한 단백질 결합제를 며칠 만에 설계해냈으며, 실험을 통해 높은 안정성과 친화도를 입증했습니다. 이는 기존 신약 후보물질 발굴에 수년이 걸리던 전통적인 과정을 혁신할 수 있는 생물학 및 제약 분야의 획기적인 이정표로 평가됩니다.

생물학-ai 단백질-구조-예측 신약-개발

Hacker News • 56일 전

IMP 8

마이크로소프트 5B 모델, SWE-Bench Pro 51% 달성

마이크로소프트가 발표한 MAI-Code-1-Flash는 활성 파라미터 50억 개(5B)라는 가벼운 크기에도 불구하고 코딩 벤치마크인 SWE-Bench Pro에서 51%의 높은 성능을 기록했습니다. 복잡한 코딩 작업을 처음부터 끝까지 추론하고, 사용자의 개입 없이 자율적으로 다단계 워크플로우를 수행하는 에이전트 기능이 핵심입니다. 특히 VS Code 환경의 GitHub Copilot에 최적화되어 개발자들에게 획기적인 생산성 향상을 제공할 전망입니다.

마이크로소프트 코딩-에이전트 GitHub-Copilot

Hacker News • 60일 전

IMP 8

리퀴드 AI, 38T 토큰 학습 8B MoE 모델 공개

리퀴드 AI는 엣지 환경에 최적화된 혼합 전문가(MoE) 구조의 새로운 언어 모델 'LFM2.5-8B-A1B'를 발표했습니다. 이번 모델은 기존 대비 3배 이상 확장된 38조 개의 토큰으로 사전 학습되었으며, 컨텍스트 윈도우가 128K로 늘어났고 추론 성능이 대폭 향상되었습니다. 특히 어휘량을 두 배로 늘려 비 라틴어권 언어의 토크나이징 효율을 높이고, 대규모 강화 학습을 적용해 가벼운 소비자용 하드웨어에서도 강력한 온디바이스 성능을 발휘하는 것이 가장 큰 특징입니다.

온디바이스-AI 혼합-전문가-모델 강화-학습

r/LocalLLaMA • 67일 전

IMP 6

민감: 듀얼 GPU로 48GB VRAM 확보 성공!

서로 다른 세대(RDNA4, RDNA3)의 AMD 그래픽 카드 두 장을 결합해 총 48GB VRAM 환경을 구축한 사례입니다. 호환성 문제로 인해 로존(ROCm) 대신 벌칸(Vulkan) 백엔드를 사용하여 성공적으로 llama-cpp 서버를 실행했습니다. 이는 추가 그래픽 카드와 파워서플라이 정도의 적은 비용으로 대규모 로컬 AI 모델 구동을 위한 막대한 VRAM을 확보할 수 있음을 보여줍니다.

로컬-ai llama-cpp amd-radeon

r/LocalLLaMA • 90일 전

IMP 8

미스트랄 '미디엄 3.5' 모델 공개 및 클라우드 코딩 에이전트 출시

미스트랄이 지시어 준수, 추론, 코딩 능력을 결합한 128B 밀집형 플래그십 모델 'Mistral Medium 3.5'를 공개했습니다. 이와 함께 코딩 에이전트 'Vibe'를 클라우드로 확장하여 비동기 방식의 병렬 작업을 지원하며, 'Le Chat'에는 복잡한 다단계 작업을 수행하는 새로운 'Work mode(작업 모드)'를 도입했습니다.

미스트랄 오픈소스-모델 코딩-에이전트

r/LocalLLaMA • 93일 전

IMP 6

큐웬 35B(MoE)에서 27B로 교체, 코딩 성능 확연한 향상

큐웬(Qwen) 3.6 모델의 35B-a3b(MoE 구조)에서 27B(Dense 구조)로 전환해 코딩 및 디버깅 능력이 크게 향상된 로컬 AI 개발자의 사용기입니다. VRAM 한계로 압축률이 높은 IQ3 모델을 사용했음에도 불구하고 기존 모델보다 복잡한 버그를 더 잘 찾아냈으며, 전체적인 처리 속도도 안정적이었습니다.

로컬-llm 큐웬 코딩-보조

r/LocalLLaMA • 102일 전

IMP 6

큐웬(Qwen) 2.5 실성능 후기: 설정만 제대로 하면 꽤 쓸만함

오픈소스 로컬 LLM 유저가 새로운 큐웬(Qwen) 2.5 모델이 오프라인 환경에서도 실용적인 성능을 발휘한다고 평가했습니다. 클로드 오푸스(Claude Opus)나 코덱스(Codex) 급은 아니지만, 애플 M5 Max 환경에서 매우 빠른 속도로 작동하며 유의미한 작업이 가능한 수준이라고 언급했습니다. 단, 모델의 추론 기능을 끄지 않는 `preserve_thinking` 설정을 반드시 켜야 최적의 성능을 얻을 수 있습니다.

로컬-LLM 큐웬(Qwen) 오픈소스-모델