#오픈소스 AI

[object Object] [object Object] [object Object]

시스코, 적은 비용으로 GPT-5.5 앞지르는 보안 AI 모델 공개

시스코(Cisco)가 소프트웨어 취약점 탐지에 특화된 소규모 오픈소스 AI 모델 'Antares'를 공개했습니다. 이 모델은 극히 일부의 비용과 시간만으로도 GPT-5.5와 동등 이상의 성능을 내며 로컬 환경에서 실행되어 보안을 강화합니다. 가성비와 데이터 프라이버시가 중요한 기업 실무자들에게 매우 유용한 접근으로 평가됩니다.

TechCrunch AI • 6일 전

미국 오픈소스 AI 연구소 "중국 모델, 본질적으로 위험하지 않아"

중국산 오픈 웨이트 AI 모델이 성능과 인기를 얻으며 미국 내에서 금지 움직임이 나오고 있지만, 미국 오픈소스 AI 스타업인 Arcee의 최고기술경영자(CTO)는 중국 모델이 다른 오픈소스 소프트웨어보다 더 위험하지 않다고 반박했습니다. 기업이 자체 데이터센터에서 모델을 운영할 경우 외부에서 접근할 방법이 없으며, 보안 검수를 거치면 백도어나 악성 코드가 실행될 가능성도 극히 희박하다고 설명했습니다. 오히려 미국은 중국 모델을 배척할 것이 아니라 훌륭한 오픈소스 생태계를 육성하고 더 나은 모델을 개발하는 방식으로 경쟁해야 한다고 강조했습니다.

오픈소스 AI 중국 AI 모델 보안 위협

MarkTechPost • 7일 전

시스코, 오픈소스 보안 AI 'Antares' 공개

시스코 파운데이션 AI는 코드베이스 내의 알려진 취약점 위치를 정확히 찾아내는 소규모 언어 모델인 Antares(350M, 1B)를 오픈웨이트로 공개했습니다. 이 모델은 파라미터 753B의 거대 AI 모델들보다 뛰어난 성능을 보이면서도, 단일 GPU 환경에서 매우 빠르고 저렴한 비용으로 작동하여 실무 보안 점검의 효율성을 크게 높일 수 있습니다.

시스코 보안 취약점 오픈소스 AI

TechCrunch AI • 7일 전

美, 중국 AI 모델 지식재산권 침해 의심… 제재 검토

미국 정부는 중국의 오픈소스 AI 모델들이 미국 기업의 지식재산권(IP)을 탈취했는지 조사하여, 위반 사실이 확인될 경우 제재를 가할 방침입니다. 최근 중국산 AI 모델들이 급격히 발전하며 미국 기업을 위협하자, 미국은 핵심 기술 유출과 시장 장악력 약화를 방어하기 위해 모델 자체를 규제 대상에 포함시키는 강수를 두고 있습니다. 이 과정에서 거대 언어 모델(LLM)의 기술을 축소하는 '모델 증류(distillation)'가 기술 도용인지를 두고 업계 내에서 치열한 논쟁이 진행 중입니다.

AI 정책 지식재산권 오픈소스 AI

TechCrunch AI • 8일 전

미국 AI 표준 기구 국장, 취임 3개월 만에 또 돌연 사임

미국 국립표준기술연구소(NIST) 산하 AI 표준 및 혁신 센터(CAISI)의 국장인 크리스 폴(Chris Fall)이 취임 3개월 만에 또 다시 사임했습니다. 이번 인사 이탈은 중국산 오픈소스 AI 모델 규제 논의가 한창인 가운데 발생하여, 실질적인 AI 정책 및 모델 검증 주도권을 두고 행정부 내부와 업계 간의 혼선이 가중되고 있음을 시사합니다.

AI 정책 NIST 앤스로픽

MIT Tech Review • 8일 전

미중 AI 경쟁 오픈소스 AI 트럼프 AI 정책

中 AI 모델 '키미'에 발칵 뒤집힌 트럼프 AI 진영

중국 기업 문샷아이가 무료 오픈소스 AI 모델 '키미(Kimi)'를 출시하자, 성능 경쟁력과 경제적 타격을 우려한 트럼프 행정부 내 AI 핵심 참모들 사이에서 정책을 두고 치열한 내분이 발생했습니다. 막강한 미국 기술 기업들의 독점을 막고 무료 모델을 선호하는 시장의 흐름 속에, 정부 개입의 정당성과 국가 안보 규제의 범위를 두고 보수 진영 내부조차 깊은 갈등을 겪고 있습니다.

TechCrunch AI • 11일 전

데이터브릭스, 188B 달러 기업가치로 AI 도약 입증

데이터브릭스(Databricks)가 새로운 투자 유치를 통해 기업가치를 1,880억 달러로 끌어올렸습니다. 빅데이터 기반의 기업용 SaaS에서 맞춤형 AI 인프라 기업으로 성공적인 이미지 전환을 이룬 덕분입니다. 특히 자체 소프트웨어 엔지니어들의 코딩 작업에 오픈소스 AI 모델인 GLM 5.2를 도입해 폐쇄형 모델 대비 높은 성능과 비용 효율성을 입증하며 시장의 확고한 지지를 얻고 있습니다.

데이터브릭스 기업가치 오픈소스 AI

TechCrunch AI • 18일 전

허깅페이스 CEO, 왜 기업들은 AI 렌탈을 그만두는가

허깅페이스 CEO 클렘 델랑그는 포춘 500대 기업 중 절반이 오픈소스를 사용하며, 기업들이 규모를 키울 때 폐쇄형 API의 높은 비용 때문에 오픈소스로 전환한다고 밝혔다. 그는 소수 빅테크가 AI를 독점할 위험성을 경고하며 오픈소스의 중요성을 강조했다.

허깅페이스 오픈소스 AI 클렘 델랑그

MarkTechPost • 34일 전

도구, 메모리, 권한을 갖춘 에이전트 런타임 설계 방법

이 글은 프레임워크를 블랙박스로 두지 않고, 실용적인 AI 에이전트 시스템의 동작 원리를 처음부터 직접 구현하며 설명하는 튜토리얼입니다. 도구 사용(Tool use), 메모리(Memory), 권한(Permissions), 멀티 에이전트 조율 등 에이전트 개발에 필수적인 핵심 빌딩 블록들을 다룹니다. 별도의 복잡한 인프라나 API 키 없이도 실험해 볼 수 있도록 실행 가능한 코드 위주로 구성되어 있다는 점이 특징입니다.

에이전트 런타임 AI 메모리 멀티 에이전트

TechCrunch AI • 45일 전

앤스로픽 AI 접근 중단에 인도 '기술 자립' 논쟁 들끓어

미국 정부 지시에 따라 앤스로픽이 외국인 대상 최신 AI 모델 접근을 전면 중단하자, 인도 IT 업계가 큰 충격에 휩싸였습니다. 이 사건은 글로벌 AI 생태계가 미국의 통제권과 지정학적 리스크에 얼마나 취약한지 보여주며, 인도 정책 입안자들과 창업자들이 자체적인 '주권 AI(Sovereign AI)' 및 오픈소스 기술 확보로 전환해야 한다고 주장하는 결정적 계기가 되었습니다.

앤스로픽 인도 AI 시장 주권 AI

Hacker News • 46일 전

오픈소스 AI가 반드시 승리해야 하는 이유

AI가 소수의 폐쇄적 기관 독점물이 되면 대중은 소프트웨어 자유뿐만 아니라 운영적 자유까지 상실하게 됩니다. AI는 현대 문명의 핵심 인프라이므로, 허가 없이 연구, 구축, 배포 및 감사할 수 있는 오픈소스 AI의 확보는 생존적 중요성을 가집니다. 따라서 글로벌 공개 표준을 바탕으로 AI 인프라를 자유롭게 다룰 수 있는 국가적 역량을 갖춰야 합니다.

오픈소스 AI AI 독점 디지털 주권

Hacker News • 48일 전

디퓨전 모델 대형 언어 모델 (LLM) 오픈소스 AI

디퓨전 젬마: 기존 대비 4배 빠른 텍스트 생성

구글이 텍스트를 병렬로 동시 생성하는 오픈소스 모델 'DiffusionGemma(디퓨전 젬마)'를 공개했습니다. 기존의 순차적 토큰 생성 방식을 탈피하여 단일 GPU에서 초당 1,000개 이상의 토큰을 생성하며, 고성능 소비자용 GPU에서도 원활하게 구동되는 것이 특징입니다. 양방향 어텐션(Bi-directional attention) 메커니즘을 통해 자가 교정 및 코드 삽입과 같은 비선형 텍스트 작업에 강점을 발휘하여 실시간 AI 애플리케이션 개발에 중요한 역할을 할 전망입니다.

Hacker News • 56일 전

토론토 대학 연구진, 모든 온라인 기기를 노릴 수 있는 AI 웜 공개

토론토 대학교 연구진이 공개된 무료 AI 모델을 악용해 감염된 기기의 취약점을 스스로 학습하고 공격 전략을 수정하며 확산하는 '자가 적응형 AI 웜'을 시연했습니다. 이 악성코드는 네트워크를 장악해 사실상 무료로 정교한 해킹 공격을 감행할 수 있으며, 현재 사이버 보안 체계로는 이를 방어할 적절한 대비가 부족한 상태입니다. 연구진은 악의적인 해커들보다 먼저 위협을 파악하고 방어책을 개발하기 위해 외부와 단절된 안전한 환경에서 연구를 수행한 뒤 관계 기관과 공유하며 공개했습니다.

AI 보안 멀웨어 사이버 공격

MarkTechPost • 57일 전

제트브레인, Mellum2 코드 모델 오픈소스 공개

제트브레인이 AI 개발 워크플로우 최적화를 위해 120억(12B) 매개변수의 MoE 아키텍처 기반 'Mellum2' 모델을 아파치 2.0(Apache 2.0) 라이선스로 공개했습니다. 이 모델은 10.6조 개의 토큰으로 학습되어 복잡한 멀티 모델 파이프라인 내에서도 빠르고 특화된 작업 처리에 강점을 지닙니다. 이는 실무자들이 자체 개발 환경에 고품질 코딩 AI를 자유롭게 통합할 수 있다는 점에서 중요한 의미를 갖습니다.

제트브레인 Mellum2 오픈소스 AI

The Decoder • 57일 전

엔비디아, 세계 모델 및 휴머노이드 로봇 공개

엔비디아가 GTC 타이베이에서 새로운 세계 모델 'Cosmos 3', 자율주행 모델 'Alpamayo 2 Super', 그리고 휴머노이드 로봇 공개 플랫폼을 발표하며 물리적 AI 분야에 대대적인 투자를 단행했습니다. 이번 발표는 로봇 공학, 자율주행, 비디오 분석 시스템 개발자들이 합성 데이터를 생성하고 시뮬레이션을 고도화할 수 있는 강력한 인프라를 제공한다는 점에서 업계 실무자들에게 매우 중요한 의미를 갖습니다. 모든 모델과 프레임워크는 오픈소스 라이선스로 제공되어 관련 산업의 기술 발전 속도를 크게 앞당길 것으로 기대됩니다.

엔비디아 세계 모델 자율주행

Hacker News • 70일 전

클라우드플레어, 오픈소스 AI 모델 '플럭스' 공개

클라우드플레어가 블랙 포레스트 랩스(Black Forest Labs)와 협력하여 오픈소스 기반의 텍스트-투-이미지(T2I) 생성 AI 모델인 '플럭스(Flux)'를 자사 워커스 AI(Workers AI) 플랫폼에 추가했습니다. 이를 통해 개발자들은 별도의 복잡한 설정 없이도 API를 통해 고품질 이미지 생성 기능을 자체 애플리케이션에 빠르고 쉽게 통합할 수 있게 되었습니다. 이번 조치는 개발자 친화적인 에지(edge) 컴퓨팅 환경에 강력한 이미지 생성 도구를 제공하여, 향후 관련 AI 애플리케이션 개발과 대중화를 크게 가속화할 것으로 기대됩니다.

이미지 생성 클라우드플레어 오픈소스 AI

Hacker News • 71일 전

최근 6개월 LLM 생태계 핵심 요약

2025년 11월은 코딩 에이전트가 실용적인 수준으로 급부상하며 LLM 생태계의 결정적인 전환점이 된 시기였습니다. 이 기간 동안 주요 빅테크 기업 간의 최고 성능 모델 경쟁이 치열했으며, 개발자들은 이를 활용해 '바이브 코딩(Vibe coding)'과 같은 혁신적인 실험을 주도했습니다. 특히 '오픈클로(OpenClaw)'라는 이름의 개인형 AI 어시스턴트 프로젝트가 등장하며 로컬 환경에서 AI를 구동하는 새로운 개발자 문화를 탄생시켰습니다.

LLM 동향 코딩 에이전트 오픈소스 AI

Hacker News • 73일 전

DeepSeek-V4-Flash 스티어링(Steering) 로컬 LLM

DeepSeek-V4-Flash: LLM 스티어링(조종)이 다시 흥미로워진 이유

오픈소스 로컬 모델인 DeepSeek-V4-Flash의 등장으로, 모델의 내부 상태를 직접 제어하여 출력을 유도하는 '스티어링(Steering)' 기술이 실용화 단계에 접어들었습니다. 개발자 antirez가 이 모델 기반으로 스티어링을 내장한 'DwarfStar 4' 프로젝트를 발표하며, 프롬프트 엔지니어링에 의존하지 않고 모델의 뇌를 직접 제어하는 방식에 대한 기대감이 높아지고 있습니다.

MarkTechPost • 79일 전

농 리서치 자가 개선 에이전트, 오픈루터 1위 탈환

농 리서치의 오픈소스 자가 개선 에이전트인 '헤르메스 에이전트(Hermes Agent)'가 2026년 5월 10일 기준 오픈루터(OpenRouter) 일일 토큰 랭킹에서 1위를 차지했습니다. 이 에이전트는 오픈AI가 후원하는 플랫폼인 오픈클로(OpenClaw)를 제치며 하루 2,240억 개의 토큰을 생성하는 실제 추론 볼륨을 기록했습니다. 출시 3개월 만에 오픈소스 프로젝트가 빅테크 후원 플랫폼을 실사용량에서 압도한 것은 오픈소스 AI 생태계의 새로운 이정표를 세운 것으로 평가됩니다.

에이전트 농 리서치 오픈루터

MarkTechPost • 83일 전

소규모 언어 모델(SLM) MoE (Mixture of Experts) AMD AI 하드웨어

자이프라, AMD 하드웨어 학습 MoE 'ZAYA1-8B' 공개

자이프라(Zyphra)는 활성 파라미터 7억 6천만 개(760M)만 사용하는 경량 추론 MoE(Mixture of Experts) 모델인 ZAYA1-8B를 공개했습니다. 이 모델은 새로운 마르코프 RSA 테스트 타임 컴퓨팅 기법을 적용하여 수학 및 코딩 벤치마크에서 자신보다 훨씬 거대한 모델들을 뛰어넘는 성능을 입증했습니다. 엔드투엔드 AMD 인스팅트 MI300 하드웨어로 학습되었으며 아파치 2.0(Apache 2.0) 라이선스로 배포되어, 소규모 언어 모델 분야의 지능 밀도(Intelligence density) 새로운 기준을 제시했습니다.

r/LocalLLaMA • 86일 전

Llama.cpp 추론 속도 최적화 MTP(다중 토큰 예측)

Llama.cpp, MTP(다중 토큰 예측) 베타 지원 공개

로컬 AI 추론 엔진인 Llama.cpp에 여러 개의 토큰을 동시에 예측하여 처리 속도를 비약적으로 높이는 MTP(다중 토큰 예측) 기능이 베타로 추가되었습니다. 개발자는 기존 GGUF 모델 파일 하나만으로 MTP 모델을 자동으로 불러와 별도의 추가 배포 없이도 추론 속도를 2배 이상 크게 향상시킬 수 있습니다. 이는 로컬 환경에서 구동되는 오픈소스 대형 언어 모델(LLM)의 실질적인 응답 성능을 개선하는 중요한 이정표입니다.

MIT Tech Review • 89일 전

LLM 해석 가능성 오픈소스 AI 콘텐츠 필터링

기독교인 전용 통신망과 LLM 디버깅 기술

미국 내 기독교인들을 타겟으로 한 음란물 및 젠더 관련 콘텐츠 차단 통신망이 새롭게 론칭합니다. AI 스타트업 Goodfire는 LLM 내부를 들여다보고 파라미터를 조정해 원치 않는 출력을 수정할 수 있는 해석 도구를 공개했습니다. 또한 중국 AI 기업들의 오픈소스 전략이 개발자들의 지지를 얻으며 실리콘밸리의 독주를 깨고 다극화된 AI 생태계를 만들고 있습니다.

MIT Tech Review • 93일 전

딥시크(DeepSeek) 월드 모델(World Models) 오픈소스 AI

딥시크 V4의 돌풍과 월드 모델 경쟁

중국 AI 기업 딥시크(DeepSeek)가 오픈소스임에도 폐쇄형 최고 수준 모델들과 맞먹는 성능을 보이는 'V4' 프리뷰를 공개했습니다. 특히 화웨이 스캐리칩(Ascend)에 최적화된 첫 모델이라는 점에서 업계에 큰 파장이 예상됩니다. 또한 기존 LLM의 한계를 극복하고 로봇 공학 등 물리적 세계를 이해하기 위한 '월드 모델(World Model)' 연구가 AI 생태계의 새로운 핵심 과제로 떠오르고 있습니다.

r/LocalLLaMA • 94일 전

오픈소스 모델 Qwen 미세조정(Fine-tuning)

Qwen3.6 35B 'Heretic' 모델, 압도적 성능 화제

오픈소스 AI 커뮤니티(레딧)에서 'Qwen3.6 35B A3B Heretic'라는 이름의 비공식 파인튜닝(미세조정) 모델이 공개되어 화제입니다. 특히 데이터셋 유사도를 나타내는 지표인 KLD(쿨백-라이블러 발산) 값이 0.0015로 극도로 낮아 원본 모델의 성능을 매우 충실히 보존하면서도 특정 분야에서 강력한 성능을 발휘하는 것으로 평가받고 있습니다. 공유된 코드를 보면 이 모델은 복잡한 채팅 템플릿과 이미지·비디오 처리, 함수 호출(Function Calling) 기능을 완벽하게 지원하도록 고도화된 것으로 확인됩니다.

TechCrunch AI • 95일 전

DeepSeek 오픈소스 AI 대규모 언어 모델

딥시크, 최신 AI 모델 V4 공개…

중국의 AI 연구소 딥시크(DeepSeek)가 최신 대규모 언어 모델인 DeepSeek V4(Flash 및 Pro)의 프리뷰 버전을 공개했습니다. 이번 모델은 최대 1.6조 개의 파라미터를 갖춘 오픈웨이트 모델로서, 미스트럭스(Mixture-of-experts) 방식을 채택해 추론 비용을 절감하면서도 추론 및 코딩 벤치마크에서 최고 수준의 폐쇄형 모델들과 거의 차이를 좁혔습니다. 특히 기존 최고 성능 모델들과 비교해 압도적으로 저렴한 API 사용 비용을 제공하며 시장의 경쟁력을 확보하고 있습니다.

MIT Tech Review • 98일 전

지금 AI 분야에서 주목해야 할 10가지 핵심 트렌드

AI 분야의 복잡한 변화 속에서 우리가 반드시 주목해야 할 10가지 핵심 주제를 선정했습니다. 휴머노이드 로봇 학습 데이터 수집, LLM의 진화, AI 기반 사기 및 딥페이크의 무기화 같은 보안 위협부터 중국의 오픈소스 공세, AI 과학자의 등장, 그리고 거센 반발 여론까지 다양한 주제를 다룹니다.

AI 트렌드 휴머노이드 로봇 AI 에이전트

The Decoder • 101일 전

차트 복잡해지면 최고 AI 모델도 성능 절반 하락

중국 연구진이 실제 데이터 기반의 복잡한 시각화를 테스트하는 새로운 벤치마크 'RealChart2Code'를 발표했습니다. 기존 단순한 차트에서 뛰어난 성능을 보이던 최고 수준의 상용 AI 모델들조차 복잡한 시각화 작업에서는 성능이 절반 가까이 급락하는 '복잡성 갭(Complexity gap)' 현상이 확인되었습니다. 이는 복잡한 실무 환경에서 현재 AI 모델의 시각적 데이터 처리 및 코드 생성 능력이 아직 큰 한계를 보이고 있음을 시사합니다.

벤치마크 데이터 시각화 AI 코딩

r/singularity • 105일 전

양자 컴퓨팅 엔비디아(NVIDIA) 오픈소스 AI

엔비디아, 실용적 양자 컴퓨터 가속 위한 최초 오픈 AI 모델 '아이징' 공개

엔비디아가 실용적인 양자 컴퓨터 개발을 가속화하기 위해 세계 최초의 오픈 AI 모델인 '아이징(Ising)'을 발표했습니다. 이 모델을 통해 연구진과 기업은 양자 프로세서 교정(Calibration) 및 양자 오류 정정 디코딩 기능을 갖춘 확장 가능한 고성능 양자 시스템을 구축할 수 있습니다. 결과적으로 AI 기반 워크플로우를 활용해 난관인 양자 오류 문제를 효과적으로 해결하고 양자 컴퓨팅의 상용화를 앞당길 수 있게 되었다는 점에서 매우 중요합니다.

MarkTechPost • 111일 전