메뉴

#허깅페이스

LL
r/LocalLLaMA 10일 전
IMP 6

허깅페이스 벤치마크, 모델 크기 필터링 기능 추가

허깅페이스(HuggingFace)의 벤치마크 데이터셋 페이지에 모델 크기 기준 필터링 기능이 새롭게 추가되었습니다. 이제 개발자들은 특정 파라미터 크기(예: 32B 이하)를 가진 모델들 중 특정 벤치마크에서 가장 뛰어난 성능을 보이는 모델을 직관적으로 찾아낼 수 있습니다. 자원 대비 최적의 성능을 내는 모델을 탐색하는 실무자들에게 매우 유용한 업데이트입니다.

허깅페이스 벤치마크 모델 평가
LL
r/LocalLLaMA 17일 전
IMP 7

드라마박스: LTX 2.3 기반 역대 가장 풍부한 감정 표현 TTS

Resemble AI가 LTX 2.3을 기반으로 감정 표현이 지금까지 중 가장 뛰어난 음성 합성(TTS) 모델인 '드라마박스(DramaBox)'를 공개했습니다. 해당 모델은 깃허브(GitHub)와 허깅페이스(Hugging Face)에 오픈소스 및 데모 형태로 배포되어 개발자들이 즉시 테스트하고 활용할 수 있습니다.

음성 합성(TTS) 오픈소스 드라마박스
LL
r/LocalLLaMA 28일 전
IMP 6

허깅페이스 모델 구조 시각화 도구 제작기

허깅페이스(Hugging Face) 모델의 아키텍처를 시각적으로 탐색할 수 있는 웹 도구인 'hfviewer.com'이 공개되었습니다. 해당 도구에 모델 URL을 입력하면 인터랙티브한 구조도를 통해 복잡한 모델을 쉽게 이해하고, 여러 모델을 직관적으로 비교할 수 있어 AI 실무자들에게 유용하게 활용될 것으로 보입니다.

허깅페이스 모델-아키텍처 시각화-도구
LL
r/LocalLLaMA 31일 전
IMP 7

허깅페이스에 미스트랄 3.5 공개

프랑스 AI 스타트업 미스트랄(Mistral AI)의 최신 대규모 언어 모델(LLM)인 '미스트랄 미디움 3.5(Mistral Medium 3.5)'의 시스템 프롬프트와 구동 방식이 허깅페이스(Hugging Face)를 통해 공개되었습니다. 이 모델은 자체적인 웹 검색 기능은 없지만 도구(Tools)를 활용한 실시간 정보 검색과 추론(Reasoning) 기능을 수행할 수 있도록 설계되었습니다. 특히 자체 챗봇 '르 챗(Le Chat)'의 기반 모델로 활용되며, 날짜 계산 및 멀티모달(이미지 읽기) 처리 능력을 갖춘 점이 주요 특징입니다.

미스트랄 언어모델 오픈소스
SG
r/singularity 37일 전
IMP 9

딥시크, 신규 오픈소스 모델 'DeepSeek V4 Pro' 출시

중국의 AI 기업 딥시크(DeepSeek)가 자사의 최신 대규모 언어 모델인 'DeepSeek V4 Pro'를 허깅페이스(Hugging Face)에 공개했습니다. 이 모델은 MIT 라이선스를 채택한 오픈소스 프로젝트로, MMLU-Pro 벤치마크에서 1위를 차지하는 등 수학, 코딩, 추론 능력에서 최고 수준의 성능을 입증했습니다. 특히 8-bit 및 FP8 양자화를 지원하여 메모리 효율성을 높인 것이 특징이며, 상용 및 연구 목적으로의 활용이 기대됩니다.

딥시크 오픈소스 대규모 언어 모델
LL
r/LocalLLaMA 39일 전
IMP 7

IBM 그라나이트 4.1 8B 모델 Hugging Face 공개

IBM이 오픈소스 AI 생태계인 Hugging Face에 '그라나이트 4.1(Granite 4.1) 8B' 모델의 설정 정보를 공개했습니다. 공개된 데이터에는 외부 도구(Tools) 호출 및 문서(Document) 기반 검색(RAG)을 지원하는 정교한 시스템 프롬프트와 Jinja 템플릿이 포함되어 있습니다. 이는 오픈소스 모델이 단순 텍스트 생성을 넘어 기업의 실무 시스템과 안전하게 연동하는 에이전트(Agent) 역할을 수행할 수 있음을 보여주는 중요한 의미를 갖습니다.

IBM 오픈소스 모델 에이전트
LL
r/LocalLLaMA 44일 전
IMP 6

알리바바 '큐웬 3.6-35B-A3B' 모델 공개

알리바바가 오픈소스 AI 커뮤니티에 350억 매개변수(35B) 규모의 새로운 언어 모델인 Qwen3.6-35B-A3B를 공개했습니다. 이 모델은 소스코드와 AI 허깅페이스(Hugging Face)를 통해 다운로드 및 활용이 가능합니다. 실무자들에게는 고성능 오픈소스 대안을 모색하거나 파인튜닝 기반으로 활용할 수 있는 중요한 기회가 될 것으로 보입니다.

알리바바 큐웬 오픈소스 모델
LL
r/LocalLLaMA 50일 전
IMP 4

GLM 소형 모델 출시 계획 없는 듯

AI 커뮤니티에서 GLM-5.1의 소형 모델 출시에 대한 논의가 이루어지고 있으나, 당분간 관련 계획이 없는 것으로 보입니다. 개발자는 에어(Air) 모델과 관련된 허깅페이스(Hugging Face) 토론창을 계속 열어두어 사용자들의 의견을 수렴하고 있습니다. 경량화된 소형 모델을 필요로 하는 실무자들은 관련 동향을 계속 주시할 필요가 있습니다.

GLM 오픈소스 소형 모델