#모니터링

클로드 다수 모델 오류 발생 및 복구

AI 개발사 앤스로픽(Anthropic)의 클로드(Claude) 서비스 전반에 일시적인 오류가 발생하여 웹사이트와 API 등에 장애가 생겼습니다. 엔지니어링 팀의 조치로 문제를 식별하고 임시 조치를 적용했으며, 현재 시스템 정상화를 모니터링하는 단계입니다. 클로드 API나 Claude Code를 활용하는 개발자 및 기업 실무자들은 서비스 지연이나 응답 오류에 대비해야 합니다.

장애 API Claude

TechCrunch AI • 56일 전

IMP 8

AI 에이전트 감시 수요 예상… Coralogix, 2억 달러 유치

소프트웨어 관측 가능성(Observability) 스타트업 Coralogix가 자율적으로 작동하는 AI 에이전트의 등장에 대비하여 2억 달러(약 2,700억 원)를 유치했습니다. 이번 펀딩은 기업들이 AI 시스템을 본격 도입하면서 이를 모니터링하고 오류를 해결할 차세대 인프라의 필요성이 커졌음을 시사합니다. 이 회사는 AI 기반 도구를 활용해 장애를 진단하는 비중을 늘리며 빠른 매출 성장을 기록하고 있습니다.

펀딩 AI 에이전트 인프라

r/LocalLLaMA • 90일 전

IMP 4

"로컬 LLM, 대체 어디에 쓰나요?" 저: 정말 많이 씁니다

한 개발자가 자체 호스팅하는 로컬 LLM 환경의 토큰 사용량을 모니터링하는 모습을 공유했습니다. LiteLLM, Prometheus, Grafana 등의 오픈소스 스택을 연동하여 Frigate GenAI 요약 기능의 API 사용량을 추적한 결과, 단 6시간 만에 토큰 사용량이 예상보다 훨씬 빠르게 누적되는 것을 확인했습니다. 이는 개인이 구축한 온프레미스 AI 환경에서도 체계적인 비용 및 리소스 모니터링이 필수적임을 보여줍니다.

로컬 LLM 모니터링 오픈소스