메뉴

#프롬프트-엔지니어링

HN
Hacker News 5일 전
IMP 7

프롬프트 예의가 LLM 정확도에 미치는 영향

최근 연구에 따르면, AI 모델에게 무례하고 공격적인 프롬프트를 입력할 때 오히려 정중한 프롬프트보다 정확도가 높게 나타납니다. 50개의 객관식 질문을 '매우 정중함'부터 '매무 무례함'까지 다섯 가지 어조로 변형하여 ChatGPT-4o에 테스트한 결과, 무례한 프롬프트의 정확도(84.8%)가 정중한 프롬프트(80.8%)를 상회했습니다. 이는 인간 사회의 통념과 반대되는 결과로, 최신 LLM의 튜닝 과정이나 RLHF(인간 피드백 기반 강화학습)가 모델의 톤 반응 방식을 변화시켰을 가능성을 시사합니다.

프롬프트-엔지니어링 llm-성능 인간-ai-상호작용
HN
Hacker News 32일 전
IMP 8

좋은 AGENTS.md는 모델 업그레이드, 나쁜 건 독

AI 코딩 에이전트의 성능을 좌우하는 'AGENTS.md' 파일의 효과를 체계적으로 분석한 실험 결과입니다. 잘못 작성된 문서는 오히려 작업 완성도를 최대 30% 떨어뜨릴 수 있지만, 점진적 정보 공개나 순차적 워크플로우 등 핵심 패턴을 적용하면 모델을 상위 버전으로 업그레이드한 것과 같은 성능 향상을 얻을 수 있습니다.

에이전트 코딩-에이전트 AGENTS.md
LL
r/LocalLLaMA 44일 전
IMP 5

Qwen3.6, 사고 과정(CoT) 내에서 컨텍스트 유지

새로운 AI 모델인 Qwen3.6이 추론 과정에서 설정된 정보를 기억하는 능력을 보여주고 있습니다. 사용자는 여러 차례 테스트를 통해 모델이 지정된 숫자를 실제 추론 단계에서 안정적으로 기억해냄을 확인했습니다. 다만 이 기능이 정상적으로 작동하려면 특정 플래그(`preserve_thinking: true`)를 설정해야 하는 중요한 조건이 있습니다.

qwen 추론-모델 프롬프트-엔지니어링
GB
Google AI Blog 46일 전
IMP 7

크롬, 우수한 AI 프롬프트를 원클릭 도구로 변환하는 기능 출시

구글 크롬에 사용자가 자주 쓰는 AI 프롬프트를 저장해두고 언제든 한 번의 클릭으로 재사용할 수 있는 '스킬(Skills)' 기능이 도입되었습니다. 이 기능은 여러 탭을 넘나들며 반복 작업을 수행해야 하는 번거로움을 없애고 업무 흐름을 간소화해줍니다. 또한 직접 프롬프트를 만들거나 라이브러리에서 기존 스킬을 가져와 커스텀할 수 있어 AI 활용 생산성을 크게 높일 수 있습니다.

크롬 gemini 생산성
LL
r/LocalLLaMA 49일 전
IMP 6

미니맥스(MiniMax) M2.7 모델 공개

미니맥스(MiniMax)에서 새로운 AI 모델인 M2.7을 공개했습니다. 이 템플릿 코드는 해당 모델의 시스템 메시지 처리와 도구(Tool) 호출을 위한 프롬프트 렌더링 방식을 보여줍니다. 모델이 사용자의 요청을 분석하고 사고(Reasoning) 과정을 거쳐 도구를 사용하는 일련의 논리적 구조를 담고 있습니다.

미니맥스 MiniMax-M2.7 프롬프트-엔지니어링