메뉴
HN
Hacker News 20일 전

클로드 코드 활용 학술 연구 자동화 스킬

IMP
7/10
핵심 요약

클로드 코드(Claude Code)를 위한 학술 연구 지원 플러그인이 공개되었습니다. 이 도구는 논문 작성을 대신하는 것이 아니라 문헌 검색, 인용 및 데이터 검증 등 단순 반복 작업을 자동화하여 연구자가 핵심적인 연구와 논리 전개에만 집중할 수 있도록 돕습니다. 철저한 휴먼-인-더-루프(Human-in-the-loop) 구조를 채택해 AI가 완전 자동화할 때 발생하는 환각이나 오류를 방지하는 것이 특징입니다.

번역된 본문

학술 연구를 위한 클로드 코드(Claude Code) 스킬: 번체중국어판 포함 연구부터 출판까지 학술 연구의 전 과정을 아우르는 종합적인 클로드 코드 스킬 모음입니다.

30초 만에 설치하세요 (클로드 코드 CLI / VS Code / JetBrains, v3.7.0 이상): /plugin marketplace add Imbad0202/academic-research-skills /plugin install academic-research-skills

그런 다음 /ars-plan을 실행하여 소크라테스 문답법을 통해 논문 구조를 살펴보거나, 빠른 설치(Quick install)로 이동하여 필수 구성 요소 및 전통적인 심볼릭 링크 흐름을 확인해 보세요.

AI는 보조 부조종사(copilot)이지, 주 조종사(pilot)가 아닙니다. 이 도구는 논문을 대신 써주지 않습니다. 대신 참고문헌 찾기, 인용 서식 맞추기, 데이터 검증, 논리적 일관성 확인과 같은 단순 반복적인 grunt work(잡일)를 처리해 줍니다. 그 결과 여러분은 진짜 두뇌가 필요한 부분, 즉 연구 질문 정의, 방법론 선택, 데이터 의미 해석, 그리고 "나는 ~라고 주장한다" 뒤에 올 문장을 직접 작성하는 데 집중할 수 있습니다.

이 도구는 이른바 '휴머나이저(humanizer)'처럼 AI를 사용했다는 사실을 숨기는 데 도움을 주지 않습니다. 대신 더 나은 글쓰기를 돕습니다. 스타일 보정(Style Calibration) 기능은 과거 작성한 글을 통해 작성자의 문체를 학습합니다. 글쓰기 품질 검사(Writing Quality Check)는 산문을 기계가 생성한 것처럼 느껴지게 만드는 패턴을 잡아냅니다. 목표는 품질이지, 부정행위가 아닙니다.

완전 자동화가 아닌 휴먼 인더 루프(Human-in-the-loop) 방식인 이유는 무엇일까요? 루(Lu) 등(2026, Nature 651:914-919)은 'The AI Scientist'를 구축했습니다. 이는 최고 수준의 머신러닝 학회인 ICLR 2025 워크숍에서 블라인드 동료 평가를 거쳐 논문을 출판한 최초의 완전 자율 AI 연구 시스템입니다 (워크숍 평균 4.87점과 비교하여 6.33/10점 획득). 이들의 한계점(Limitations) 섹션에는 완전 자율 AI 연구 파이프라인이 상속받는 실패 모드(failure mode)들이 나열되어 있습니다: 구현 버그, 환각된 결과, 지름길 의존성, 버그를 통찰로 재구성하기, 방법론 조작, 프레임 고착(frame-lock), 인용 환각 등. ARS(Academic Research Skills)는 AI의 도움을 받는 인간 연구자가 인간 단독 또는 AI 단독보다 이러한 실패 모드를 더 잘 피할 수 있다는 전제하에 구축되었습니다. Stage 2.5 및 Stage 4.5 무결성 게이트(integrity gates)는 7가지 모드의 차단 체크리스트를 실행하며 (academic-pipeline/references/ai_research_failure_modes.md 참조), 리뷰어는 사용자가 제공한 정답 세트(gold set)를 바탕으로 자체 위음성률(FNR)/위양성률(FPR)을 측정하는 선택적 보정 모드를 제공합니다. v3.3은 PaperOrchestra(Song, Song, Pfister & Yoon, 2026, Google)에서 영감을 받았습니다: Semantic Scholar API 검증, 누출 방지 프로토콜, VLM 그림 검증 및 점수 궤적 추적 기능이 포함됩니다.

아키텍처 및 파이프라인 👉 docs/ARCHITECTURE.md — 전체 파이프라인 보기: 흐름도, 단계별 행렬, 데이터 접근 흐름, 스킬 종속성 그래프, 품질 게이트 및 모드 목록. 이 아키텍처 문서는 이전에 여기에 있던 복잡한 파이프라인 설명을 대체합니다. 각 단계에서 무엇이 실행되는지에 대한 모든 정보가 이제 한 곳에 집중되어 있습니다.

빠른 설치 필수 구성 요소:

  • 클로드 코드 (최신 버전; 플러그인 패키징을 위해서는 최근 버전 필요)
  • ANTHROPIC_API_KEY가 export 되어 있거나, 첫 claude 실행 시 설정되어야 함
  • 선택 사항: DOCX를 위한 Pandoc, APA 7.0 PDF를 위한 tectonic + Source Han Serif TC (Markdown 출력은 둘 다 없어도 작동함)

플러그인 설치 (v3.7.0 이상, 권장): /plugin marketplace add Imbad0202/academic-research-skills /plugin install academic-research-skills

작동 확인: /ars-plan을 실행하고 작업 중인 논문에 대해 설명해 보세요. ARS가 소크라테스 문답을 시작하여 챕터 구조를 구성해 줍니다. 단일 샷 테스트를 원한다면 /ars-lit-review "주제"를 사용해 보세요.

👉 docs/SETUP.md — 전체 가이드: 클로드 코드 설치, API 키 설정, DOCX/PDF를 위한 선택적 Pandoc/tectonic, 교차 모델 검증(ARS_CROSS_MODEL) 및 5가지 설치 방법(플러그인, 프로젝트 스킬, 글로벌 스킬, claude.ai 프로젝트, 리포지토리 복제).

성능 및 비용 👉 docs/PERFORMANCE.md — 모드별 토큰 예산, 전체 파이프라인 예상 비용(약 15,000단어 논문의 경우 ~$4–6), 권장 클로드 코드 설정(권한 건너뛰기; Agent Team은 선택 사항).

가이드 및 기사

  • 학술 글쓰기는 독방 작업이어서는 안 됩니다 — 전체 파이프라인 연습 (영어)
  • 학술寫作不該是一個人的事:一套開源AI寫作工具如何改變研究者的工作流 — 完整使用指南 (번체중국어)

한눈에 보는 주요 기능 심층 연구(Deep Research) — 소크라테스 유도 모드, PRISMA 체계적 문헌 고찰, 의도 감지, 대화 건강 모니터링, 선택적 교차 모델 검증을 갖춘 13개 에이전트 연구 팀.

원문 보기
원문 보기 (영어)
Academic Research Skills for Claude Code 繁體中文版 A comprehensive suite of Claude Code skills for academic research, covering the full pipeline from research to publication. Install in 30 seconds (Claude Code CLI / VS Code / JetBrains, v3.7.0+): /plugin marketplace add Imbad0202/academic-research-skills /plugin install academic-research-skills Then try /ars-plan to walk through your paper structure via Socratic dialogue, or jump to Quick install for prerequisites and the traditional symlink flow. AI is your copilot, not the pilot. This tool won't write your paper for you. It handles the grunt work — hunting down references, formatting citations, verifying data, checking logical consistency — so you can focus on the parts that actually require your brain: defining the question, choosing the method, interpreting what the data means, and writing the sentence after "I argue that." Unlike a humanizer, this tool doesn't help you hide the fact that you used AI. It helps you write better. Style Calibration learns your voice from past work. Writing Quality Check catches the patterns that make prose feel machine-generated. The goal is quality, not cheating. Why human-in-the-loop, not full automation? Lu et al. (2026, Nature 651:914-919) built The AI Scientist — the first fully autonomous AI research system to publish a paper through blind peer review at a top-tier ML venue (ICLR 2025 workshop, score 6.33/10 vs workshop average 4.87). Their Limitations section enumerates the failure modes that any fully-autonomous AI research pipeline inherits: implementation bugs, hallucinated results, shortcut reliance, bug-as-insight reframing, methodology fabrication, frame-lock, citation hallucinations. ARS is built on the premise that a human researcher augmented by AI avoids these failure modes better than either alone . Stage 2.5 and Stage 4.5 integrity gates run a 7-mode blocking checklist (see academic-pipeline/references/ai_research_failure_modes.md ); the reviewer offers an opt-in calibration mode that measures its own FNR/FPR against a user-supplied gold set. v3.3 was inspired by PaperOrchestra (Song, Song, Pfister & Yoon, 2026, Google): Semantic Scholar API verification, anti-leakage protocol, VLM figure verification, and score trajectory tracking. Architecture & pipeline 👉 docs/ARCHITECTURE.md — the full pipeline view: flow diagram, stage-by-stage matrix, data-access flow, skill dependency graph, quality gates, and mode list. The architecture doc supersedes the sprawling pipeline description that used to live here. Everything about what runs in which stage now lives in one place. Quick install Prerequisites Claude Code (latest; plugin packaging requires recent versions) ANTHROPIC_API_KEY exported, or set on first claude run Optional: Pandoc for DOCX, tectonic + Source Han Serif TC for APA 7.0 PDF (Markdown output works without either) Plugin install (v3.7.0+, recommended): /plugin marketplace add Imbad0202/academic-research-skills /plugin install academic-research-skills Verify it works: run /ars-plan and describe a paper you're working on — ARS will start a Socratic dialogue to map out chapter structure. For a single-shot test instead, try /ars-lit-review "your topic" . 👉 docs/SETUP.md — full guide: install Claude Code, set up API keys, optional Pandoc/tectonic for DOCX/PDF, cross-model verification ( ARS_CROSS_MODEL ), and five installation methods (Plugin, project skills, global skills, claude.ai Project, repo-cloned). Performance & cost 👉 docs/PERFORMANCE.md — per-mode token budgets, full-pipeline estimate (~$4–6 for a 15k-word paper), and recommended Claude Code settings (Skip Permissions; Agent Team optional). Guides & articles Academic Writing Shouldn't Be a Solo Act — full pipeline walkthrough (English) 學術寫作不該是一個人的事:一套開源 AI 協作工具如何改變研究者的工作流 — 完整使用指南(繁體中文) Features at a glance Deep Research — 13-agent research team with Socratic guided mode, PRISMA systematic review, intent detection, dialogue health monitoring, optional cross-model DA, Semantic Scholar API verification. Academic Paper — 12-agent paper writing with Style Calibration, Writing Quality Check, LaTeX hardening, visualization, revision coaching, citation conversion, anti-leakage protocol, and VLM figure verification. Academic Paper Reviewer — 7-agent multi-perspective peer review with 0–100 quality rubrics (EIC + 3 dynamic reviewers + Devil's Advocate), concession threshold protocol, attack intensity preservation, optional cross-model DA critique / calibration, R&R traceability matrix, read-only constraint. Academic Pipeline — 10-stage pipeline orchestrator with adaptive checkpoints, claim verification, Material Passport, optional repro_lock , optional cross-model integrity verification, mid-conversation reinforcement, and score trajectory tracking. Data Access Level Metadata (v3.3.2+) — every skill declares data_access_level ( raw / redacted / verified_only ); enforced by scripts/check_data_access_level.py . Pattern adapted from Anthropic's automated-w2s-researcher (2026). See shared/ground_truth_isolation_pattern.md . Task Type Annotation (v3.3.2+) — every skill declares task_type ( open-ended or outcome-gradable ). All current ARS skills are open-ended . Benchmark Report Schema (v3.3.5+) — JSON Schema + lint for honest benchmark comparisons. See shared/benchmark_report_pattern.md . Artifact Reproducibility Lockfile (v3.3.5+) — optional repro_lock sub-block on Material Passport. Configuration documentation, not replay guarantee — LLM outputs are not byte-reproducible. See shared/artifact_reproducibility_pattern.md . Showcase: real pipeline output See the complete artifacts from a real 10-stage pipeline run — peer review reports, integrity verification reports, and the final paper: Browse all pipeline artifacts → Artifact Description Final Paper (EN) APA 7.0 formatted, LaTeX-compiled Final Paper (ZH) Chinese version, APA 7.0 Integrity Report — Pre-Review Stage 2.5: caught 15 fabricated refs + 3 statistical errors Integrity Report — Final Stage 4.5: zero regressions confirmed Peer Review Round 1 EIC + 3 Reviewers + Devil's Advocate Re-Review Verification after revisions Peer Review Round 2 Follow-up review Response to Reviewers Point-by-point author response Post-Publication Audit Report Independent full-reference audit: found 21/68 issues missed by 3 rounds of integrity checks Companion: Experiment Agent If your research involves running experiments (code or human studies) before writing, the Experiment Agent skill fills the gap between ARS Stage 1 (RESEARCH) and Stage 2 (WRITE). ARS Stage 1 RESEARCH → RQ Brief + Methodology Blueprint ↓ experiment-agent → run/manage experiments → validate results ↓ ARS Stage 2 WRITE → write paper with verified experiment results What it does : executes code experiments (Python, R, etc.) with real-time monitoring, manages human study protocols with IRB ethics checklist, interprets statistics with 11-type fallacy detection, and verifies reproducibility. How to use together : pause the ARS pipeline after Stage 1, run experiments in a separate experiment-agent session, then bring the results (with Material Passport) back to ARS Stage 2. ARS requires zero modification. See the experiment-agent README for setup instructions. Usage Quick Start # Start a full research pipeline You: "I want to write a research paper on AI's impact on higher education QA" # Start with Socratic guidance You: "Guide my research on AI in educational evaluation" # Write a paper with guided planning You: "Guide me through writing a paper on demographic decline" # Review an existing paper You: "Review this paper" (then provide the paper) # Check pipeline status You: "status" Individual Skills Deep Research (7 modes) "Research the impact of AI on higher education" → full mode "Give me a quick brief on X" → quick mode "Do a systematic review on X with PRISMA" → systematic-review mode "Guide my research on X" → socratic mode (guided) "Fact-check these claims" → fact-check mode "Do a literature r