論文の概要: PaperClaw: Harnessing Agents for Autonomous Research and Human-in-the-Loop Refinement
- arxiv url: http://arxiv.org/abs/2606.22610v1
- Date: Sun, 21 Jun 2026 17:37:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:25:00.886666
- Title: PaperClaw: Harnessing Agents for Autonomous Research and Human-in-the-Loop Refinement
- Title(参考訳): PaperClaw: 自律的な研究と人身保護のためのハーネスティングエージェント
- Authors: Weiwei Ye, Hangchen Liu, Dongyuan Li, Renhe Jiang,
- Abstract要約: PAPERCLAWは、研究分野から完成した論文まで、プロジェクトを自律的に行うマルチエージェントシステムである。
フルライフサイクルメモリは、各ステージを単一のリビングレコードに保持するので、長い実行は、コンテキストを失うことなく停止、検査、再開することができる。
- 参考スコア(独自算出の注目度): 22.280674906144622
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models have become capable reasoners and tool users that write and run code and search the literature, which makes automating the research process itself a realistic goal. We present PAPERCLAW, a harnessed multi-agent system that carries a project autonomously, from a field of study to a finished paper. PAPERCLAW curates a domain from a field's live literature, datasets, and code; brainstorms it into an idea with a pre-registered main-result contract; and drives a stoppable hypothesis map through an iterative propose, test, reflect loop that grows only from measured verdicts and halts once the evidence supports the idea, at which point it writes a venue-compliant paper. A full-lifecycle memory keeps each stage in a single living record, so a long run can be paused, inspected, and resumed without losing context. At the centre is an in-cycle research assistant with research tools and skills: it can drive the whole pipeline on its own, while the same interface lets a person step in at any stage, turning a first autonomous draft into a stronger paper through human-in-the-loop refinement. Throughout, PAPERCLAW keeps its output grounded and checkable, citing only references validated against open scholarly indexes and reporting results that genuinely ran. An evaluation with an LLM judge finds that PAPERCLAW produces strong papers both fully autonomously and with human-in-the-loop refinement.
- Abstract(参考訳): 大規模な言語モデルは、コードを書き、実行し、文献を検索する有能な推論者やツールユーザーとなり、研究プロセスの自動化自体が現実的な目標となっている。
本稿では,研究分野から完成論文まで,プロジェクトを自律的に行うマルチエージェントシステムであるPAPERCLAWについて述べる。
PAPERCLAWは、フィールドの生の文献、データセット、コードからドメインをキュレートし、事前に登録されたメインリサート契約でアイデアにブレインストーミングし、反復的な提案、テスト、リフレクションループを通じて停止可能な仮説マップを駆動する。
フルライフサイクルメモリは、各ステージを単一のリビングレコードに保持するので、長い実行は、コンテキストを失うことなく停止、検査、再開することができる。
中央には、研究ツールとスキルを備えたサイクル内研究アシスタントがあり、パイプライン全体を自分で動かすことができる。
PAPERCLAWは、オープンな学術指標に対して検証された参照と、真に実行された報告結果のみを引用して、アウトプットを根拠として、チェック可能な状態を維持している。
LLM判事による評価では、PAPERCLAWは完全に自律的で、かつ、ループ内の人間による洗練された紙を作成できる。
関連論文リスト
- ResearchLoop: An Evidence-Gated Control Plane for AI-Assisted Research [4.9833735627186435]
ResearchLoopはAI支援型計算研究のためのエビデンス付き制御プレーンである。
ResearchLoopは、リサーチ質問、タスク契約、エビデンスオブジェクト、クレーム台帳、クローズアウト、ペーパーバインディングを耐久性のあるプロジェクトステートとして扱う。
この技術レポートは、完全なプロトコル仕様、状態モデル、トランジションルール、クレーム・アドミッション・アルゴリズム、インサイト・コンポーティングメカニズムを提供する。
論文 参考訳(メタデータ) (2026-05-27T10:29:00Z) - AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration [175.74514061083195]
提案するAutoResearchClawは,5つのメカニズムに基づいて構築されたマルチエージェント自律型研究パイプラインである。
25トピックの実験ステージベンチマークであるARC-Benchでは、AutoResearchClawがAI Scientist v2を54.7%上回っている。
論文 参考訳(メタデータ) (2026-05-19T15:49:51Z) - AI for Auto-Research: Roadmap & User Guide [107.0834449839233]
研究ライフサイクル全体にわたってAIをエンドツーエンドに分析する。
我々は、信頼できる援助と信頼できない自律性の間に、鋭くステージに依存した境界を特定できる。
障害モードを排除するのではなく、より大きな自動化が不明瞭であることが示されています。
論文 参考訳(メタデータ) (2026-05-18T17:08:26Z) - Theory Under Construction: Orchestrating Language Models for Research Software Where the Specification Evolves [1.0312968200748116]
大規模な言語モデルは、実質的なコードと研究テキストを生成することができるが、研究ソフトウェアプロジェクトは、どちらのアーティファクトも必要としない。
我々は,幻覚の蓄積とデシンクロナイゼーションという,LM固有の障害モードを2つ同定する。
本研究では,1つのワークスペース状態の座標として,アイデア,実装,評価,グラウンド,ペーパーライティングを編成する反復的プロンプトであるComet-Hを提案する。
論文 参考訳(メタデータ) (2026-04-29T21:28:17Z) - The Last Human-Written Paper: Agent-Native Research Artifacts [106.47848184955576]
本稿では,物語紙を機械処理可能な研究パッケージに置き換えるプロトコルであるAgent-Native Research Artifact(ARA)を紹介する。
通常の開発において決定と終了をキャプチャするLive Research Manager、レガシPDFとリポジトリをARAに変換するARAコンパイラ、人間レビュアーが重要性、ノベルティ、味にフォーカスできるように客観的チェックを自動化するARAネイティブレビューシステムである。
論文 参考訳(メタデータ) (2026-04-27T16:23:09Z) - Alien Science: Sampling Coherent but Cognitively Unavailable Research Directions from Idea Atoms [53.907293349123506]
大規模な言語モデルは、しばしば、現在のコミュニティにとって一貫性があり、無関心なアイデアを生み出すのに失敗する。
我々は、このギャップを認知的可用性によって形式化し、研究の方向性が典型的な研究者によって自然に提案される可能性について述べる。
我々は、原子の集合が実行可能な方向を構成するかどうかをスコアするコヒーレンスモデルと、その方向が生成される確率をスコアするアベイラビリティモデルという2つの補完モデルを学ぶ。
論文 参考訳(メタデータ) (2026-03-01T13:05:19Z) - WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research [73.58638285105971]
本稿では,AIエージェントが膨大なWebスケール情報を洞察に富むレポートに合成しなければならない複雑な課題であるtextbfopen-ended Deep Research (OEDR) に取り組む。
人間の研究プロセスをエミュレートする新しいデュアルエージェントフレームワークである textbfWebWeaver を紹介する。
私たちのフレームワークは、DeepResearch Bench、DeepConsult、DeepResearchGymなど、主要なOEDRベンチマークにまたがる最先端の新たなベンチマークを確立しています。
論文 参考訳(メタデータ) (2025-09-16T17:57:21Z) - It takes a village to write a book: Mapping anonymous contributions in Stephen Langton's Quaestiones Theologiae [0.0]
本稿では,著者属性のテクスチャ的手法をレポートから開発したコレクションに応用した研究の設計について詳述する。
編集作業のレイヤーを解明し、コレクションの形成に関する仮説を検証することを目的としている。
論文 参考訳(メタデータ) (2025-08-18T11:13:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。