論文の概要: ResearchLoop: An Evidence-Gated Control Plane for AI-Assisted Research
- arxiv url: http://arxiv.org/abs/2605.28282v1
- Date: Wed, 27 May 2026 10:29:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.975256
- Title: ResearchLoop: An Evidence-Gated Control Plane for AI-Assisted Research
- Title(参考訳): ResearchLoop:AI支援研究のためのエビデンス付きコントロールプレーン
- Authors: Yihan Xia, Taotao Wang,
- Abstract要約: ResearchLoopはAI支援型計算研究のためのエビデンス付き制御プレーンである。
ResearchLoopは、リサーチ質問、タスク契約、エビデンスオブジェクト、クレーム台帳、クローズアウト、ペーパーバインディングを耐久性のあるプロジェクトステートとして扱う。
この技術レポートは、完全なプロトコル仕様、状態モデル、トランジションルール、クレーム・アドミッション・アルゴリズム、インサイト・コンポーティングメカニズムを提供する。
- 参考スコア(独自算出の注目度): 4.9833735627186435
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: AI-assisted research compresses ideation, implementation, evaluation, and manuscript writing into a single interactive loop. This compression is useful, but it also creates a publication risk: paper claims can become easier to state than to audit. We present ResearchLoop, an evidence-gated control plane for AI-assisted computational research. ResearchLoop treats research questions, task contracts, evidence objects, claim ledgers, closeouts, and paper bindings as durable project state, realized here as a repository-backed runtime. This technical report provides the complete protocol specification, state model, transition rules, claim-admission algorithm, and insight-compounding mechanism. It also reports the full experimental record spanning nine versions (V0--V9), including a self-hosting case study, a controlled task-suite study with component ablations, a mathematical olympiad evaluation, and a supplementary SciCode boundary experiment evaluated with the official generated-code harness. All artifacts, manifests, and verification reports are preserved in the project repository.
- Abstract(参考訳): AI支援研究は、アイデア、実装、評価、原稿を単一のインタラクティブループに圧縮する。
この圧縮は有用だが、出版のリスクも生み出す。
我々はAI支援計算研究のためのエビデンス付き制御プレーンResearchLoopを提案する。
ResearchLoopは、調査質問、タスク契約、エビデンスオブジェクト、クレーム台帳、クローズアウト、ペーパーバインディングを耐久性のあるプロジェクト状態として扱い、ここでリポジトリが支援するランタイムとして実現します。
この技術レポートは、完全なプロトコル仕様、状態モデル、トランジションルール、クレーム・アドミッション・アルゴリズム、インサイト・コンポーティングメカニズムを提供する。
また、9つのバージョンにまたがる完全な実験記録(V0-V9)を報告し、セルフホストケーススタディ、コンポーネントの短縮による制御されたタスクスーツスタディ、数学的オリンピック評価、公式な生成コードハーネスを用いて評価された補足的なSciCode境界実験を含む。
すべてのアーティファクト、マニフェスト、検証レポートは、プロジェクトリポジトリに保存されます。
関連論文リスト
- PAIRED: A Process-Anchored Framework for Transparent Reporting of AI Contributions in Scientific Research [0.7614628596146601]
AIコントリビューションを報告するための既存のフレームワークは、一様にアウトプット指向である。
現在のフレームワークでは、研究の方向性を創始した研究者と、AIの提案した方向性を採用した研究者とを区別することはできない。
論文 参考訳(メタデータ) (2026-05-23T01:10:56Z) - Claw AI Lab: An Autonomous Multi-Agent Research Team [73.07229229907435]
今回紹介するClaw AI Labは,ラボネイティブな自律型研究プラットフォームである。
1つのエージェントや固定されたシリアルワークフローを中心にシステムを集中するのではなく、ユーザーは1つのプロンプトから完全な研究チームをインスタンス化できる。
Claw-Code Harnessはローカル、データセット、チェックポイントを接続して実行可能な実験を行い、実行成果物を研究ループにフィードバックする。
論文 参考訳(メタデータ) (2026-05-21T16:02:53Z) - AI for Auto-Research: Roadmap & User Guide [107.0834449839233]
研究ライフサイクル全体にわたってAIをエンドツーエンドに分析する。
我々は、信頼できる援助と信頼できない自律性の間に、鋭くステージに依存した境界を特定できる。
障害モードを排除するのではなく、より大きな自動化が不明瞭であることが示されています。
論文 参考訳(メタデータ) (2026-05-18T17:08:26Z) - ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration [10.076972559007116]
ARIS(Auto-Research-in-sleep)は、自律的な研究のためのオープンソースの研究ハーネスである。
ARISは、クロスモデル対外コラボレーションを通じて機械学習の研究を調整する。
論文 参考訳(メタデータ) (2026-05-04T18:10:15Z) - The Last Human-Written Paper: Agent-Native Research Artifacts [106.47848184955576]
本稿では,物語紙を機械処理可能な研究パッケージに置き換えるプロトコルであるAgent-Native Research Artifact(ARA)を紹介する。
通常の開発において決定と終了をキャプチャするLive Research Manager、レガシPDFとリポジトリをARAに変換するARAコンパイラ、人間レビュアーが重要性、ノベルティ、味にフォーカスできるように客観的チェックを自動化するARAネイティブレビューシステムである。
論文 参考訳(メタデータ) (2026-04-27T16:23:09Z) - Inspectable AI for Science: A Research Object Approach to Generative AI Governance [35.790980610679384]
研究対象としてのAI(AI-RO)について紹介する。
AIが著者なのか単なるツールなのかを議論する代わりに、我々はAIインタラクションを研究プロセスの構造化された検査可能なコンポーネントとして扱うことを提案する。
論文 参考訳(メタデータ) (2026-04-13T10:13:20Z) - ResearchPilot: A Local-First Multi-Agent System for Literature Synthesis and Related Work Drafting [3.272585676511349]
ResearchPilotは、文献レビュー支援のためのオープンソースのセルフホスト可能なマルチエージェントシステムである。
自然言語研究の質問を受けて、Semantic ScholarとarXivから論文を検索する。
紙抽象物から構造化された結果を抽出し、クロスペーパーパターンを合成し、引用・認識作業部を起草する。
論文 参考訳(メタデータ) (2026-03-15T22:02:59Z) - DeepSynth-Eval: Objectively Evaluating Information Consolidation in Deep Survey Writing [53.85037373860246]
本稿では,情報統合能力を客観的に評価するためのベンチマークであるDeep Synth-Evalを紹介する。
一般チェックリスト(実例)と制約チェックリスト(構造体)を用いたきめ細かい評価プロトコルを提案する。
その結果,エージェント型プラン・アンド・ライトは単ターン生成よりも大幅に優れていた。
論文 参考訳(メタデータ) (2026-01-07T03:07:52Z) - OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment [63.662126457336534]
OpenNoveltyは、透明で証拠に基づく新規性分析のためのエージェントシステムである。
回収された実論文のすべての評価を根拠にし、検証可能な判断を確実にする。
OpenNoveltyは、公正で一貫性があり、エビデンスに支えられたピアレビューを促進するスケーラブルなツールで、研究コミュニティに力を与えることを目指している。
論文 参考訳(メタデータ) (2026-01-04T15:48:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。