論文の概要: Workflow Closure Is Not Scientific Closure in Auto-Research Systems
- arxiv url: http://arxiv.org/abs/2605.26200v1
- Date: Mon, 25 May 2026 17:16:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.28894
- Title: Workflow Closure Is Not Scientific Closure in Auto-Research Systems
- Title(参考訳): 自動調査システムにおけるワークフロークロージャは科学的クロージャではない
- Authors: Shuai Wang, Xinyuan Tian, Pangpang Liu, Yize Zhao,
- Abstract要約: 信頼に値する自己調査は、自律的な自己充足を目標とするのではなく、非自律的な制御の下での自律的な実行を目標とすべきである、と我々は主張する。
この急激な領域における100以上の最近の論文やリポジトリの調査に基づいて、繰り返し、構造的に結びついている障害パターンを診断する。
コミュニティの議論を喚起するために、客観的なシグナル、検証、アウトプットの経路にまたがる潜在的な改善について概説する。
- 参考スコア(独自算出の注目度): 7.328929827918299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper argues that workflow closure is not scientific closure in auto-research systems. Current systems can increasingly complete research-like loops internally, moving from idea generation to experiment execution, writing, and self-evaluation. That achievement is real, but it does not by itself give the resulting outputs scientific standing. We argue that trustworthy auto-research should not aim for autonomous self-sufficiency, but should aim for autonomous execution under non-autonomous epistemic control. Based on a survey of more than 100 recent papers and repositories in this rapidly emerging area, together with a structured audit of 21 representative systems, we diagnose a recurring and structurally connected failure pattern: objective collapse, in which single-proxy targets replace multi-objective scientific aims; validation collapse, in which internal self-evaluation replaces independent validation; and acceptance collapse, in which benchmark scores or publication-shaped artifacts replace mechanisms for domain-level critique, reuse, and integration. These collapses are not inherent limits of autonomy but correctable design choices. Accordingly, we outline potential remedies across objective signal, validation, and output pathway to spark community discussion.
- Abstract(参考訳): 本稿では,自動検索システムにおいて,ワークフロークロージャは科学的クロージャではないことを論じる。
現在のシステムは、アイデア生成から実験的な実行、書き込み、自己評価へと移行し、研究のようなループを内部的に完了させる可能性がある。
その成果は本物だが、それ自体が結果の科学的地位を与えるわけではない。
信頼に値する自己検索は、自律的な自己充足を目標とするのではなく、非自律的なてんかんコントロールの下での自律的な実行を目標とすべきである、と我々は主張する。
この急激な領域における100以上の最近の論文やリポジトリの調査と、21の代表的なシステムの構造化監査に基づいて、繰り返しかつ構造的に結びついた障害パターンを診断する: 客観的な崩壊、単一プロキシのターゲットが多目的の科学的目的に取って代わる、検証の崩壊、内部の自己評価が独立したバリデーションに取って代わる、受け入れの崩壊、ベンチマークスコアや出版形態のアーティファクトがドメインレベルの批判、再利用、統合のメカニズムに取って代わる、などである。
これらの崩壊は、独立性の固有の限界ではなく、修正可能な設計選択である。
そこで我々は,コミュニティの議論を喚起するために,客観的なシグナル,検証,アウトプットの経路にまたがる潜在的な対策について概説する。
関連論文リスト
- AutoResearch AI: Towards AI-Powered Research Automation for Scientific Discovery [184.2309450554096]
AutoResearchはAIを活用した科学ワークフロー自動化の開発スペクトルとして定義されている。
我々は、研究システムが制御、エビデンス、実行、検証、説明責任を再分配し、その分野を組織化する方法について分析する。
本稿では,5つの評価次元 – ノベルティ,インパクト,信頼性,証明 – を提案し,AutoResearchの自律性はドメイン条件であることを示す。
論文 参考訳(メタデータ) (2026-05-22T03:40:30Z) - AutoResearchClaw: Self-Reinforcing Autonomous Research with Human-AI Collaboration [175.74514061083195]
提案するAutoResearchClawは,5つのメカニズムに基づいて構築されたマルチエージェント自律型研究パイプラインである。
25トピックの実験ステージベンチマークであるARC-Benchでは、AutoResearchClawがAI Scientist v2を54.7%上回っている。
論文 参考訳(メタデータ) (2026-05-19T15:49:51Z) - AI for Auto-Research: Roadmap & User Guide [107.0834449839233]
研究ライフサイクル全体にわたってAIをエンドツーエンドに分析する。
我々は、信頼できる援助と信頼できない自律性の間に、鋭くステージに依存した境界を特定できる。
障害モードを排除するのではなく、より大きな自動化が不明瞭であることが示されています。
論文 参考訳(メタデータ) (2026-05-18T17:08:26Z) - Beyond Individual Intelligence: Surveying Collaboration, Failure Attribution, and Self-Evolution in LLM-based Multi-Agent Systems [65.90791804095561]
マルチエージェントシステムは、特殊エージェント間の構造化された協調を通じてこの問題に対処するが、より厳密な調整は、あまり検討されていないリスクを増幅する。
既存の調査では、個々のエージェント能力、マルチエージェントのコラボレーション、エージェントの自己進化を別々にカバーしている。
この調査は4つの因果関係のあるステージを中心にまとめられた統一されたレビューを提供する。これはLIFEの進展(Lay the capabilities foundation)、協力によるエージェントの統合、帰属による障害の発見、自律的な自己改善によるEvolveである。
論文 参考訳(メタデータ) (2026-05-14T14:36:13Z) - AI-Supervisor: Autonomous AI Research Supervision via a Persistent Research World Model [1.14219428942199]
既存の自動研究システムは、ステートレスでリニアなパイプラインとして動作する。
マルチエージェントオーケストレーションフレームワークである textbfAI-Supervisor を提案する。
エージェントは、人間の関心によって駆動されるエンドツーエンドのAI研究の監督を提供する。
論文 参考訳(メタデータ) (2026-03-25T15:16:51Z) - Automatic Reviewers Fail to Detect Faulty Reasoning in Research Papers: A New Counterfactual Evaluation Framework [55.078301794183496]
我々は、高品質なピアレビューを支えるコアレビュースキル、すなわち欠陥のある研究ロジックの検出に注力する。
これは、論文の結果、解釈、クレームの間の内部の一貫性を評価することを含む。
本稿では,このスキルを制御条件下で分離し,テストする,完全自動対物評価フレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-29T08:48:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。