論文の概要: Review the Code, Not the Story: A Vision and Protocol for Code-First Peer Review
- arxiv url: http://arxiv.org/abs/2606.07683v1
- Date: Fri, 05 Jun 2026 01:26:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 11:23:48.504316
- Title: Review the Code, Not the Story: A Vision and Protocol for Code-First Peer Review
- Title(参考訳): コードレビュー:コードファーストピアレビューのビジョンとプロトコル
- Authors: Jienan Chen,
- Abstract要約: このビジョンとプロトコルペーパーは、コードファーストピアレビューを提案する。
著者は、実行可能な研究成果物と最小限のクレームマニフェストを提出する。
会場に制御されたAIシステムは環境を構築し、実験を実行し、コードパスを監査し、証拠のクレームをマップし、人間レビュアーのための標準化されたレビューパッケージを生成する。
- 参考スコア(独自算出の注目度): 2.531440973296736
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Peer review in computational fields remains centered on author-written manuscripts, even though the decisive evidence for many claims resides in executable code, data, configurations, and experiment pipelines. This manuscript-first workflow gives authors substantial control over narrative framing while leaving reviewers with limited time to inspect implementation details, reproduce results, or detect unsupported claims. This vision and protocol paper proposes code-first peer review: authors submit executable research artifacts and minimal claim manifests; a venue-controlled AI system builds the environment, executes experiments, audits code paths, maps claims to evidence, and generates a standardized Review Package for human reviewers. The goal is not to replace reviewers or to give authors an automatic writing assistant. Instead, AI serves as review infrastructure that shifts the target of peer review from polished narratives to executable evidence. We formalize a claim-evidence contract, define the Generated Review View and Review Package abstractions, give a worked example, outline a system architecture, and analyze evaluation and governance challenges including AI bias, prompt injection, model instability, auditability, and author appeal.
- Abstract(参考訳): 計算分野におけるピアレビューは、多くの主張が実行可能なコード、データ、構成、実験パイプラインに存在しているにもかかわらず、著者が書いた原稿を中心にしている。
この原稿第一のワークフローは、著者が物語のフレーミングをかなり制御し、レビュアーは実装の詳細を検査したり、結果を再現したり、不必要なクレームを検知したりするのに限られた時間を残している。
著者は、実行可能な研究成果物と最小限のクレームマニフェストを提出し、場所制御されたAIシステムが環境を構築し、実験を実行し、コードパスを監査し、証拠へのクレームをマップし、人間レビュアーのための標準化されたレビューパッケージを生成する。
目標は、レビュアーを置き換えることや、著者に自動筆記アシスタントを提供することではない。
代わりにAIは、ピアレビューの対象を洗練された物語から実行可能な証拠に移行するためのレビューインフラストラクチャとして機能する。
クレームエビデンス契約を形式化し、生成レビュービューとレビューパッケージの抽象化を定義し、動作する例を示し、システムアーキテクチャの概要を示し、AIバイアス、プロンプトインジェクション、モデル不安定性、監査可能性、著者のアピールを含む評価とガバナンスの課題を分析します。
関連論文リスト
- Making AI-Assisted Grant Evaluation Auditable without Exposing the Model [0.0]
本稿では,遠隔検定による要求の整合を支援するTEEアーキテクチャを提案する。
このアーキテクチャにより、外部検証者はどのモデル、ルーブリック、プロンプトテンプレート、入力表現が使われたかをチェックすることができる。
我々は、秘密のAI推論、証明可能なAI監査、ゼロ知識機械学習、アルゴリズムのアカウンタビリティ、AI支援ピアレビューに対する設計を位置付ける。
論文 参考訳(メタデータ) (2026-04-28T04:10:04Z) - When AI reviews science: Can we trust the referee? [73.47745294608072]
私たちは、トレーニングとデータ検索、デスクレビュー、深いレビュー、反論、システムレベルといった、レビューライフサイクル全体のアタックをマップします。
評価スコアに高名度フレーミング, 断定力, 反抗薬効, 文脈中毒の因果効果を分離するために, 2つの高度なLCMベースの審判を用いた。
論文 参考訳(メタデータ) (2026-04-26T08:03:32Z) - Peerispect: Claim Verification in Scientific Peer Reviews [12.340116689292726]
Peerispectは、ピアレビューでクレームレベルの検証を運用するインタラクティブシステムである。
結果は、論文のエビデンスを直接ハイライトするビジュアルインターフェースを通じて提示される。
論文 参考訳(メタデータ) (2026-04-19T23:40:26Z) - FactReview: Evidence-Grounded Reviews with Literature Positioning and Execution-Based Claim Verification [57.196748998757954]
本稿では,クレーム抽出,文献位置決定,実行に基づくクレーム検証を組み合わせたエビデンスベースレビューシステムであるFactReviewを紹介する。
FactReviewは論文を提出すると、主要なクレームを特定し、その結果を報告し、論文の技術的な位置を明らかにするために近くの作業を取り出し、コードが利用可能であれば、リリースされたリポジトリを実行する。
その後、簡潔なレビューと、主要な請求を5つのラベルのうち1つに割り当てるエビデンスレポートを生成する。
論文 参考訳(メタデータ) (2026-04-05T11:45:22Z) - Identifying Aspects in Peer Reviews [59.02879434536289]
我々は、ピアレビューのコーパスからアスペクトを抽出するデータ駆動スキーマを開発した。
我々は、アスペクトを付加したピアレビューのデータセットを導入し、コミュニティレベルのレビュー分析にどのように使用できるかを示す。
論文 参考訳(メタデータ) (2025-04-09T14:14:42Z) - Generative Adversarial Reviews: When LLMs Become the Critic [1.2430809884830318]
本稿では,LLMを利用したエージェントを利用して,忠実なピアレビュアーをシミュレートするジェネレーティブエージェントレビュアー(GAR)を紹介する。
このアプローチの中心は、グラフベースの原稿表現であり、コンテンツを凝縮し、情報を論理的に整理する。
本実験は,GARが人間レビュアーに対して,詳細なフィードバックと論文結果の予測を行う上で,相容れない性能を示すことを示した。
論文 参考訳(メタデータ) (2024-12-09T06:58:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。