論文の概要: RESCORE: LLM-Driven Simulation Recovery in Control Systems Research Papers
- arxiv url: http://arxiv.org/abs/2604.04324v1
- Date: Mon, 06 Apr 2026 00:13:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.045046
- Title: RESCORE: LLM-Driven Simulation Recovery in Control Systems Research Papers
- Title(参考訳): RESCORE:制御系研究論文におけるLLM駆動型シミュレーション回復
- Authors: Vineet Bhat, Shiqing Wei, Ali Umut Kaypak, Prashanth Krishnamurthy, Ramesh Karri, Farshad Khorrami,
- Abstract要約: 制御システムの研究論文から数値シミュレーションを再構築することは、未特定パラメータやあいまいな実装の詳細によってしばしば妨げられる。
本稿では,論文の再現性を忠実に再現する実行可能なコードを生成する自動システムの課題である,シミュレーション検索性に関する論文の課題を定義する。
本稿では,3つのLLMエージェントフレームワークであるRESCORE,Analyzer,Coder,Verifierを提案する。
提案手法は,40.7%のベンチマークインスタンスに対して,タスクコヒーレントなシミュレーションを正常に再現し,シングルパス生成よりも優れていた。
- 参考スコア(独自算出の注目度): 18.24843021913362
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reconstructing numerical simulations from control systems research papers is often hindered by underspecified parameters and ambiguous implementation details. We define the task of Paper to Simulation Recoverability, the ability of an automated system to generate executable code that faithfully reproduces a paper's results. We curate a benchmark of 500 papers from the IEEE Conference on Decision and Control (CDC) and propose RESCORE, a three component LLM agentic framework, Analyzer, Coder, and Verifier. RESCORE uses iterative execution feedback and visual comparison to improve reconstruction fidelity. Our method successfully recovers task coherent simulations for 40.7% of benchmark instances, outperforming single pass generation. Notably, the RESCORE automated pipeline achieves an estimated 10X speedup over manual human replication, drastically cutting the time and effort required to verify published control methodologies. We will release our benchmark and agents to foster community progress in automated research replication.
- Abstract(参考訳): 制御システムの研究論文から数値シミュレーションを再構築することは、未特定パラメータとあいまいな実装詳細によってしばしば妨げられる。
本稿では,論文の再現性を忠実に再現する実行可能なコードを生成する自動システムの課題である,シミュレーション検索性に関する論文の課題を定義する。
我々は、IEEE Conference on Decision and Control (CDC) から500の論文のベンチマークをキュレートし、3つのLCMエージェントフレームワークであるAnalyzer、Coder、Verifierを提案する。
RESCOREは反復的な実行フィードバックと視覚的比較を使って再現率を改善する。
提案手法は,40.7%のベンチマークインスタンスに対して,タスクコヒーレントなシミュレーションを正常に再現し,シングルパス生成よりも優れていた。
特に、RESCORE自動化パイプラインは、手動による人間の複製よりも推定10倍のスピードアップを実現し、公開された制御方法論の検証に必要な時間と労力を大幅に削減する。
我々は、自動研究複製におけるコミュニティの進歩を促進するために、ベンチマークとエージェントをリリースします。
関連論文リスト
- Understanding by Reconstruction: Reversing the Software Development Process for LLM Pretraining [66.89012795621349]
大規模言語モデル(LLM)は、複雑なソフトウェア工学に必要な、深く、長期にわたる推論に苦しむことが多い。
本稿では,再構築による理解という,新しいパラダイムを提案する。
マルチエージェントシミュレーションを用いて潜在エージェント軌道を合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:23:20Z) - PaperRepro: Automated Computational Reproducibility Assessment for Social Science Papers [33.12402746591649]
PaperReproは、自動評価のための新しい2段階のマルチエージェントアプローチである。
実行段階では、エージェントが複製パッケージを実行し、コードを編集して再生結果を明示的な成果物としてキャプチャする。
評価段階では、エージェントは明確な証拠を用いてエージェントを評価する。
論文 参考訳(メタデータ) (2026-02-10T09:04:59Z) - Autonomous Control Leveraging LLMs: An Agentic Framework for Next-Generation Industrial Automation [0.0]
本稿では,大規模言語モデル(LLM)を個別のフォールトリカバリ計画と継続的プロセス制御の両方に活用する統合エージェントフレームワークを提案する。
その結果、構造化されたフィードバックとモジュラーエージェントにより、LLMは高レベルな記号計画と低レベルな連続制御を統一できることを示した。
論文 参考訳(メタデータ) (2025-07-03T11:20:22Z) - AutoReproduce: Automatic AI Experiment Reproduction with Paper Lineage [62.049868205196425]
AutoReproduceは、研究論文に記載された実験をエンドツーエンドで自動再生できるフレームワークである。
結果は、AutoReproduceが平均的なパフォーマンスギャップを22.1%$で達成していることを示している。
論文 参考訳(メタデータ) (2025-05-27T03:15:21Z) - Optimizing Case-Based Reasoning System for Functional Test Script Generation with Large Language Models [18.24326624696047]
テスト意図記述とそれに対応するテストスクリプトのケースバンクを保守し活用するケースベース推論(CBR)システムを提案する。
ユーザエクスペリエンスをさらに向上するために,再ランクベースの検索微調整と再利用微調整を併用したCBRシステムの最適化手法であるRe4を導入する。
論文 参考訳(メタデータ) (2025-03-26T14:23:59Z) - Optimizing Coverage-Driven Verification Using Machine Learning and PyUVM: A Novel Approach [2.3624953088402734]
System-on-Chip(SoC)設計の複雑さは、検証のボトルネックを生み出した。
既存の検証技術は、時間と冗長なシミュレーションの回帰に依存する。
シミュレーション回帰を最適化するために教師付き機械学習(ML)を活用する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-02-23T17:54:23Z) - Chain-of-Retrieval Augmented Generation [91.02950964802454]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。