論文の概要: AgentRivet: an automated system for producing Rivet routines from journal publications
- arxiv url: http://arxiv.org/abs/2606.13535v1
- Date: Thu, 11 Jun 2026 16:22:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.909233
- Title: AgentRivet: an automated system for producing Rivet routines from journal publications
- Title(参考訳): AgentRivet:雑誌出版物からRivetルーチンを自動生成するシステム
- Authors: Antonio J. Costa, Caterina Doglioni, Christian Gütschow, Andrew D. Pilkington, Sukanya Sinha,
- Abstract要約: 粒子物理学コライダー実験は、モデルに依存しない測定のための分析保存戦略の一部として、リベットルーチンを提供する。
RivetはC++ツールキットで、新しい理論モデルと測定値を比較することができる。
分析のカバレッジは不完全であることが知られており、測定値のわずか39%が文書化され、公開されているリベットルーチンである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Particle physics collider experiments provide Rivet routines as part of the analysis preservation strategy for model-independent measurements. Rivet is a C++ toolkit that allow new theoretical models to be compared to the measurements, thus aiding the development and tuning of Monte Carlo event generators as well as searches for physics beyond the Standard Model. However, analysis coverage is known to be incomplete, with only 39% of measurements having documented and publicly available Rivet routines. In this article, we design and implement an automated workflow based on Large Language Models with the goal of providing the missing routines. This multi-step workflow, referred to as AgentRivet, extracts the physics analysis information from published papers and writes the missing Rivet routines, with intermediate code- and physics- reviews as part of an autonomous quality control. We report the results obtained using commercial Large Language Models, provided by OpenAI, Anthropic, and Google, for two recent measurements from the ATLAS and CMS experiments. We find that AgentRivet produces competent Rivet routines with few syntax errors. The physics fidelity of the routines is reasonable and follows the explanations given in the relevant publications. Nevertheless, physics-implementation issues do arise and are investigated using the artefacts produced by AgentRivet. The majority of physics implementation issues arise from subtle-but-ambiguous definitions in the given publication, although some models struggle to implement complex observables even when clear definitions are given.
- Abstract(参考訳): 粒子物理学コライダー実験は、モデルに依存しない測定のための分析保存戦略の一部として、リベットルーチンを提供する。
RivetはC++ツールキットで、新しい理論モデルと測定値を比較し、モンテカルロイベントジェネレータの開発とチューニングを支援し、標準モデルを超えた物理の探索を支援する。
しかし、分析のカバレッジは不完全であることが知られており、測定結果の39%が文書化され、公開されているリベットルーチンである。
本稿では、欠落したルーチンを提供することを目的として、大規模言語モデルに基づく自動化ワークフローの設計と実装を行う。
AgentRivetと呼ばれるこのマルチステップワークフローは、公開された論文から物理分析情報を抽出し、欠落しているRivetルーチンを、自律的な品質管理の一部として、中間的なコードと物理のレビューで記述する。
商用のLarge Language Models(OpenAI, Anthropic, Google)を用いて,ATLASおよびCMS実験による最近の2つの測定結果について報告する。
AgentRivetは構文エラーの少ない有能なRivetルーチンを生成する。
ルーチンの物理忠実度は合理的であり、関連する出版物で与えられた説明に従う。
しかしながら、物理実装の問題が発生し、AgentRivetが生成した人工物を用いて検討されている。
物理学の実装問題の大部分は、与えられた出版物における微妙だがあいまいな定義から生じるが、明確な定義が与えられたとしても、複雑な可観測性の実装に苦慮するモデルもある。
関連論文リスト
- LLM-driven design of physics-constrained constitutive models: two agents are better than one [0.0]
モデル生成のためのマルチエージェントLPM駆動型アプローチを初めて導入する。
作成エージェントがデータに合わせたモデルを提案し、インスペクタエージェントが9つの物理的制約に対して各提案を監査する。
この概念を、人工ニューラルネットワーク(CANN)で実証し、脳組織、実験ゴム、合成ゴムでベンチマークする。
論文 参考訳(メタデータ) (2026-05-22T15:27:09Z) - Collider-Bench: Benchmarking AI Agents with Particle Physics Analysis Reproduction [0.02446672595462589]
我々は,LHC(Large Hadron Collider)から,公開論文とオープンサイエンスソフトウェアのみを用いて,言語モデルエージェントが実験分析を再現できるかどうかを評価するベンチマークであるCollind-Benchを紹介する。
したがってエージェントは、これらのギャップを埋めるために、物理的推論、ドメイン知識、試行錯誤に頼らなければならない。
以上の結果から, 平均的なエージェントが, ループ内解法を確実に打ち負かすことは不可能であることが示唆された。
論文 参考訳(メタデータ) (2026-05-13T18:00:00Z) - gwBenchmarks: Stress-Testing LLM Agents on High-Precision Gravitational Wave Astronomy [2.316169407465118]
現代の重力波天文学は、しばしば何ヶ月もの大学院レベルの努力を必要とするモデリングタスクに依存している。
我々は、最先端のLCM符号化エージェントが、このようなエンドツーエンドの科学的モデリングを行うことができるかどうかを考察する。
重力波解析計算と数値シミュレーションに基礎を置く8つのタスクの組であるgwBenchmarksを紹介した。
論文 参考訳(メタデータ) (2026-05-11T21:47:22Z) - From Experimental Limits to Physical Insight: A Retrieval-Augmented Multi-Agent Framework for Interpreting Searches Beyond the Standard Model [0.3867363075280543]
HEP-CoPilotは高エネルギー物理文献の探索と解釈のための多エージェントAIフレームワークである。
システムは、出版物からのテキスト情報、HEPDataからの構造化実験データ、マルチモーダル検索および推論アーキテクチャ内の再構成物理プロットを統一する。
論文 参考訳(メタデータ) (2026-05-04T11:42:14Z) - LiveFMBench: Unveiling the Power and Limits of Agentic Workflows in Specification Generation [75.05397479715576]
大規模言語モデル(LLM)とエージェントは有望な進歩を示しているが、その真の能力と失敗モードは未だ不明である。
CプログラムのためのLCMおよびエージェントベースの形式仕様生成に関する、最初の体系的および汚染に配慮した研究を提案する。
論文 参考訳(メタデータ) (2026-05-02T11:31:33Z) - Can Coding Agents Reproduce Findings in Computational Materials Science? [49.254975563645786]
本稿では,大規模言語モデルの科学的主張を再現する能力を評価するためのベンチマークであるAutoMatを紹介する。
課題を専門とする専門家と緊密に連携することで、実際の材料科学論文からの一連の主張をキュレートし、コーディングエージェントがエンドツーエンドのワークフローを回復し実行できるかどうかを検証します。
結果、現在のLSMベースのエージェントはAutoMatの全体的な成功率を低くし、最も優れた設定は54.1%に過ぎなかった。
論文 参考訳(メタデータ) (2026-05-01T17:42:12Z) - Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - Toward Greater Autonomy in Materials Discovery Agents: Unifying Planning, Physics, and Scientists [46.884317494606776]
MAPPSはPlanner、ツールコードジェネレータ、Scientific Mediatorで構成されている。
計画、物理学、科学者を統一することで、MAPPSはより柔軟で信頼性の高い物質発見を可能にする。
論文 参考訳(メタデータ) (2025-06-05T22:07:06Z) - Decomposing and Editing Predictions by Modeling Model Computation [75.37535202884463]
コンポーネントモデリングというタスクを導入します。
コンポーネントモデリングの目標は、MLモデルの予測をコンポーネントの観点から分解することだ。
コンポーネント属性を推定するスケーラブルなアルゴリズムであるCOARを提案する。
論文 参考訳(メタデータ) (2024-04-17T16:28:08Z) - Physics-informed machine learning for Structural Health Monitoring [0.0]
この章では、エンジニアがモデル化または評価しようとしている構造についてしばしば持つ物理的な洞察を考慮に入れたMLアルゴリズムを適用する、物理インフォームド機械学習の概念を紹介します。
この章では、単純な物理モデルとデータ駆動モデルを組み合わせたグレーボックスモデルによって、SHM設定における予測能力が向上することを示す。
SHMアプリケーションは、オフショアや航空宇宙構造物の負荷監視タスクから、ロングスパンブリッジのパフォーマンス監視まで、幅広いアプリケーションがデモされる。
論文 参考訳(メタデータ) (2022-06-30T14:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。