論文の概要: AI Agents Can Already Autonomously Perform Experimental High Energy Physics
- arxiv url: http://arxiv.org/abs/2603.20179v1
- Date: Fri, 20 Mar 2026 17:55:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:39.271199
- Title: AI Agents Can Already Autonomously Perform Experimental High Energy Physics
- Title(参考訳): AIエージェントは、すでに実験的な高エネルギー物理学を自律的に実行できる
- Authors: Eric A. Moreno, Samuel Bright-Thonney, Andrzej Novak, Dolores Garcia, Philip Harris,
- Abstract要約: 大規模言語モデルベースのAIエージェントは、専門家による最小限の入力で、高エネルギー物理分析パイプラインの一部を自律的に実行できるようになった。
本稿では,自律分析エージェントと文献に基づく知識検索とマルチエージェントレビューを統合した概念実証フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0431528684314271
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language model-based AI agents are now able to autonomously execute substantial portions of a high energy physics (HEP) analysis pipeline with minimal expert-curated input. Given access to a HEP dataset, an execution framework, and a corpus of prior experimental literature, we find that Claude Code succeeds in automating all stages of a typical analysis: event selection, background estimation, uncertainty quantification, statistical inference, and paper drafting. We argue that the experimental HEP community is underestimating the current capabilities of these systems, and that most proposed agentic workflows are too narrowly scoped or scaffolded to specific analysis structures. We present a proof-of-concept framework, Just Furnish Context (JFC), that integrates autonomous analysis agents with literature-based knowledge retrieval and multi-agent review, and show that this is sufficient to plan, execute, and document a credible high energy physics analysis. We demonstrate this by conducting analyses on open data from ALEPH, DELPHI, and CMS to perform electroweak, QCD, and Higgs boson measurements. Rather than replacing physicists, these tools promise to offload the repetitive technical burden of analysis code development, freeing researchers to focus on physics insight, truly novel method development, and rigorous validation. Given these developments, we advocate for new strategies for how the community trains students, organizes analysis efforts, and allocates human expertise.
- Abstract(参考訳): 大規模言語モデルベースのAIエージェントは、専門家による最小限の入力で、高エネルギー物理学(HEP)分析パイプラインのかなりの部分を自律的に実行できるようになった。
HEPデータセット、実行フレームワーク、以前の実験文献のコーパスへのアクセスを考えると、Claude Codeはイベント選択、バックグラウンド推定、不確実性定量化、統計的推測、ペーパードラフトといった典型的な分析のすべてのステージを自動化することに成功している。
実験的なHEPコミュニティは、これらのシステムの現在の能力を過小評価しており、ほとんどのエージェントワークフローは、範囲が狭すぎるか、特定の分析構造に足場を置きすぎていると論じる。
概念実証フレームワークJust Furnish Context(JFC)について,自律分析エージェントと文献に基づく知識検索とマルチエージェントレビューを統合し,信頼性の高い高エネルギー物理解析の計画,実行,文書化に十分であることを示す。
ALEPH, DELPHI, CMSからのオープンデータの解析を行い, 電弱, QCD, ヒッグス粒子測定を行った。
物理学者を置き換えるのではなく、これらのツールは分析コード開発における反復的な技術的負担を和らげ、研究者が物理学の洞察、真に新しいメソッド開発、厳密な検証に集中することを約束する。
これらの発展を踏まえ、我々は、コミュニティが学生を訓練し、分析活動を組織し、人間の専門知識を割り当てる新しい戦略を提唱する。
関連論文リスト
- Towards Agentic Intelligence for Materials Science [73.4576385477731]
この調査は、コーパスキュレーションからプレトレーニングから、シミュレーションと実験プラットフォームに面した目標条件付きエージェントまで、ユニークなパイプライン中心の視点を推し進める。
コミュニティをブリッジし、参照の共有フレームを確立するために、まず、AIと材料科学をまたいだ用語、評価、ワークフローの段階を整列する統合レンズを提示する。
論文 参考訳(メタデータ) (2026-01-29T23:48:43Z) - EpidemIQs: Prompt-to-Paper LLM Agents for Epidemic Modeling and Analysis [0.0]
大規模言語モデル(LLM)は、複雑な学際研究を自動化する新しい機会を提供する。
EpidemIQsは、ユーザ入力を統合し、文献のレビュー、分析的導出、ネットワークモデリング、シミュレーションの呼び出し、データの可視化と分析、そして最後に構造化された原稿での発見の文書化を行う、新しいマルチエージェントLCMフレームワークである。
我々は、計算コスト、完成率、AIおよび生成されたレポートの人間専門家レビューを測定する様々なシナリオにおいて、エピデムIQを評価した。
論文 参考訳(メタデータ) (2025-09-24T18:54:56Z) - Benchmarking LLM-based Agents for Single-cell Omics Analysis [6.915378212190715]
AIエージェントは、適応的な計画、実行可能なコード生成、トレース可能な決定、リアルタイム知識融合を可能にする、パラダイムシフトを提供する。
本稿では,シングルセルオミクス解析におけるエージェント能力の厳格な評価を行うためのベンチマーク評価システムを提案する。
論文 参考訳(メタデータ) (2025-08-16T04:26:18Z) - A Comprehensive Perspective on Explainable AI across the Machine Learning Workflow [1.269939585263915]
Holistic Explainable Artificial Intelligence (HXAI)は、データ分析ワークフローのすべてのステージに説明を埋め込む、ユーザ中心のフレームワークである。
HXAIは6つのコンポーネント(データ、分析設定、学習プロセス、モデル出力、モデル品質、通信チャネル)を単一の分類体系に統合する。
112項目の質問銀行がこれらのニーズをカバーしています。
論文 参考訳(メタデータ) (2025-08-15T15:15:25Z) - A Framework for Analyzing Abnormal Emergence in Service Ecosystems Through LLM-based Agent Intention Mining [18.607974352313832]
本稿では,マルチエージェント・インテンション(EAMI)に基づく創発分析の枠組みを紹介する。
EAMIは動的かつ解釈可能な出現分析を可能にする。
複合オンラインオフライン(O2O)サービスシステムにおけるEAMIを検証する実験。
論文 参考訳(メタデータ) (2025-07-21T16:26:49Z) - Deep Research Agents: A Systematic Examination And Roadmap [109.53237992384872]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z) - Advancing AI Research Assistants with Expert-Involved Learning [84.30323604785646]
大規模言語モデル (LLM) と大規模マルチモーダルモデル (LMM) は、生物医学的な発見を促進することを約束するが、その信頼性は未定である。
ARIEL(AI Research Assistant for Expert-in-the-Loop Learning)は,オープンソースの評価・最適化フレームワークである。
LMMは詳細な視覚的推論に苦しむのに対し、最先端のモデルでは流動性はあるが不完全な要約を生成する。
論文 参考訳(メタデータ) (2025-05-03T14:21:48Z) - Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。
我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。
次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文 参考訳(メタデータ) (2024-09-27T06:31:03Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。