論文の概要: HepScript: A Dual-Use DSL for Human-AI Collaborative Data Analysis Workflows in High-Energy Physics
- arxiv url: http://arxiv.org/abs/2605.01423v1
- Date: Sat, 02 May 2026 12:42:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.763835
- Title: HepScript: A Dual-Use DSL for Human-AI Collaborative Data Analysis Workflows in High-Energy Physics
- Title(参考訳): HepScript:高エネルギー物理学におけるAI協調データ分析ワークフローのためのデュアルユースDSL
- Authors: Junkun Jiao, Tong Liu, Ke Li, Weimin Song, Yipu Liao, Bolun Zhang, Beijiang Liu, Chang-Zheng Yuan, Yue Sun,
- Abstract要約: HepScriptは、解析ロジックを制約付き構文に抽象化する、共有形式インターフェースとして機能する。
この抽象化により、必要な人書きのコードを93%削減できる。
私たちの研究は、人間とAIの協調システムへのスケーラブルな経路を示します。
- 参考スコア(独自算出の注目度): 17.146017163668557
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The escalating data scale in High-Energy Physics (HEP) fuels a growing aspiration for higher analytical efficiency. While Large Language Models (LLMs) offer a path toward automation via agentic AI, they struggle with complex scientific workflows that require deep domain knowledge and are tightly coupled to experiment-specific codebases. To address this, we introduce a methodology centered on HepScript, a dual-use Domain-Specific Language (DSL) for HEP data analysis workflows. HepScript serves as a shared formal interface, abstracting HEP analysis logic into a constrained syntax that is both intuitive for human experts and reliably generable by AI agents. First developed for the Beijing Spectrometer III (BESIII) experiment, HepScript hides the complexity of the underlying software stack, translating high-level analysis intent into low-level, production-ready code. In our case studies, this abstraction reduces the required human-written code by 93\%. Crucially, HepScript's constrained grammar defines a tractable action space, enabling AI agents to autonomously generate executable specifications for core analysis stages directly from published literature with a 95\% success rate. Our work demonstrates a scalable pathway toward human-AI collaborative systems, where a formally specified DSL acts as an unambiguous translation layer between human expertise, AI automation, and production environment, rendering previously intractable automation problems solvable.
- Abstract(参考訳): 高エネルギー物理学(HEP)におけるエスカレートデータスケールは、分析効率を高めるために増大する願望を加速させる。
大規模言語モデル(LLM)はエージェントAIによる自動化への道を提供するが、深いドメイン知識を必要とし、実験固有のコードベースと密結合な複雑な科学的ワークフローに苦労する。
この問題に対処するため、HEPデータ分析ワークフロー用のドメイン特化言語(DSL)であるHepScriptを中心にした方法論を紹介します。
HepScriptは共有形式インターフェースとして機能し、HEP分析ロジックを人間の専門家にとって直感的で、AIエージェントによって確実に生成可能な制約付き構文に抽象化する。
Beijing Spectrometer III (BESIII) 実験のために最初に開発されたHepScriptは、基盤となるソフトウェアスタックの複雑さを隠蔽し、ハイレベルな分析意図を低レベルでプロダクション対応のコードに変換する。
今回のケーススタディでは、この抽象化により、必要となる人書きコードの割合を93%削減する。
重要な点として、HepScriptの制約付き文法は、抽出可能なアクション空間を定義しており、AIエージェントは、95%の成功率で発行された文献から直接、コア分析ステージの実行可能な仕様を自律的に生成することができる。
我々の研究は、人間の専門知識、AI自動化、生産環境の間の曖昧な翻訳層として、正式に指定されたDSLが機能し、これまで解決できなかった自動化問題をレンダリングする、人間とAIの協調システムへのスケーラブルな経路を示す。
関連論文リスト
- ComAgent: Multi-LLM based Agentic AI Empowered Intelligent Wireless Networks [62.031889234230725]
6Gネットワークは複雑な層間最適化に依存している。
数学の定式化に高レベルの意図を手動で翻訳することは、まだボトルネックである。
我々はマルチLLMエージェントAIフレームワークであるComAgentを紹介する。
論文 参考訳(メタデータ) (2026-01-27T13:43:59Z) - An Agentic Framework for Autonomous Materials Computation [70.24472585135929]
大規模言語モデル(LLM)は、科学的発見を加速するための強力なツールとして登場した。
近年の進歩はLLMをエージェントフレームワークに統合し、複雑な科学実験のための検索、推論、ツールの使用を可能にしている。
本稿では,第一原理計算の信頼性向上を目的としたドメイン特化エージェントを提案する。
論文 参考訳(メタデータ) (2025-12-22T15:03:57Z) - Code-in-the-Loop Forensics: Agentic Tool Use for Image Forgery Detection [59.04089915447622]
ForenAgentはインタラクティブなIFDフレームワークで、MLLMが検出対象に関するPythonベースの低レベルツールを自律的に生成、実行、洗練することができる。
人間の推論にインスパイアされた我々は、グローバルな認識、局所的な焦点、反復的探索、そして全体論的偏見を含む動的推論ループを設計する。
実験の結果,ForenAgent は IFD 課題に対する創発的なツール利用能力と反射的推論を示すことがわかった。
論文 参考訳(メタデータ) (2025-12-18T08:38:44Z) - Seismology modeling agent: A smart assistant for geophysical researchers [14.28965530601497]
本稿では,Large Language Models (LLM) を利用したインテリジェントな対話型ワークフローを提案する。
SPECFEMのための最初のモデルコンテキストプロトコル(MCP)サーバスイートを紹介する。
このフレームワークは、完全な自動実行とHuman-in-the-loopコラボレーションの両方をサポートする。
論文 参考訳(メタデータ) (2025-12-16T14:18:26Z) - Simple Agents Outperform Experts in Biomedical Imaging Workflow Optimization [69.36509281190662]
生産レベルのコンピュータビジョンツールを科学データセットに適応させることは、重要な"ラストマイル"ボトルネックである。
我々は、AIエージェントを使ってこの手動コーディングを自動化し、最適なエージェント設計のオープンな問題に焦点を当てる。
簡単なエージェントフレームワークが、人間-専門家のソリューションよりも優れた適応コードを生成することを実証する。
論文 参考訳(メタデータ) (2025-12-02T18:42:26Z) - SelfAI: Building a Self-Training AI System with LLM Agents [79.10991818561907]
SelfAIは、高レベルの研究目的を標準化された実験構成に変換するためのUser Agentを組み合わせた、一般的なマルチエージェントプラットフォームである。
実験マネージャは、連続的なフィードバックのための構造化知識ベースを維持しながら、異種ハードウェアをまたいだ並列かつフォールトトレラントなトレーニングを編成する。
回帰、コンピュータビジョン、科学計算、医用画像、薬物発見ベンチマークなどを通じて、SelfAIは一貫して高いパフォーマンスを達成し、冗長な試行を減らしている。
論文 参考訳(メタデータ) (2025-11-29T09:18:39Z) - Spec-Driven AI for Science: The ARIA Framework for Automated and Reproducible Data Analysis [23.28226188948918]
ARIAは、自動および解釈可能なデータ分析のための、仕様駆動のヒューマン・イン・ザ・ループ・フレームワークである。
ARIAは、Command、Context、Code、Data、Orchesttion、AI Moduleという6つのレイヤを統合している。
ARIAは透明で協調的で再現可能な科学的発見のための新しいパラダイムを確立している。
論文 参考訳(メタデータ) (2025-10-13T08:32:43Z) - Deep Research is the New Analytics System: Towards Building the Runtime for AI-Driven Analytics [6.298765290689598]
我々は、Deep Researchエージェントが最適化されたセマンティック演算子プログラムを記述および実行できるようにするプロトタイプを構築した。
標準のオープンディープリサーチエージェントと比較して、我々のプロトタイプは最大1.95倍のF1スコアを実現している。
エージェントにセマンティック演算子をツールとしてアクセスしても、プロトタイプは最大76.8%と72.7%のコストとランタイムの節約を達成する。
論文 参考訳(メタデータ) (2025-09-02T18:59:15Z) - GridMind: LLMs-Powered Agents for Power System Analysis and Operations [3.7568206336846663]
本稿では,大規模言語モデル(LLM)を決定論的工学的解法と統合し,対話型科学計算による電力系統解析を実現する多エージェントAIシステムを提案する。
GridMindはワークフローの統合、知識アクセシビリティ、コンテキスト保存、専門家による意思決定支援強化に対処する。
この研究は、エージェントAIを科学計算の実行可能なパラダイムとして確立し、会話インターフェースがアクセシビリティを向上し、重要なエンジニアリングアプリケーションに不可欠な数値的な厳密さを保っていることを実証する。
論文 参考訳(メタデータ) (2025-09-02T16:42:18Z) - Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文 参考訳(メタデータ) (2025-08-28T13:00:28Z) - Multi-Agent Actor-Critic Generative AI for Query Resolution and Analysis [1.0124625066746598]
本稿では,アクタ批判モデルに基づく問合せ解決のための変換フレームワークであるMASQRADを紹介する。
MASQRADは不正確または曖昧なユーザからの問い合わせを正確で行動可能な要求に翻訳するのに優れている。
MASQRAD は高度なマルチエージェントシステムとして機能するが、単一のAIエンティティとしてユーザに対して "masquerad" を提供する。
論文 参考訳(メタデータ) (2025-02-17T04:03:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。