論文の概要: InferA: A Smart Assistant for Cosmological Ensemble Data
- arxiv url: http://arxiv.org/abs/2510.12920v1
- Date: Tue, 14 Oct 2025 18:47:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.3873
- Title: InferA: A Smart Assistant for Cosmological Ensemble Data
- Title(参考訳): InferA: 宇宙的アンサンブルデータのためのスマートアシスタント
- Authors: Justin Z. Tam, Pascal Grosset, Divya Banesh, Nesar Ramachandra, Terece L. Turton, James Ahrens,
- Abstract要約: InferAは、スケーラブルで効率的な科学的データ分析を可能にするマルチエージェントシステムである。
アーキテクチャの中核は、データ検索と分析の異なるフェーズに責任を持つ専門エージェントのチームを編成するスーパーバイザーエージェントである。
本フレームワークのユーザビリティを示すため,複数のテラバイトからなるHACC宇宙論シミュレーションから,アンサンブルランを用いたシステムの評価を行った。
- 参考スコア(独自算出の注目度): 0.5130440339897478
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Analyzing large-scale scientific datasets presents substantial challenges due to their sheer volume, structural complexity, and the need for specialized domain knowledge. Automation tools, such as PandasAI, typically require full data ingestion and lack context of the full data structure, making them impractical as intelligent data analysis assistants for datasets at the terabyte scale. To overcome these limitations, we propose InferA, a multi-agent system that leverages large language models to enable scalable and efficient scientific data analysis. At the core of the architecture is a supervisor agent that orchestrates a team of specialized agents responsible for distinct phases of the data retrieval and analysis. The system engages interactively with users to elicit their analytical intent and confirm query objectives, ensuring alignment between user goals and system actions. To demonstrate the framework's usability, we evaluate the system using ensemble runs from the HACC cosmology simulation which comprises several terabytes.
- Abstract(参考訳): 大規模科学的データセットの分析は、その量、構造的複雑さ、および専門的なドメイン知識の必要性による重大な課題を提示する。
PandasAIのような自動化ツールは、一般的に完全なデータ取り込みを必要とし、完全なデータ構造のコンテキストを欠いているため、テラバイト規模のデータセットのためのインテリジェントなデータ分析アシスタントとして実用的ではない。
これらの制約を克服するために,大規模言語モデルを活用するマルチエージェントシステムであるInferAを提案し,スケーラブルで効率的な科学的データ解析を実現する。
アーキテクチャの中核は、データ検索と分析の異なるフェーズに責任を持つ専門エージェントのチームを編成するスーパーバイザーエージェントである。
本システムは,ユーザと対話して分析意図を抽出し,クエリの目的を確認し,ユーザ目標とシステムアクションの整合性を確保する。
本フレームワークのユーザビリティを示すため,複数のテラバイトからなるHACC宇宙論シミュレーションから,アンサンブルランを用いたシステムの評価を行った。
関連論文リスト
- LLM-based Multi-Agent Blackboard System for Information Discovery in Data Science [69.1690891731311]
従来のAIモデルのためのブラックボードアーキテクチャに着想を得た,新しいマルチエージェント通信パラダイムを提案する。
このフレームワークでは、中央エージェントが共有ブラックボードにリクエストをポストし、自律的な従属エージェントがその能力に基づいて応答する。
明示的なデータ発見を必要とする3つのベンチマークに対して,本手法の評価を行った。
論文 参考訳(メタデータ) (2025-09-30T22:34:23Z) - Autonomous Data Agents: A New Opportunity for Smart Data [50.02229219403014]
DataAgentsは、自律的なデータから知識システムへのパラダイムシフトを表している、とReportは主張する。
DataAgentsは、複雑で非構造化されたデータをコヒーレントで行動可能な知識に変換する。
エージェントAIとデータ・トゥ・ナレッジシステムの収束が重要なトレンドとなっている理由を最初に検討する。
論文 参考訳(メタデータ) (2025-09-23T06:46:41Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [221.34650992288505]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - AgenticData: An Agentic Data Analytics System for Heterogeneous Data [12.67277567222908]
AgenticDataはエージェントデータ分析システムで、複数のドメインにまたがるデータソースを自律的に分析しながら、自然言語(NL)の質問に反応することができる。
本稿では,関連するデータを発見するためのデータプロファイリングエージェント,フィードバックに基づく反復最適化のためのセマンティッククロスバリデーションエージェント,短期文脈を維持するためのスマートメモリエージェントを利用するマルチエージェント協調戦略を提案する。
論文 参考訳(メタデータ) (2025-08-07T03:33:59Z) - Data Agent: A Holistic Architecture for Orchestrating Data+AI Ecosystems [8.816332263275305]
従来のData+AIシステムは、システムパイプラインのオーケストレーションに人間の専門家に大きく依存しています。
既存のData+AIシステムは、セマンティック理解、推論、計画の能力に制限がある。
データエージェント(Data Agent) - データ+AIエコシステムのオーケストレーションを目的とした包括的なアーキテクチャ。
論文 参考訳(メタデータ) (2025-07-02T11:04:49Z) - BIASINSPECTOR: Detecting Bias in Structured Data through LLM Agents [27.159150467166732]
本稿では,構造化データの自動バイアス検出のための,エンド・ツー・エンドのマルチエージェント・シナジー・フレームワークBIASINSPECTORを紹介する。
まず、ユーザが特定した偏見検出タスクを分析し、多種多様なツールセットで実装する多段階計画を開発した。
構造化データのバイアス検出において、例外的な全体的なパフォーマンスを実現し、より公平なデータアプリケーションのための新しいマイルストーンを設定します。
論文 参考訳(メタデータ) (2025-04-07T09:12:00Z) - DatawiseAgent: A Notebook-Centric LLM Agent Framework for Adaptive and Robust Data Science Automation [10.390461679868197]
我々は、適応的で堅牢なデータサイエンス自動化のためのノートブック中心の大規模言語モデル(LLM)エージェントフレームワークであるDatawiseAgentを紹介する。
人間のデータサイエンティストが計算ノートブックでどのように機能するかに触発されたDatawiseAgentは、統一された相互作用表現とマルチステージアーキテクチャを導入した。
論文 参考訳(メタデータ) (2025-03-10T08:32:33Z) - DSBench: How Far Are Data Science Agents from Becoming Data Science Experts? [58.330879414174476]
現実的なタスクでデータサイエンスエージェントを評価するためのベンチマークであるDSBenchを紹介する。
このベンチマークには、466のデータ分析タスクと、EloquenceとKaggleのコンペからソースされた74のデータモデリングタスクが含まれている。
現状のLLM, LVLM, エージェントを評価したところ, 最高のエージェントはデータ解析タスクの34.12%しか解決できず, RPG(Relative Performance Gap)は34.74%であった。
論文 参考訳(メタデータ) (2024-09-12T02:08:00Z) - CityGPT: Towards Urban IoT Learning, Analysis and Interaction with Multi-Agent System [4.612237040042468]
CityGPTはIoTデータの時間的分析を達成するために3つのエージェントを使用している。
我々は,大規模言語モデル(LLM)によって促進されたフレームワークを認証し,データの理解性を高めた。
実世界のデータを異なる時間で評価した結果、CityGPTフレームワークは、コンピューティングにおける堅牢な性能を保証できることが示されている。
論文 参考訳(メタデータ) (2024-05-23T15:27:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。