Fugu-MT 論文翻訳(概要): Toward AI VIS Co-Scientists: A General and End-to-End Agent Harness for Solving Complex Data Visualization Tasks

論文の概要: Toward AI VIS Co-Scientists: A General and End-to-End Agent Harness for Solving Complex Data Visualization Tasks

arxiv url: http://arxiv.org/abs/2605.21825v1
Date: Wed, 20 May 2026 23:49:28 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-22 16:35:42.03098
Title: Toward AI VIS Co-Scientists: A General and End-to-End Agent Harness for Solving Complex Data Visualization Tasks
Title（参考訳）: AI VISの共同科学者に向けて:複雑なデータ可視化タスクを解くための汎用的でエンドツーエンドのエージェントハーネス
Authors: Haichao Miao, Zhimin Li, Kuangshi Ai, Kaiyuan Tang, Chaoli Wang, Peer-Timo Bremer, Shusen Liu,
Abstract要約: 本稿では、独自の視覚分析アプリケーションを設計するエンドツーエンドのエージェントハーネスを提案する。これは、多くの人々が自律的なシステムとして想定する、一般的なAIの共同科学者への重要なステップである。複数の科学・工学分野にまたがるIEEE SciVis Contestsにおいて,このアプローチを検証した。
参考スコア（独自算出の注目度）: 16.320569262892196
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The ability to inspect, interpret, and communicate complex data is crucial for virtually any scientific endeavor, but often requires significant expertise outside the core domain ranging from data management and analysis to visualization design and implementation. We present an end-to-end agentic harness that, based on only the data and a high level description of the tasks, independently designs custom visual analysis applications (VIS apps). This represents an important step towards a general AI co-scientist envisioned by many as an autonomous system that can autonomously execute long horizon tasks based on high-level directions. Our proposed VIS co-scientist is an essential component of this broader AI co-scientist vision: a harness that can autonomously analyze data and design visualization solutions using a collection of agents and specialized skills that coordinate exploratory analysis, plan, configure the environment, implement, validate the interface, and most importantly evaluate the overall task completion. Each stage produces document and instruction artifacts that guide downstream work and enable iterative refinement. We validate this approach on IEEE SciVis Contests spanning multiple science and engineering fields. These contests serve as ideal proving grounds because they encode real-world complexity: ambiguous requirements, diverse data modalities, design trade-offs, and task-driven validation. Given only the data and target tasks, our system autonomously produces functional single-page VIS Apps with verified linked-view behavior, highly customized to domain experts' specified tasks and needs.
Abstract（参考訳）: 複雑なデータを検査し、解釈し、伝達する能力は、事実上あらゆる科学的努力にとって重要であるが、データ管理や分析から視覚化設計、実装に至るまで、コアドメイン以外の重要な専門知識を必要とすることが多い。本稿では、データとタスクの高レベルな記述のみに基づいて、独自のビジュアル分析アプリケーション(VISアプリ)を設計するエンドツーエンドのエージェントハーネスを提案する。これは、多くの人々が想定する、ハイレベルな方向に基づいて、長い地平線タスクを自律的に実行できる自律システムとして、一般的なAIの共同科学者への重要なステップである。エージェントのコレクションと、探索分析、計画、環境の設定、実装、インターフェースの検証、そして最も重要なタスク全体の完了を評価する特別なスキルの集合を用いて、データと視覚化ソリューションを自律的に分析できるハーネスです。各ステージは、下流の作業をガイドし、反復的な洗練を可能にする文書と命令のアーティファクトを生成する。複数の科学・工学分野にまたがるIEEE SciVis Contestsにおいて,このアプローチを検証した。これらのコンテストは、曖昧な要求、多様なデータモダリティ、設計上のトレードオフ、タスク駆動の検証といった現実世界の複雑さをエンコードするため、理想的な証明基盤として機能する。データと対象タスクのみを前提として、ドメインの専門家の特定タスクやニーズに高度にカスタマイズされた、リンクビューの動作を検証した機能付きシングルページVISアプリを自律的に生成する。

関連論文リスト

AIDABench: AI Data Analytics Benchmark [62.45908988324612]
AIDABenchは、複雑なデータ分析タスクのAIシステムをエンドツーエンドで評価するためのベンチマークである。 AIDABenchは、質問応答、データビジュアライゼーション、ファイル生成という3つのコア機能ディメンションにまたがる600以上の多様なドキュメント分析タスクを含んでいる。 AIDABenchの11の最先端モデルを評価し、プロプライエタリ(Claude Sonnet 4.5、Gemini 3 Pro Previewなど)とオープンソース(Qwen3-Max-2026-01-23-Thinkingなど)の両方を対象とする。
論文参考訳（メタデータ） (2026-02-27T08:58:05Z)
InferA: A Smart Assistant for Cosmological Ensemble Data [0.5130440339897478]
InferAは、スケーラブルで効率的な科学的データ分析を可能にするマルチエージェントシステムである。アーキテクチャの中核は、データ検索と分析の異なるフェーズに責任を持つ専門エージェントのチームを編成するスーパーバイザーエージェントである。本フレームワークのユーザビリティを示すため,複数のテラバイトからなるHACC宇宙論シミュレーションから,アンサンブルランを用いたシステムの評価を行った。
論文参考訳（メタデータ） (2025-10-14T18:47:22Z)
CoDA: Agentic Systems for Collaborative Data Visualization [57.270599188947294]
深層研究はデータ分析に革命をもたらしたが、データサイエンティストは依然として手作業による視覚化にかなりの時間を費やしている。単純なシングルエージェントシステムやマルチエージェントシステムを含む既存のアプローチは、しばしばタスクを単純化する。本稿では,メタデータ分析,タスク計画,コード生成,自己回帰に特殊なLLMエージェントを利用するマルチエージェントシステムであるCoDAを紹介する。
論文参考訳（メタデータ） (2025-10-03T17:30:16Z)
Agent-X: Evaluating Deep Multimodal Reasoning in Vision-Centric Agentic Tasks [94.19506319646376]
本稿では,実世界のマルチモーダル環境での視覚中心エージェント評価のためのベンチマークであるAgent-Xを紹介する。 Agent-Xは、828のエージェントタスクと、イメージ、マルチイメージ比較、ビデオ、命令テキストを含む、真の視覚的コンテキストを備えている。その結果、GPT、Gemini、Qwenファミリーを含む最高のパフォーマンスモデルでさえ、多段階視覚タスクの解決に苦慮していることが明らかとなった。
論文参考訳（メタデータ） (2025-05-30T17:59:53Z)
VipAct: Visual-Perception Enhancement via Specialized VLM Agent Collaboration and Tool-use [74.39058448757645]
視覚言語モデル(VLM)を強化するエージェントフレームワークであるVipActを提案する。 VipActは、タスク要求の分析、計画、調整を管理するオーケストレータエージェントと、特定のタスクを処理する専門エージェントで構成される。様々な視覚認知タスクを特徴とするベンチマーク上でのVipActの評価を行い,実験結果から大幅な性能向上が得られた。
論文参考訳（メタデータ） (2024-10-21T18:10:26Z)
AGENTiGraph: An Interactive Knowledge Graph Platform for LLM-based Chatbots Utilizing Private Data [14.328402787379538]
本稿では,自然言語インタラクションによる知識管理プラットフォームである AgentiGraph (タスクベースインタラクションとグラフィカル表現のための適応生成ENgine) を紹介する。 AgentiGraphはマルチエージェントアーキテクチャを使用して、ユーザの意図を動的に解釈し、タスクを管理し、新しい知識を統合する。 3,500のテストケースのデータセットの実験結果から、AgentiGraphは最先端のゼロショットベースラインを大幅に上回っている。
論文参考訳（メタデータ） (2024-10-15T12:05:58Z)
Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文参考訳（メタデータ） (2024-09-27T06:31:03Z)
DISCOVER: A Data-driven Interactive System for Comprehensive Observation, Visualization, and ExploRation of Human Behaviour [6.716560115378451]
我々は,人間行動分析のための計算駆動型データ探索を効率化するために,モジュール型でフレキシブルでユーザフレンドリなソフトウェアフレームワークを導入する。我々の主な目的は、高度な計算方法論へのアクセスを民主化することであり、これにより研究者は、広範囲の技術的熟練を必要とせずに、詳細な行動分析を行うことができる。
論文参考訳（メタデータ） (2024-07-18T11:28:52Z)
MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。 2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文参考訳（メタデータ） (2024-07-06T00:40:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。