論文の概要: DataCross: A Unified Benchmark and Agent Framework for Cross-Modal Heterogeneous Data Analysis
- arxiv url: http://arxiv.org/abs/2601.21403v1
- Date: Thu, 29 Jan 2026 08:40:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.673198
- Title: DataCross: A Unified Benchmark and Agent Framework for Cross-Modal Heterogeneous Data Analysis
- Title(参考訳): DataCross: クロスモーダルな異種データ分析のための統一ベンチマークとエージェントフレームワーク
- Authors: Ruyi Qi, Zhou Liu, Wentao Zhang,
- Abstract要約: 我々は、統合された洞察駆動分析のための新しいベンチマークと協調エージェントフレームワークであるDataCrossを紹介する。
DataCrossBenchには、ファイナンス、ヘルスケア、その他のドメインにわたる200のエンドツーエンド分析タスクが含まれている。
また、人間アナリストの「分割合成」ワークフローにインスパイアされたDataCrossAgentフレームワークを提案する。
- 参考スコア(独自算出の注目度): 8.171937411588015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In real-world data science and enterprise decision-making, critical information is often fragmented across directly queryable structured sources (e.g., SQL, CSV) and "zombie data" locked in unstructured visual documents (e.g., scanned reports, invoice images). Existing data analytics agents are predominantly limited to processing structured data, failing to activate and correlate this high-value visual information, thus creating a significant gap with industrial needs. To bridge this gap, we introduce DataCross, a novel benchmark and collaborative agent framework for unified, insight-driven analysis across heterogeneous data modalities. DataCrossBench comprises 200 end-to-end analysis tasks across finance, healthcare, and other domains. It is constructed via a human-in-the-loop reverse-synthesis pipeline, ensuring realistic complexity, cross-source dependency, and verifiable ground truth. The benchmark categorizes tasks into three difficulty tiers to evaluate agents' capabilities in visual table extraction, cross-modal alignment, and multi-step joint reasoning. We also propose the DataCrossAgent framework, inspired by the "divide-and-conquer" workflow of human analysts. It employs specialized sub-agents, each an expert on a specific data source, which are coordinated via a structured workflow of Intra-source Deep Exploration, Key Source Identification, and Contextual Cross-pollination. A novel reReAct mechanism enables robust code generation and debugging for factual verification. Experimental results show that DataCrossAgent achieves a 29.7% improvement in factuality over GPT-4o and exhibits superior robustness on high-difficulty tasks, effectively activating fragmented "zombie data" for insightful, cross-modal analysis.
- Abstract(参考訳): 実世界のデータサイエンスと企業における意思決定において、クリティカルな情報は、直接クエリ可能な構造化されたソース(例えば、SQL、CSV)と、構造化されていないビジュアルドキュメント(例えば、スキャンされたレポート、請求書画像)にロックされた「ゾンビデータ」で断片化されることが多い。
既存のデータ分析エージェントは、主に構造化データの処理に限られており、この高価値な視覚情報を活性化・相関できないため、産業ニーズとの大きなギャップが生じる。
このギャップを埋めるために、異種データモダリティをまたいだ統一的洞察駆動分析のための新しいベンチマークおよび協調エージェントフレームワークであるDataCrossを紹介します。
DataCrossBenchには、ファイナンス、ヘルスケア、その他のドメインにわたる200のエンドツーエンド分析タスクが含まれている。
ヒューマン・イン・ザ・ループのリバース・シンセサイザー・パイプラインを通じて構築され、現実的な複雑さ、ソース間の依存関係、検証可能な土台真理を保証する。
このベンチマークは、タスクを3つの難易度に分類し、視覚テーブル抽出、クロスモーダルアライメント、多段階共同推論におけるエージェントの能力を評価する。
我々はまた、人間アナリストの"分権"ワークフローにインスパイアされたDataCrossAgentフレームワークを提案する。
特別なサブエージェントを採用し、それぞれが特定のデータソースの専門家であり、ソース内部のDeep Exploration、Key Source Identification、Contextual Cross-pollinationといった構造化ワークフローを介して調整される。
新たなreReActメカニズムは、実際の検証のための堅牢なコード生成とデバッグを可能にする。
実験結果から,DataCrossAgentはGPT-4oよりも29.7%向上し,高拡散性タスクに優れた堅牢性を示し,断片化された「動物データ」を効果的に活性化し,洞察に富んだクロスモーダル分析を行うことがわかった。
関連論文リスト
- Can LLMs Clean Up Your Mess? A Survey of Application-Ready Data Preparation with LLMs [66.63911043019294]
データ準備は、生のデータセットを識別し、データセット間の関係を解明し、それらから貴重な洞察を抽出することを目的としている。
本稿では,様々な下流タスクのためのデータ準備にLLM技術を用いることに焦点を当てる。
データクリーニング、標準化、エラー処理、計算、データ統合、データ豊か化という3つの主要なタスクにフィールドを編成するタスク中心の分類を導入します。
論文 参考訳(メタデータ) (2026-01-22T12:02:45Z) - OpenDataArena: A Fair and Open Arena for Benchmarking Post-Training Dataset Value [74.80873109856563]
OpenDataArena(ODA)は、トレーニング後のデータの本質的な価値をベンチマークするために設計された、総合的でオープンなプラットフォームである。
ODAは4つの主要な柱からなる包括的なエコシステムを確立している。 (i) 多様なモデル間で公平でオープンな比較を保証する統一的なトレーニング評価パイプライン、 (ii) 異なる軸数に沿ってデータ品質をプロファイリングする多次元スコアリングフレームワーク、 (iii) データセットの系図を視覚化してコンポーネントソースを識別するインタラクティブなデータ系統探索である。
論文 参考訳(メタデータ) (2025-12-16T03:33:24Z) - Linking Heterogeneous Data with Coordinated Agent Flows for Social Media Analysis [24.70488591952602]
ソーシャルメディアプラットフォームは大量の異種データを生成する。
異種マルチモーダルデータをリンクするエージェントシステムであるSIA(Social Insight Agents)を提案する。
SIAはソーシャルメディアから多様で有意義な洞察を効果的に発見できることを示す。
論文 参考訳(メタデータ) (2025-10-30T06:22:49Z) - Agent Data Protocol: Unifying Datasets for Diverse, Effective Fine-tuning of LLM Agents [85.02904078131682]
本稿では,エージェントデータセット間の"インターリングア"として機能する軽量表現言語であるエージェントデータプロトコル(ADP)を紹介する。
ADPはAPI/ツールの使用、ブラウジング、コーディング、ソフトウェアエンジニアリング、一般的なエージェントなど、さまざまなタスクを捉えるのに十分な表現力を持っている。
すべてのコードとデータが公開され、ADPが標準化され、スケーラブルで再現可能なエージェントトレーニングの障壁を低くすることを期待している。
論文 参考訳(メタデータ) (2025-10-28T17:53:13Z) - CoDA: Agentic Systems for Collaborative Data Visualization [57.270599188947294]
深層研究はデータ分析に革命をもたらしたが、データサイエンティストは依然として手作業による視覚化にかなりの時間を費やしている。
単純なシングルエージェントシステムやマルチエージェントシステムを含む既存のアプローチは、しばしばタスクを単純化する。
本稿では,メタデータ分析,タスク計画,コード生成,自己回帰に特殊なLLMエージェントを利用するマルチエージェントシステムであるCoDAを紹介する。
論文 参考訳(メタデータ) (2025-10-03T17:30:16Z) - Scaling Generalist Data-Analytic Agents [95.05161133349242]
DataMindは、汎用データ分析エージェントを構築するために設計されたスケーラブルなデータ合成およびエージェントトレーニングレシピである。
DataMindは、オープンソースのデータ分析エージェントを構築する上で重要な3つの課題に取り組む。
論文 参考訳(メタデータ) (2025-09-29T17:23:08Z) - AgenticData: An Agentic Data Analytics System for Heterogeneous Data [12.67277567222908]
AgenticDataはエージェントデータ分析システムで、複数のドメインにまたがるデータソースを自律的に分析しながら、自然言語(NL)の質問に反応することができる。
本稿では,関連するデータを発見するためのデータプロファイリングエージェント,フィードバックに基づく反復最適化のためのセマンティッククロスバリデーションエージェント,短期文脈を維持するためのスマートメモリエージェントを利用するマルチエージェント協調戦略を提案する。
論文 参考訳(メタデータ) (2025-08-07T03:33:59Z) - Benchmarking Deep Search over Heterogeneous Enterprise Data [73.55304268238474]
検索強化生成(RAG)の形式を評価するための新しいベンチマークを提案する。
RAGは、多種多様な、しかし関連するソースに対して、ソースを意識したマルチホップ推論を必要とする。
製品計画、開発、サポートステージをまたいだビジネスをシミュレートする合成データパイプラインを使用して構築します。
論文 参考訳(メタデータ) (2025-06-29T08:34:59Z) - CMDBench: A Benchmark for Coarse-to-fine Multimodal Data Discovery in Compound AI Systems [10.71630696651595]
知識集約的なタスクを達成するエージェントとしてLLMを使用する複合AIシステム(CAS)は、データベースやAIコミュニティにおいて大きな関心を集めている。
マルチモーダルデータソースのサイロは、そのタスクを達成するための適切なデータソースを特定するのを困難にしている。
我々はエンタープライズデータプラットフォームの複雑さをモデル化したベンチマークであるCMDBenchを提案する。
論文 参考訳(メタデータ) (2024-06-02T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。