Fugu-MT 論文翻訳(概要): nvAgent: Automated Data Visualization from Natural Language via Collaborative Agent Workflow

論文の概要: nvAgent: Automated Data Visualization from Natural Language via Collaborative Agent Workflow

arxiv url: http://arxiv.org/abs/2502.05036v1
Date: Fri, 07 Feb 2025 16:03:08 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-10 18:29:33.210003
Title: nvAgent: Automated Data Visualization from Natural Language via Collaborative Agent Workflow
Title（参考訳）: nvAgent: コラボレーションエージェントワークフローによる自然言語からのデータの可視化自動化
Authors: Geliang Ouyang, Jingyao Chen, Zhihe Nie, Yi Gui, Yao Wan, Hongyu Zhang, Dongping Chen,
Abstract要約: 自然言語から可視化へ(NL2Vis)は、自然言語記述を与えられたテーブルの視覚表現に変換する。我々はNL2Visのための協調エージェントワークフローであるnvAgentを提案する。新しいVisEvalベンチマークに関する総合的な評価は、nvAgentが最先端のベースラインを一貫して上回っていることを示している。
参考スコア（独自算出の注目度）: 9.676697360425196
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Natural Language to Visualization (NL2Vis) seeks to convert natural-language descriptions into visual representations of given tables, empowering users to derive insights from large-scale data. Recent advancements in Large Language Models (LLMs) show promise in automating code generation to transform tabular data into accessible visualizations. However, they often struggle with complex queries that require reasoning across multiple tables. To address this limitation, we propose a collaborative agent workflow, termed nvAgent, for NL2Vis. Specifically, nvAgent comprises three agents: a processor agent for database processing and context filtering, a composer agent for planning visualization generation, and a validator agent for code translation and output verification. Comprehensive evaluations on the new VisEval benchmark demonstrate that nvAgent consistently surpasses state-of-the-art baselines, achieving a 7.88% improvement in single-table and a 9.23% improvement in multi-table scenarios. Qualitative analyses further highlight that nvAgent maintains nearly a 20% performance margin over previous models, underscoring its capacity to produce high-quality visual representations from complex, heterogeneous data sources.
Abstract（参考訳）: 自然言語・トゥ・ビジュアライゼーション(NL2Vis)は、自然言語による記述を与えられたテーブルの視覚表現に変換し、ユーザーが大規模データから洞察を引き出すことを可能にする。近年のLLM(Large Language Models)の進歩は、表形式のデータを視覚化に変換するコード生成を自動化することを約束している。しかし、複数のテーブルにまたがる推論を必要とする複雑なクエリに苦労することが多い。この制限に対処するため,NL2Vis用の協調エージェントワークフローであるnvAgentを提案する。特に、nvAgentは、データベース処理及びコンテキストフィルタリングのためのプロセッサエージェント、可視化生成を計画する作曲家エージェント、コード翻訳及び出力検証のためのバリデータエージェントの3つのエージェントからなる。新しいVisEvalベンチマークに関する総合的な評価によると、nvAgentは最先端のベースラインを一貫して上回り、シングルテーブルでは7.88%、マルチテーブルでは9.23%改善している。質的な分析により、nvAgentは以前のモデルよりも20%近い性能のマージンを維持しており、複雑で異種なデータソースから高品質な視覚表現を生成する能力を強調している。

関連論文リスト

Visual Document Understanding and Question Answering: A Multi-Agent Collaboration Framework with Test-Time Scaling [83.78874399606379]
テスト時間スケーリングを備えたマルチエージェント協調フレームワークであるMACTを提案する。 4つの異なる小規模エージェントから構成され、明確に定義された役割と効果的なコラボレーションがある。一般および数学的タスクの能力を犠牲にすることなく、より小さなパラメータスケールで優れた性能を示す。
論文参考訳（メタデータ） (2025-08-05T12:52:09Z)
PlotGen: Multi-Agent LLM-based Scientific Data Visualization via Multimodal Feedback [47.79080056618323]
PlotGenは、精密な科学的可視化を作成することを目的とした、新しいマルチエージェントフレームワークである。 PlotGenは複数のオーケストレーションを行う。ブレークするクエリプランニングエージェントを含む、検索エージェント。複雑なユーザリクエストを実行可能コードにダウンします。回収フィードバックエージェント実験によると、PlotGenは強力なベースラインよりも優れており、MateBenchデータセットで46%改善されている。
論文参考訳（メタデータ） (2025-02-03T02:00:29Z)
GraphAgent: Agentic Graph Language Assistant [23.28223204340633]
明示的なグラフ依存と暗黙的なグラフ強化セマンティック相互依存性に対処する自動エージェントパイプラインであるGraphAgentを提案する。 GraphAgentには3つの重要なコンポーネントがある: (i) 複雑なセマンティックな依存関係を反映した知識グラフを構築するグラフ生成エージェント; (ii) 多様なユーザクエリを解釈し、エージェントによる自己計画を通じて対応するタスクを定式化するタスク計画エージェント; (iii) ユーザクエリに対応するツールマッチングと呼び出しを自動化しながら、計画されたタスクを効率的に実行するタスク実行エージェント。
論文参考訳（メタデータ） (2024-12-22T14:13:32Z)
Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining [67.87810796668981]
インフォメーション・インフォメーション・インフォメーション・クロッピング(ISC)と自己精製デュアルラーニング(SRDL) Irisは850KのGUIアノテーションだけで、複数のベンチマークで最先端のパフォーマンスを実現している。これらの改善は、WebとOSエージェントの両方の下流タスクで大幅に向上した。
論文参考訳（メタデータ） (2024-12-13T18:40:10Z)
Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2024-10-31T06:55:24Z)
AgentRE: An Agent-Based Framework for Navigating Complex Information Landscapes in Relation Extraction [10.65417796726349]
複雑なシナリオにおける関係抽出(RE)は、多種多様な関係型や単一の文内のエンティティ間のあいまいな関係のような課題に直面します。本稿では,複雑なシナリオにおいてREを実現するために,大規模言語モデルの可能性を完全に活用するエージェントベースのREフレームワークであるAgentREを提案する。
論文参考訳（メタデータ） (2024-09-03T12:53:05Z)
AvaTaR: Optimizing LLM Agents for Tool Usage via Contrastive Reasoning [93.96463520716759]
大規模言語モデル(LLM)エージェントは、精度と幻覚を高めるために外部ツールと知識を活用する際、印象的な能力を示した。本稿では、LLMエージェントを最適化して提供されたツールを効果的に活用し、与えられたタスクのパフォーマンスを向上させる新しい自動化フレームワークであるAvaTaRを紹介する。
論文参考訳（メタデータ） (2024-06-17T04:20:02Z)
Automating Pharmacovigilance Evidence Generation: Using Large Language Models to Produce Context-Aware SQL [0.0]
検索拡張世代(RAG)フレームワークでOpenAIのGPT-4モデルを利用する。ビジネスコンテキストドキュメントはビジネスコンテキストドキュメントでリッチ化され、NLQを構造化クエリ言語クエリに変換する。複雑性の高いクエリが除外された場合、パフォーマンスは最大85%向上した。
論文参考訳（メタデータ） (2024-06-15T17:07:31Z)
Agent-FLAN: Designing Data and Methods of Effective Agent Tuning for Large Language Models [56.00992369295851]
オープンソースのLarge Language Models(LLM)は、さまざまなNLPタスクで大きな成功を収めていますが、エージェントとして振る舞う場合、それでもAPIベースのモデルよりもはるかに劣っています。本稿では,(1) エージェント学習コーパスを,(1) エージェント学習データの分布から大きくシフトするエージェント推論と,(2) エージェントタスクが必要とする能力に異なる学習速度を示すエージェント学習コーパスと,(3) 幻覚を導入することでエージェント能力を改善する際の副作用について述べる。本稿では,エージェントのためのFLANモデルを効果的に構築するためのエージェントFLANを提案する。
論文参考訳（メタデータ） (2024-03-19T16:26:10Z)
MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data Visualization [86.61052121715689]
MatPlotAgentは、科学的データ可視化タスクを自動化するために設計された、モデルに依存しないフレームワークである。 MatPlotBenchは、100人の検証されたテストケースからなる高品質なベンチマークである。
論文参考訳（メタデータ） (2024-02-18T04:28:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。