論文の概要: VIDEE: Visual and Interactive Decomposition, Execution, and Evaluation of Text Analytics with Intelligent Agents
- arxiv url: http://arxiv.org/abs/2506.21582v2
- Date: Thu, 17 Jul 2025 03:52:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 15:53:04.797069
- Title: VIDEE: Visual and Interactive Decomposition, Execution, and Evaluation of Text Analytics with Intelligent Agents
- Title(参考訳): VIDEE:知的エージェントを用いたテキスト分析の視覚的・インタラクティブな分解・実行・評価
- Authors: Sam Yu-Te Lee, Chengyang Ji, Shicheng Wen, Lifu Huang, Dongyu Liu, Kwan-Liu Ma,
- Abstract要約: VIDEEは、インテリジェントエージェントによる高度なテキスト分析を行うための、エントリーレベルのデータアナリストをサポートするシステムである。
VIDEEの有効性を評価するための2つの定量的実験を行い、一般的なエージェントエラーを分析した。
- 参考スコア(独自算出の注目度): 30.54944324418407
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Text analytics has traditionally required specialized knowledge in Natural Language Processing (NLP) or text analysis, which presents a barrier for entry-level analysts. Recent advances in large language models (LLMs) have changed the landscape of NLP by enabling more accessible and automated text analysis (e.g., topic detection, summarization, information extraction, etc.). We introduce VIDEE, a system that supports entry-level data analysts to conduct advanced text analytics with intelligent agents. VIDEE instantiates a human-agent collaroration workflow consisting of three stages: (1) Decomposition, which incorporates a human-in-the-loop Monte-Carlo Tree Search algorithm to support generative reasoning with human feedback, (2) Execution, which generates an executable text analytics pipeline, and (3) Evaluation, which integrates LLM-based evaluation and visualizations to support user validation of execution results. We conduct two quantitative experiments to evaluate VIDEE's effectiveness and analyze common agent errors. A user study involving participants with varying levels of NLP and text analytics experience -- from none to expert -- demonstrates the system's usability and reveals distinct user behavior patterns. The findings identify design implications for human-agent collaboration, validate the practical utility of VIDEE for non-expert users, and inform future improvements to intelligent text analytics systems.
- Abstract(参考訳): テキスト分析は、伝統的に自然言語処理(NLP)やテキスト分析において特別な知識を必要としてきた。
大規模言語モデル(LLM)の最近の進歩は、よりアクセシブルで自動化されたテキスト分析(トピック検出、要約、情報抽出など)を可能にすることで、NLPの状況を変えている。
我々は、インテリジェントエージェントを用いた高度なテキスト分析を行うための、エントリーレベルのデータアナリストをサポートするシステムであるVIDEEを紹介する。
VIDEEは,(1)人間の入力するモンテカルロ木探索アルゴリズムを組み込んで人間のフィードバックによる生成推論を支援する分解,(2)実行可能なテキスト分析パイプラインを生成する実行,(3)LCMベースの評価と視覚化を統合して実行結果のユーザ検証を支援する評価,の3段階からなる人力調整ワークフローをインスタンス化する。
VIDEEの有効性を評価するための2つの定量的実験を行い、一般的なエージェントエラーを分析した。
さまざまなレベルのNLPとテキスト分析経験を持つ参加者によるユーザスタディは、システムのユーザビリティを実証し、異なるユーザ行動パターンを明らかにしている。
本研究は,人間とエージェントのコラボレーションにおける設計上の意味を明らかにし,非エキスパートユーザに対するVIDEEの実用性を検証し,知的テキスト分析システムの将来的な改善を通知する。
関連論文リスト
- VeriMinder: Mitigating Analytical Vulnerabilities in NL2SQL [11.830097026198308]
自然言語インタフェースをデータベース(NLIDB)に適用したアプリケーションシステムは、データ分析を民主化している。
これはまた、統計分析のバックグラウンドなしにこれらのシステムを使用するユーザを支援する緊急の課題も生み出した。
We present VeriMinder, https://veriminder.ai, an Interactive system for detect and mitigating such analysisal vulnerabilities。
論文 参考訳(メタデータ) (2025-07-23T19:48:12Z) - IDA-Bench: Evaluating LLMs on Interactive Guided Data Analysis [60.32962597618861]
IDA-Benchは、多ラウンドの対話シナリオで大規模言語モデルを評価する新しいベンチマークである。
エージェント性能は、最終的な数値出力と人間由来のベースラインを比較して判断する。
最先端のコーディングエージェント(Claude-3.7-thinkingなど)でさえ50%のタスクを成功させ、シングルターンテストでは明らかでない制限を強調している。
論文 参考訳(メタデータ) (2025-05-23T09:37:52Z) - A Survey on (M)LLM-Based GUI Agents [62.57899977018417]
グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。
大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。
本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文 参考訳(メタデータ) (2025-03-27T17:58:31Z) - InterChat: Enhancing Generative Visual Analytics using Multimodal Interactions [22.007942964950217]
視覚要素の直接操作と自然言語入力を組み合わせた生成的視覚分析システムであるInterChatを開発した。
この統合により、正確なインテント通信が可能になり、プログレッシブで視覚的に駆動された探索データ分析をサポートする。
論文 参考訳(メタデータ) (2025-03-06T05:35:19Z) - The Role of Accuracy and Validation Effectiveness in Conversational Business Analytics [0.0]
本研究では,AIを利用した対話型ビジネス分析を用いて,エンドユーザが従来のセルフサービス分析を効果的に利用できない技術的能力ギャップに対処する手法について検討する。
自然言語による対話を容易にすることによって、対話型ビジネス分析は、ユーザが独立してデータを検索し、洞察を生成できるようにすることを目的としている。
論文 参考訳(メタデータ) (2024-11-18T23:58:24Z) - Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。
我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。
次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文 参考訳(メタデータ) (2024-09-27T06:31:03Z) - Towards Unified Multi-granularity Text Detection with Interactive Attention [56.79437272168507]
Detect Any Text"は、シーンテキストの検出、レイアウト分析、ドキュメントページの検出を結合的なエンドツーエンドモデルに統合する高度なパラダイムである。
DATにおける重要なイノベーションは、テキストインスタンスの表現学習を大幅に強化する、粒度横断型アテンションモジュールである。
テストによると、DATは様々なテキスト関連ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-05-30T07:25:23Z) - Holistic Visual-Textual Sentiment Analysis with Prior Models [64.48229009396186]
本稿では,頑健な視覚・テキスト感情分析を実現するための総合的手法を提案する。
提案手法は,(1)感情分析のためのデータから特徴を直接学習する視覚テキストブランチ,(2)選択された意味的特徴を抽出する事前学習された「専門家」エンコーダを備えた視覚専門家ブランチ,(3)暗黙的に視覚テキスト対応をモデル化するCLIPブランチ,(4)多モード特徴を融合して感情予測を行うBERTに基づくマルチモーダル特徴融合ネットワークの4つの部分から構成される。
論文 参考訳(メタデータ) (2022-11-23T14:40:51Z) - TextFlint: Unified Multilingual Robustness Evaluation Toolkit for
Natural Language Processing [73.16475763422446]
NLPタスク(TextFlint)のための多言語ロバスト性評価プラットフォームを提案する。
普遍的なテキスト変換、タスク固有の変換、敵攻撃、サブポピュレーション、およびそれらの組み合わせを取り入れ、包括的な堅牢性分析を提供する。
TextFlintは、モデルの堅牢性の欠点に対処するために、完全な分析レポートとターゲットとした拡張データを生成します。
論文 参考訳(メタデータ) (2021-03-21T17:20:38Z) - Leam: An Interactive System for In-situ Visual Text Analysis [0.6445605125467573]
Leamは、計算ノート、スプレッドシート、可視化ツールの利点を組み合わせることで、テキスト解析プロセスを単一の連続体として扱うシステムである。
本稿では,Leam開発における現在の進歩を報告するとともに,その有用性を実例で示す。
論文 参考訳(メタデータ) (2020-09-08T05:18:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。