論文の概要: DataScout: Automatic Data Fact Retrieval for Statement Augmentation with an LLM-Based Agent
- arxiv url: http://arxiv.org/abs/2504.17334v1
- Date: Thu, 24 Apr 2025 07:52:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.287257
- Title: DataScout: Automatic Data Fact Retrieval for Statement Augmentation with an LLM-Based Agent
- Title(参考訳): DataScout: LLMエージェントによるステートメント拡張のための自動データファクト検索
- Authors: Chuer Chen, Yuqi Liu, Danqing Shi, Shixiong Cao, Nan Cao,
- Abstract要約: DataScoutは、推論とスタンスベースのデータファクト検索を自動的に実行するインタラクティブシステムである。
インタフェースは、検索ツリーをマインドマップとして視覚化し、ユーザーが直感的に検索方向を操作できるようにする。
評価の結果,DataScoutはさまざまな立場から多面的データ事実を効果的に検索し,ユーザが自分の発言を検証し,ストーリーの信頼性を高めることができることがわかった。
- 参考スコア(独自算出の注目度): 18.424165885187968
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A data story typically integrates data facts from multiple perspectives and stances to construct a comprehensive and objective narrative. However, retrieving these facts demands time for data search and challenges the creator's analytical skills. In this work, we introduce DataScout, an interactive system that automatically performs reasoning and stance-based data facts retrieval to augment the user's statement. Particularly, DataScout leverages an LLM-based agent to construct a retrieval tree, enabling collaborative control of its expansion between users and the agent. The interface visualizes the retrieval tree as a mind map that eases users to intuitively steer the retrieval direction and effectively engage in reasoning and analysis. We evaluate the proposed system through case studies and in-depth expert interviews. Our evaluation demonstrates that DataScout can effectively retrieve multifaceted data facts from different stances, helping users verify their statements and enhance the credibility of their stories.
- Abstract(参考訳): データストーリーは通常、複数の視点とスタンスからデータ事実を統合し、包括的で客観的な物語を構築する。
しかし、これらの事実を取得するには、データ検索の時間が必要であり、クリエーターの分析スキルに挑戦する。
本研究では,ユーザの発言を増大させるために,推論と姿勢に基づくデータ事実検索を自動的に行う対話型システムであるDataScoutを紹介する。
特に、DataScoutはLLMベースのエージェントを利用して検索ツリーを構築し、ユーザとエージェント間の拡張の協調制御を可能にする。
このインタフェースは、検索ツリーをマインドマップとして視覚化し、ユーザが直感的に検索方向を操縦し、推論と分析を効果的に行うことができる。
ケーススタディと詳細な専門家インタビューを通じて,提案システムの評価を行った。
評価の結果,DataScoutはさまざまな立場から多面的データ事実を効果的に検索し,ユーザが自分の発言を検証し,ストーリーの信頼性を高めることができることがわかった。
関連論文リスト
- ReSpark: Leveraging Previous Data Reports as References to Generate New Reports with LLMs [27.314681131454908]
既存のデータレポートを参照として活用して新しいデータを生成するLLMベースの手法であるReSparkを提案する。
データテーブルが与えられた後、ReSparkは類似のトピックレポートを検索し、分析対象に対応する相互依存セグメントに解析し、新しいデータで実行する。
ReSparkを使うと、ユーザはリアルタイムのアウトプットをレビューしたり、新しい目的を挿入したり、レポートの内容を変更することができる。
論文 参考訳(メタデータ) (2025-02-04T14:00:32Z) - Understanding Synthetic Context Extension via Retrieval Heads [51.8869530817334]
本稿では,検索と推論を必要とする3つの長文タスクに対する合成データの微調整について検討する。
合成データに基づいてトレーニングされたモデルは、実際のデータには及ばないが、驚くべきことに、ミスマッチを解釈できる。
我々の結果は、合成データの微調整性能の解釈方法と、長期にわたる実世界の能力学習のためのより良いデータ作成方法に光を当てた。
論文 参考訳(メタデータ) (2024-10-29T17:55:00Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - Redefining Information Retrieval of Structured Database via Large Language Models [10.117751707641416]
本稿では,ChatLRと呼ばれる新しい検索拡張フレームワークを提案する。
主に、Large Language Models (LLM) の強力な意味理解能力を用いて、正確かつ簡潔な情報検索を実現する。
実験の結果、ChatLRがユーザクエリに対処する効果を示し、全体の情報検索精度は98.8%を超えた。
論文 参考訳(メタデータ) (2024-05-09T02:37:53Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z) - DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain
Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。
検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文 参考訳(メタデータ) (2023-10-31T04:37:57Z) - Instruct and Extract: Instruction Tuning for On-Demand Information
Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。
InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。
InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文 参考訳(メタデータ) (2023-10-24T17:54:25Z) - DataTales: Investigating the use of Large Language Models for Authoring
Data-Driven Articles [19.341156634212364]
大規模言語モデル(LLM)は、データ駆動記事の作成を支援する機会を提供する。
我々は LLM を利用したプロトタイプシステム DataTales を設計した。
デザインプローブとしてDataTalesを用いて,11人の専門家による質的研究を行い,その概念を評価した。
論文 参考訳(メタデータ) (2023-08-08T06:21:58Z) - Synergistic Interplay between Search and Large Language Models for
Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。
InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文 参考訳(メタデータ) (2023-05-12T11:58:15Z) - Demonstration of InsightPilot: An LLM-Empowered Automated Data
Exploration System [48.62158108517576]
本稿では,データ探索プロセスの簡略化を目的とした自動データ探索システムであるInsightPilotを紹介する。
InsightPilotは、理解、要約、説明などの適切な分析意図を自動的に選択する。
簡単に言うと、IQueryはデータ分析操作の抽象化と自動化であり、データアナリストのアプローチを模倣しています。
論文 参考訳(メタデータ) (2023-04-02T07:27:49Z) - Explaining Patterns in Data with Language Models via Interpretable
Autoprompting [143.4162028260874]
本稿では,データを説明する自然言語文字列を生成するアルゴリズムである,解釈可能なオートプロンプト(iPrompt)を提案する。
iPromptは、基盤となるデータセット記述を正確に見つけることで、意味のある洞察を得ることができる。
fMRIデータセットを用いた実験は、iPromptが科学的発見に役立つ可能性を示している。
論文 参考訳(メタデータ) (2022-10-04T18:32:14Z) - Interactive Data Analysis with Next-step Natural Language Query
Recommendation [34.264322423228556]
我々は,ユーザが適切な次ステップ探索行動を選択するのを支援するために,ステップワイズクエリレコメンデーションモジュールを備えたNLIを開発した。
このシステムは、ユーザーがクエリ履歴と結果をダッシュボードにまとめて、発見したデータインサイトを伝えるのに役立つ。
論文 参考訳(メタデータ) (2022-01-13T10:20:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。