論文の概要: ASTA: Learning Analytical Semantics over Tables for Intelligent Data
Analysis and Visualization
- arxiv url: http://arxiv.org/abs/2208.01043v1
- Date: Mon, 1 Aug 2022 13:32:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:50:38.940581
- Title: ASTA: Learning Analytical Semantics over Tables for Intelligent Data
Analysis and Visualization
- Title(参考訳): ASTA: インテリジェントデータ分析と可視化のためのテーブル上の解析的セマンティックス学習
- Authors: Lingbo Li, Tianle Li, Xinyi He, Mengyu Zhou, Shi Han, Dongmei Zhang
- Abstract要約: 本稿では,ユーザ生成分析の背後にある共通分析パターンを明らかにするために,テーブル上の解析意味論を提案する。
本稿では,ユーザ意図からデータ焦点を分離し,データと人間の視点からユーザモチベーションを抽出して分析意味論を設計する。
また,知的テーブル分析を実証するために,初めて条件付きフォーマッティングを推奨するとともに,チャートレコメンデーションも提案する。
- 参考スコア(独自算出の注目度): 32.06228510098419
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent analysis and visualization of tables use techniques to
automatically recommend useful knowledge from data, thus freeing users from
tedious multi-dimension data mining. While many studies have succeeded in
automating recommendations through rules or machine learning, it is difficult
to generalize expert knowledge and provide explainable recommendations. In this
paper, we present the recommendation of conditional formatting for the first
time, together with chart recommendation, to exemplify intelligent table
analysis. We propose analytical semantics over tables to uncover common
analysis pattern behind user-created analyses. Here, we design analytical
semantics by separating data focus from user intent, which extract the user
motivation from data and human perspective respectively. Furthermore, the ASTA
framework is designed by us to apply analytical semantics to multiple automated
recommendations. ASTA framework extracts data features by designing signatures
based on expert knowledge, and enables data referencing at field- (chart) or
cell-level (conditional formatting) with pre-trained models. Experiments show
that our framework achieves recall at top 1 of 62.86% on public chart corpora,
outperforming the best baseline about 14%, and achieves 72.31% on the collected
corpus ConFormT, validating that ASTA framework is effective in providing
accurate and explainable recommendations.
- Abstract(参考訳): テーブルのインテリジェントな分析と視覚化は、データから有用な知識を自動的に推奨するために技術を使用する。
多くの研究が規則や機械学習によるレコメンデーションの自動化に成功しているが、専門家の知識を一般化し、説明可能なレコメンデーションを提供することは困難である。
本稿では,知的テーブル分析を実証するために,初めて条件付きフォーマッティングを推奨し,チャートレコメンデーションとともに提案する。
本稿では,テーブル上の分析意味論を提案し,ユーザ生成分析の背後にある共通分析パターンを明らかにする。
本稿では,ユーザ意図からデータ焦点を分離して分析意味を設計し,データと人間の視点からユーザモチベーションを抽出する。
さらに、ASTAフレームワークは、複数の自動レコメンデーションに分析的セマンティクスを適用するように設計されている。
ASTAフレームワークは、専門家の知識に基づいてシグネチャを設計することでデータの特徴を抽出し、事前訓練されたモデルでフィールド(チャート)やセルレベルのデータ参照を可能にする。
実験により,我々のフレームワークは,公開チャートコーパスの62.86%中1位でリコールを達成し,最高ベースラインを約14%上回り,収集されたコーパス適合度で72.31%を達成し,astaフレームワークが正確かつ説明可能なレコメンデーションの提供に有効であることを確認した。
関連論文リスト
- InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.09622602860703]
3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文 参考訳(メタデータ) (2024-07-08T22:06:09Z) - KET-QA: A Dataset for Knowledge Enhanced Table Question Answering [63.56707527868466]
本研究では,TableQAの外部知識源として知識ベース(KB)を用いることを提案する。
すべての質問は、答えるテーブルとサブグラフの両方からの情報を統合する必要がある。
我々は,膨大な知識サブグラフから関連する情報を抽出するために,レトリバー・レゾナー構造パイプラインモデルを設計する。
論文 参考訳(メタデータ) (2024-05-13T18:26:32Z) - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation [83.30006900263744]
データ分析は、詳細な研究と決定的な洞察を生み出すための重要な分析プロセスである。
LLMのコード生成機能を活用した高品質な応答アノテーションの自動生成を提案する。
我々のDACO-RLアルゴリズムは、57.72%のケースにおいて、SFTモデルよりも有用な回答を生成するために、人間のアノテータによって評価される。
論文 参考訳(メタデータ) (2024-03-04T22:47:58Z) - Text2Analysis: A Benchmark of Table Question Answering with Advanced
Data Analysis and Unclear Queries [67.0083902913112]
高度な解析タスクを取り入れたText2Analysisベンチマークを開発した。
また,5つのイノベーティブかつ効果的なアノテーション手法を開発した。
3つの異なる指標を用いて5つの最先端モデルを評価する。
論文 参考訳(メタデータ) (2023-12-21T08:50:41Z) - Instruct and Extract: Instruction Tuning for On-Demand Information
Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。
InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。
InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文 参考訳(メタデータ) (2023-10-24T17:54:25Z) - ReTAG: Reasoning Aware Table to Analytic Text Generation [12.603569641254417]
ReTAGは、ベクトル量子化を用いて異なるタイプの解析的推論を出力に注入するテーブルおよび推論認識モデルである。
私たちは、ToTTo、InfoTabsデータセットを参照文毎に推論カテゴリで拡張(そして、オープンソースの35.6K分析、55.9k記述インスタンス)します。
論文 参考訳(メタデータ) (2023-05-19T17:03:09Z) - A Visual Analytics Approach to Building Logistic Regression Models and
its Application to Health Records [0.0]
本研究では,高次元データセットにおける回帰モデルの生成,評価,適用のためのオープンな統一手法を提案する。
このアプローチは、属性に対する広い相関パノラマを公開することに基づいており、ユーザーは関連する属性を選択して予測モデルを構築して評価することができる。
我々は、コビッド19やその他の人工的および実際の健康記録データの解析に、我々のフレームワークを応用して、UCRegの有効性と効率を実証する。
論文 参考訳(メタデータ) (2022-01-20T19:53:41Z) - Categorical exploratory data analysis on goodness-of-fit issues [0.6091702876917279]
我々はCategorical Exploratory Data Analysis (CEDA)と呼ばれるデータ分析パラダイムを活用することを提案する。
CEDAは、複数の重要な分散的な側面を通じて、各データがモデル形状に適合するか、どのように一致するかを明らかにします。
我々は,CEDAをデータサイエンス教育におけるデータ分析の第一の方法として活用することの利点を,グラフィック表示により明らかにする。
論文 参考訳(メタデータ) (2020-11-19T06:11:06Z) - Goal-driven Command Recommendations for Analysts [2.1751694495249914]
本研究では,非構造化ログを活用することで,ユーザに対して目標駆動型データコマンドレコメンデーションを提供するフレームワークを提案する。
私たちは、Webベースの分析ソフトウェアのログデータを使用して、ニューラルネットワークモデルをトレーニングし、そのパフォーマンスを定量化します。
また,提案手法を用いて,提案手法の目標方向の度合いを推定する評価指標を提案する。
論文 参考訳(メタデータ) (2020-11-12T07:26:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。