論文の概要: Mirror: A Natural Language Interface for Data Querying, Summarization,
and Visualization
- arxiv url: http://arxiv.org/abs/2303.08697v1
- Date: Wed, 15 Mar 2023 15:31:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-16 13:12:05.101576
- Title: Mirror: A Natural Language Interface for Data Querying, Summarization,
and Visualization
- Title(参考訳): Mirror: データクエリ、要約、可視化のための自然言語インターフェース
- Authors: Canwen Xu and Julian McAuley and Penghan Wang
- Abstract要約: Mirrorは、大規模な言語モデルを活用したデータ探索と分析のためのオープンソースのプラットフォームである。
Mirrorはデータベースをクエリするための直感的な自然言語インターフェースを提供する。
Mirrorはまた、データの理解を容易にするために視覚化を生成する。
- 参考スコア(独自算出の注目度): 11.807687905883895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Mirror, an open-source platform for data exploration and analysis
powered by large language models. Mirror offers an intuitive natural language
interface for querying databases, and automatically generates executable SQL
commands to retrieve relevant data and summarize it in natural language. In
addition, users can preview and manually edit the generated SQL commands to
ensure the accuracy of their queries. Mirror also generates visualizations to
facilitate understanding of the data. Designed with flexibility and human input
in mind, Mirror is suitable for both experienced data analysts and
non-technical professionals looking to gain insights from their data.
- Abstract(参考訳): 大規模言語モデルを活用したデータ探索と分析のためのオープンソースプラットフォームであるmirrorを提案する。
Mirrorはデータベースをクエリするための直感的な自然言語インターフェースを提供し、実行可能SQLコマンドを自動的に生成して関連するデータを取得し、自然言語で要約する。
さらに、生成されたsqlコマンドのプレビューと手作業による編集も可能で、クエリの正確性が保証される。
mirrorはデータの理解を容易にするためにビジュアライゼーションも生成する。
柔軟性と人間の入力を念頭に置いて設計されたmirrorは、経験豊富なデータアナリストと、データから洞察を得ようとする非技術専門家の両方に適している。
関連論文リスト
- Prompt4Vis: Prompting Large Language Models with Example Mining and
Schema Filtering for Tabular Data Visualization [13.425454489560376]
本稿では,自然言語からデータビジュアライゼーションクエリを生成するフレームワークであるPrompt4Visを紹介する。
データビジュアライゼーションクエリを生成するためのテキスト・ツー・ビジュアリーに、インコンテキスト・ラーニングが導入される。
Prompt4Visは最先端(SOTA)のRGVisNetを約35.9%、開発とテストセットで71.3%上回っている。
論文 参考訳(メタデータ) (2024-01-29T10:23:47Z) - Natural Language Interfaces for Tabular Data Querying and Visualization:
A Survey [31.995783935364706]
大規模言語モデル(LLM)の台頭はこの分野をさらに進歩させ、自然言語処理技術のための新たな道を開いた。
本稿では,これらのインターフェースの基礎となる基本概念と技術を紹介し,セマンティック解析に特に重点を置いている。
この中には、LSMの影響を深く掘り下げ、その強み、制限、将来の改善の可能性を強調している。
論文 参考訳(メタデータ) (2023-10-27T05:01:20Z) - Natural Language Models for Data Visualization Utilizing nvBench Dataset [6.996262696260261]
自然言語翻訳モデルを構築し、Vega Zeroと呼ばれる言語でデータと視覚化クエリの簡易バージョンを構築する。
本稿では,シーケンシャルトランスフォーマーに基づく機械学習モデルアーキテクチャの設計と性能について検討する。
論文 参考訳(メタデータ) (2023-10-02T00:48:01Z) - QTSumm: Query-Focused Summarization over Tabular Data [58.62152746690958]
人々は主に、データ分析を行うか、特定の質問に答えるためにテーブルをコンサルティングします。
そこで本研究では,テキスト生成モデルに人間的な推論を行なわなければならない,クエリ中心のテーブル要約タスクを新たに定義する。
このタスクには,2,934テーブル上の7,111の人間注釈付きクエリ-サマリーペアを含む,QTSummという新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:43:51Z) - Demonstration of InsightPilot: An LLM-Empowered Automated Data
Exploration System [48.62158108517576]
本稿では,データ探索プロセスの簡略化を目的とした自動データ探索システムであるInsightPilotを紹介する。
InsightPilotは、理解、要約、説明などの適切な分析意図を自動的に選択する。
簡単に言うと、IQueryはデータ分析操作の抽象化と自動化であり、データアナリストのアプローチを模倣しています。
論文 参考訳(メタデータ) (2023-04-02T07:27:49Z) - Querying Large Language Models with SQL [16.383179496709737]
多くのユースケースでは、情報はテキストに格納されるが、構造化データでは利用できない。
事前訓練されたLarge Language Models (LLMs) の台頭に伴い、大量のテキストコーパスから抽出された情報を保存および使用するための効果的なソリューションが現在存在する。
本稿では,従来のデータベースアーキテクチャに基づくプロトタイプであるGaloisについて紹介する。
論文 参考訳(メタデータ) (2023-04-02T06:58:14Z) - Using Large Language Models to Generate Engaging Captions for Data
Visualizations [51.98253121636079]
大規模言語モデル(LLM)は、高度なディープラーニング技術を用いて人間のような散文を生成する。
主な課題は、プロンプトエンジニアリングと呼ばれるLLMの最も効果的なプロンプトを設計することである。
我々は,LLM GPT-3を用いた最初の実験について報告し,いくつかの有望な結果を得た。
論文 参考訳(メタデータ) (2022-12-27T23:56:57Z) - XRICL: Cross-lingual Retrieval-Augmented In-Context Learning for
Cross-lingual Text-to-SQL Semantic Parsing [70.40401197026925]
大規模言語モデルを用いたインコンテキスト学習は、最近セマンティック解析タスクの驚くべき結果を示している。
この研究は、あるクエリに対して関連する英語の例を検索する学習を行うXRICLフレームワークを導入している。
また、大規模言語モデルの翻訳プロセスを容易にするために、対象言語に対するグローバルな翻訳例も含んでいる。
論文 参考訳(メタデータ) (2022-10-25T01:33:49Z) - Augmenting Multi-Turn Text-to-SQL Datasets with Self-Play [46.07002748587857]
我々は、コンテキスト情報を活用して新しいインタラクションを合成するセルフプレイによるトレーニングデータセットの強化について検討する。
本研究では,SParCとCoという2つの広く使われているテキスト・ドメイン・データセットの強いベースラインの精度を向上させることを発見した。
論文 参考訳(メタデータ) (2022-10-21T16:40:07Z) - Explaining Patterns in Data with Language Models via Interpretable
Autoprompting [143.4162028260874]
本稿では,データを説明する自然言語文字列を生成するアルゴリズムである,解釈可能なオートプロンプト(iPrompt)を提案する。
iPromptは、基盤となるデータセット記述を正確に見つけることで、意味のある洞察を得ることができる。
fMRIデータセットを用いた実験は、iPromptが科学的発見に役立つ可能性を示している。
論文 参考訳(メタデータ) (2022-10-04T18:32:14Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。