論文の概要: API-Assisted Code Generation for Question Answering on Varied Table
Structures
- arxiv url: http://arxiv.org/abs/2310.14687v1
- Date: Mon, 23 Oct 2023 08:26:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 21:27:09.586317
- Title: API-Assisted Code Generation for Question Answering on Varied Table
Structures
- Title(参考訳): 多様な表構造に対する質問応答のためのapi支援コード生成
- Authors: Yihan Cao, Shuyi Chen, Ryan Liu, Zhiruo Wang, Daniel Fried
- Abstract要約: 実行可能プログラムの生成によるテーブル質問応答(TableQA)の永続的課題は、様々なテーブル構造に適応している。
本稿では,多次元パンダデータフレームとして構造化テーブルの統一表現を提供する統合テーブルQAフレームワークを提案する。
プログラム機能の拡張と外部知識による複雑なリレーショナル質問に答えるために、我々のフレームワークはPythonプログラムが呼び出すことのできるカスタマイズされたAPIを可能にします。
- 参考スコア(独自算出の注目度): 18.65003956496509
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A persistent challenge to table question answering (TableQA) by generating
executable programs has been adapting to varied table structures, typically
requiring domain-specific logical forms. In response, this paper introduces a
unified TableQA framework that: (1) provides a unified representation for
structured tables as multi-index Pandas data frames, (2) uses Python as a
powerful querying language, and (3) uses few-shot prompting to translate NL
questions into Python programs, which are executable on Pandas data frames.
Furthermore, to answer complex relational questions with extended program
functionality and external knowledge, our framework allows customized APIs that
Python programs can call. We experiment with four TableQA datasets that involve
tables of different structures -- relational, multi-table, and hierarchical
matrix shapes -- and achieve prominent improvements over past state-of-the-art
systems. In ablation studies, we (1) show benefits from our multi-index
representation and APIs over baselines that use only an LLM, and (2)
demonstrate that our approach is modular and can incorporate additional APIs.
- Abstract(参考訳): 実行可能プログラムの生成による質問応答(TableQA)のテーブル化への挑戦は、通常ドメイン固有の論理形式を必要とする様々なテーブル構造に適応している。
そこで本研究では,(1)マルチインデックスPandasデータフレームとして構造化テーブルの統一表現を提供し,(2)Pythonを強力なクエリ言語として使用し,(3)NL質問をPythonプログラムに変換し,Pandasデータフレーム上で実行可能にする。
さらに,プログラム機能の拡張と外部知識を備えた複雑なリレーショナルな質問に答えるため,pythonプログラムが呼び出すカスタマイズapiも提供する。
異なる構造のテーブル(リレーショナル、マルチテーブル、階層行列)を含む4つのテーブルqaデータセットを実験し、過去の最先端システムに対して顕著な改善を達成します。
アブレーション研究では,(1)LLMのみを使用するベースライン上のマルチインデックス表現とAPIの利点を示し,(2)アプローチがモジュール化されており,追加APIを組み込むことができることを示す。
関連論文リスト
- HiddenTables & PyQTax: A Cooperative Game and Dataset For TableQA to Ensure Scale and Data Privacy Across a Myriad of Taxonomies [9.09415727445941]
本稿では,この課題に対する潜在的な解決法として,HiddenTablesと呼ばれる協調ゲームを提案する。
エージェントがテーブルQAタスクを解く能力を評価するコード生成「r」と「Oracleウィンドウ」の間で「HiddenTables」が再生される。
複雑なクエリを一般化および実行できないLCMの集合性を実証する多種多様なテーブルの集合について明らかな実験を行う。
論文 参考訳(メタデータ) (2024-06-16T04:53:29Z) - PyTorch Frame: A Modular Framework for Multi-Modal Tabular Learning [54.912520425218496]
PyTorch Frame は PyTorch をベースとした多モード表データの深層学習フレームワークである。
モジュラー方式で多種多様なモデルを実装することにより,PyTorch Frameの有用性を示す。
我々は、グラフニューラルネットワーク(GNN)のためのPyTorchライブラリであるPyTorch GeometricとPyTorch Frameを統合し、関係データベース上でエンドツーエンドの学習を行う。
論文 参考訳(メタデータ) (2024-03-31T19:15:09Z) - Augment before You Try: Knowledge-Enhanced Table Question Answering via
Table Expansion [57.53174887650989]
テーブル質問応答は、構造化されたデータを理解し、相互作用するモデルの能力を評価する一般的なタスクである。
既存の方法は表と外部の知識の両方をテキストに変換し、表の構造的な性質を無視する。
そこで本稿では,表に外部情報を統合するための簡易で効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-01-28T03:37:11Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - TableQAKit: A Comprehensive and Practical Toolkit for Table-based
Question Answering [23.412691101965414]
TableQAKitは、TableQA専用に設計された最初の総合ツールキットである。
TableQAKitは、ビジュアル操作を含むインタラクティブなインターフェースと、使いやすい包括的なデータを備えたオープンソースである。
論文 参考訳(メタデータ) (2023-10-23T16:33:23Z) - MultiTabQA: Generating Tabular Answers for Multi-Table Question
Answering [61.48881995121938]
実世界のクエリは本質的に複雑で、リレーショナルデータベースやWebページ内の複数のテーブルにまたがることが多い。
我々のモデルであるMultiTabQAは、複数のテーブル上の質問に答えるだけでなく、表形式の回答を生成するために一般化する。
論文 参考訳(メタデータ) (2023-05-22T08:25:15Z) - Table Retrieval May Not Necessitate Table-specific Model Design [83.27735758203089]
テーブル検索のタスクに焦点をあてて、"テーブル固有のモデル設計はテーブル検索に必要か?
自然質問データセット (NQ-table) の表に基づく分析の結果, 70%以上の症例では構造が無視できる役割を担っていることがわかった。
次に、テーブル構造、すなわち補助列/カラム埋め込み、ハードアテンションマスク、ソフトリレーションに基づくアテンションバイアスを明示的にエンコードする3つのモジュールを実験する。
いずれも大きな改善は得られず、テーブル固有のモデル設計がテーブル検索に不要である可能性が示唆された。
論文 参考訳(メタデータ) (2022-05-19T20:35:23Z) - Retrieving Complex Tables with Multi-Granular Graph Representation
Learning [20.72341939868327]
自然言語テーブル検索の課題は,自然言語クエリに基づいて意味的に関連するテーブルを検索することである。
既存の学習システムは、テーブルがデータフレームとして構成されているという仮定に基づいて、テーブルをプレーンテキストとして扱う。
多粒グラフ表現学習を用いた一般化可能なNLTRフレームワークであるグラフベーステーブル検索(GTR)を提案する。
論文 参考訳(メタデータ) (2021-05-04T20:19:03Z) - "What Do You Mean by That?" A Parser-Independent Interactive Approach
for Enhancing Text-to-SQL [49.85635994436742]
ループ内に人間を包含し,複数質問を用いてユーザと対話する,新規非依存型対話型アプローチ(PIIA)を提案する。
PIIAは、シミュレーションと人的評価の両方を用いて、限られたインタラクションターンでテキストとドメインのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-11-09T02:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。