論文の概要: FormaT5: Abstention and Examples for Conditional Table Formatting with
Natural Language
- arxiv url: http://arxiv.org/abs/2310.17306v3
- Date: Wed, 1 Nov 2023 17:31:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-02 10:47:53.937228
- Title: FormaT5: Abstention and Examples for Conditional Table Formatting with
Natural Language
- Title(参考訳): format5: 自然言語を用いた条件付きテーブルフォーマッティングの省略と例
- Authors: Mukul Singh, Jos\'e Cambronero, Sumit Gulwani, Vu Le, Carina Negreanu,
Elnaz Nouri, Mohammad Raza, Gust Verbruggen
- Abstract要約: FormaT5は、テーブルの条件付きフォーマットルールを生成するトランスフォーマーベースのモデルである。
これらのタスクのユーザ記述は、しばしば不明確か曖昧であり、コード生成システムが所望のルールを正確に学習することが難しくなる。
FormaT5がプレースホルダーを予測することを学習するが、このプレースホルダーは第2のモデルで満たされるか、あるいはフォーマットすべき行の例を、プログラム・バイ・サンプル・システムで利用できる。
- 参考スコア(独自算出の注目度): 20.014372488951533
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Formatting is an important property in tables for visualization,
presentation, and analysis. Spreadsheet software allows users to automatically
format their tables by writing data-dependent conditional formatting (CF)
rules. Writing such rules is often challenging for users as it requires them to
understand and implement the underlying logic. We present FormaT5, a
transformer-based model that can generate a CF rule given the target table and
a natural language description of the desired formatting logic. We find that
user descriptions for these tasks are often under-specified or ambiguous,
making it harder for code generation systems to accurately learn the desired
rule in a single step. To tackle this problem of under-specification and
minimise argument errors, FormaT5 learns to predict placeholders though an
abstention objective. These placeholders can then be filled by a second model
or, when examples of rows that should be formatted are available, by a
programming-by-example system. To evaluate FormaT5 on diverse and real
scenarios, we create an extensive benchmark of 1053 CF tasks, containing
real-world descriptions collected from four different sources. We release our
benchmarks to encourage research in this area. Abstention and filling allow
FormaT5 to outperform 8 different neural approaches on our benchmarks, both
with and without examples. Our results illustrate the value of building
domain-specific learning systems.
- Abstract(参考訳): フォーマッティングは、視覚化、プレゼンテーション、分析のためのテーブルの重要な特性である。
スプレッドシートソフトウェアは、データに依存した条件付きフォーマット(cf)ルールを書くことで自動的にテーブルをフォーマットできる。
このようなルールを書くことは、基礎となるロジックを理解し実装する必要があるため、ユーザにとってしばしば困難である。
FormaT5は、対象のテーブルに与えられたCFルールと、所望のフォーマットロジックの自然言語記述を生成できるトランスフォーマーベースのモデルである。
これらのタスクのユーザ記述は、しばしば不特定または曖昧であり、コード生成システムは、望ましいルールを1ステップで正確に学習することが困難である。
この問題に対処し、引数エラーを最小限に抑えるため、form5は放棄目的にもかかわらずプレースホルダーを予測することを学ぶ。
これらのプレースホルダーは、第2のモデルで満たされるか、あるいはフォーマットすべき行の例を、プログラム・バイ・サンプル・システムで利用できる。
FormaT5を多種多様な実シナリオで評価するために、我々は4つの異なるソースから収集された実世界の記述を含む1053のCFタスクの広範なベンチマークを作成する。
私たちはこの分野の研究を促進するためにベンチマークをリリースします。
回避と充填により、form5は8つの異なるニューラルアプローチをベンチマークで比較できます。
本研究は、ドメイン固有の学習システムを構築することの価値を示す。
関連論文リスト
- Learning Metadata-Agnostic Representations for Text-to-SQL In-Context Example Selection [0.3277163122167434]
In-context Learning(ICL)は、大きな言語モデル(LLM)がプロンプトに追加されたタスクデモの恩恵を受ける強力なパラダイムである。
本稿では,自然言語質問の表現と,共有埋め込み空間におけるクエリの表現を整列する手法を提案する。
我々の手法はMARLOと呼ばれ、クエリ構造を用いてデータベースメタデータを過剰にインデクシングすることなくクエリインテントをモデル化する。
論文 参考訳(メタデータ) (2024-10-17T21:45:55Z) - FLEXTAF: Enhancing Table Reasoning with Flexible Tabular Formats [48.47559543509975]
フレキシブルフォーマットを用いてテーブル推論性能を向上させるためのFLEXTAF-SingleとFLEXTAF-Voteを提案する。
WikiTableQuestionsとTabFactに関する我々の実験は、平均的な2.3%と4.8%の大幅な改善を示している。
論文 参考訳(メタデータ) (2024-08-16T17:00:11Z) - WikiTableEdit: A Benchmark for Table Editing by Natural Language
Instruction [56.196512595940334]
本稿では,表編集作業におけるLarge Language Models(LLM)の性能について検討する。
Wikiデータセットから26,531のテーブルを活用し、6つの異なる基本操作のための自然言語命令を生成する。
WikiTableEditデータセット上でいくつかの代表的大規模言語モデルを評価し,その課題を実証する。
論文 参考訳(メタデータ) (2024-03-05T13:33:12Z) - Eliciting Human Preferences with Language Models [56.68637202313052]
言語モデル(LM)は、ラベル付き例や自然言語のプロンプトを使用してターゲットタスクを実行するように指示することができる。
タスク仕様プロセスのガイドには*LM自身を使うことを提案します。
我々は、メール検証、コンテンツレコメンデーション、道徳的推論の3つの領域でGATEを研究している。
論文 参考訳(メタデータ) (2023-10-17T21:11:21Z) - Quantifying Language Models' Sensitivity to Spurious Features in Prompt Design or: How I learned to start worrying about prompt formatting [68.19544657508509]
言語モデル(LLM)は、言語技術の基本コンポーネントとして採用されている。
いくつかの広く使われているオープンソースLLMは、数ショット設定でプロンプトフォーマットの微妙な変更に対して非常に敏感であることがわかった。
本稿では,与えられたタスクに対して有効なプロンプトフォーマットのサンプルセットを迅速に評価するアルゴリズムを提案し,モデル重み付けにアクセスせずに期待性能の間隔を報告する。
論文 参考訳(メタデータ) (2023-10-17T15:03:30Z) - Demonstration of CORNET: A System For Learning Spreadsheet Formatting
Rules By Example [17.187094058627615]
CORNETは条件付きフォーマットルールをユーザ例から学習するシステムである。
このデモでは、Microsoft Excelのシンプルなアドインとして、CORNETが動作していることを示す。
論文 参考訳(メタデータ) (2023-08-14T14:15:03Z) - CORNET: A neurosymbolic approach to learning conditional table
formatting rules by example [9.480976802275823]
我々は,データ依存型フォーマットルールを自動的に学習する新しい問題に対処する,ニューロシンボリックシステムであるCORNETを提案する。
CORNETは、帰納的プログラム合成からインスピレーションを得て、半教師付きクラスタリングと反復的決定木学習に基づくシンボリックルール列挙を組み合わせた。
以上の結果から,CORNETは,これらのベースラインと比較して,様々な条件で,より正確にルールを学習できることがわかった。
論文 参考訳(メタデータ) (2022-08-11T20:30:12Z) - Logical Reasoning for Task Oriented Dialogue Systems [57.440956636333325]
本稿では,ロバータやT5などの変圧器モデルに対して,与えられた対話コンテキストにおける事実の集合を推論する新しい手法を提案する。
本手法は,モデルが論理関係を学習するのに役立つ合成データ生成機構を含む。
対話コンテキストが全ての必要な情報を含む場合、変換器に基づくモデルが論理的推論を行い、質問に答えることを示す。
論文 参考訳(メタデータ) (2022-02-08T21:46:27Z) - Towards Question Format Independent Numerical Reasoning: A Set of
Prerequisite Tasks [23.72187153601608]
NUMBERGAMEは,8種類の多種形式の数値推論タスクにまたがるモデル性能を評価するための多面的ベンチマークである。
私たちが新たに加えた2つのタイプは、外部の数値知識、常識知識、ドメイン知識を必要とする質問に関するものです。
より実用的な数値推論システムを構築するために、NUMBERGAMEは数値推論以外の4つの機能を必要としている。
論文 参考訳(メタデータ) (2020-05-18T08:14:04Z) - ToTTo: A Controlled Table-To-Text Generation Dataset [61.83159452483026]
ToTToはオープンドメインの英語のテーブル・トゥ・テキストのデータセットで、12万以上のトレーニングサンプルがある。
本稿では、ウィキペディアから既存の候補文を直接修正するデータセット構築プロセスを紹介する。
通常流動的であるが、既存の方法は多くの場合、表がサポートしていないフレーズを幻覚させる。
論文 参考訳(メタデータ) (2020-04-29T17:53:45Z) - TAPAS: Weakly Supervised Table Parsing via Pre-training [16.661382998729067]
論理形式を生成せずにテーブル上で質問応答を行う手法であるTAPASを提案する。
我々は3つの異なる意味解析データセットを実験した。
TAPASは、最先端の精度を向上させることにより、セマンティックパーシングモデルよりも優れているか、あるいは競合することがわかった。
論文 参考訳(メタデータ) (2020-04-05T23:18:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。