論文の概要: CORNET: A neurosymbolic approach to learning conditional table
formatting rules by example
- arxiv url: http://arxiv.org/abs/2208.06032v1
- Date: Thu, 11 Aug 2022 20:30:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-15 13:44:13.107529
- Title: CORNET: A neurosymbolic approach to learning conditional table
formatting rules by example
- Title(参考訳): CORNET: 条件付き表形式規則の学習におけるニューロシンボリックアプローチ
- Authors: Mukul Singh, Jos\'e Cambronero, Sumit Gulwani, Vu Le, Carina Negreanu,
Mohammad Raza, Gust Verbruggen
- Abstract要約: 我々は,データ依存型フォーマットルールを自動的に学習する新しい問題に対処する,ニューロシンボリックシステムであるCORNETを提案する。
CORNETは、帰納的プログラム合成からインスピレーションを得て、半教師付きクラスタリングと反復的決定木学習に基づくシンボリックルール列挙を組み合わせた。
以上の結果から,CORNETは,これらのベースラインと比較して,様々な条件で,より正確にルールを学習できることがわかった。
- 参考スコア(独自算出の注目度): 9.480976802275823
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spreadsheets are widely used for table manipulation and presentation.
Stylistic formatting of these tables is an important property for both
presentation and analysis. As a result, popular spreadsheet software, such as
Excel, supports automatically formatting tables based on data-dependent rules.
Unfortunately, writing these formatting rules can be challenging for users as
that requires knowledge of the underlying rule language and data logic. In this
paper, we present CORNET, a neuro-symbolic system that tackles the novel
problem of automatically learning such formatting rules from user examples of
formatted cells. CORNET takes inspiration from inductive program synthesis and
combines symbolic rule enumeration, based on semi-supervised clustering and
iterative decision tree learning, with a neural ranker to produce conditional
formatting rules. To motivate and evaluate our approach, we extracted tables
with formatting rules from a corpus of over 40K real spreadsheets. Using this
data, we compared CORNET to a wide range of symbolic and neural baselines. Our
results show that CORNET can learn rules more accurately, across varying
conditions, compared to these baselines. Beyond learning rules from user
examples, we present two case studies to motivate additional uses for CORNET:
simplifying user conditional formatting rules and recovering rules even when
the user may have manually formatted their data.
- Abstract(参考訳): スプレッドシートはテーブル操作やプレゼンテーションに広く使われている。
これらの表のスタイリスティックな形式化は、プレゼンテーションと分析の両方にとって重要な特性である。
その結果、excelのような人気のあるスプレッドシートソフトウェアは、データ依存のルールに基づいたテーブルの自動フォーマットをサポートする。
残念ながら、これらのフォーマットルールの記述は、基礎となるルール言語とデータロジックの知識を必要とするため、ユーザにとって難しい場合がある。
本稿では,このようなフォーマットルールをユーザ例から自動的に学習する新しい問題に対処する,ニューロシンボリックシステムであるCORNETを提案する。
cornetは帰納的プログラム合成からインスピレーションを得て、半教師付きクラスタリングと反復決定木学習に基づくシンボリックルール列挙と、条件付きフォーマットルールを生成するニューラルネットワークランカを組み合わせた。
提案手法のモチベーションと評価のために,40万以上の実スプレッドシートからなるコーパスからフォーマットルール付きテーブルを抽出した。
このデータを用いて、CORNETを幅広い記号的および神経的ベースラインと比較した。
以上の結果から,CORNETは,これらのベースラインと比較して,様々な条件で,より正確にルールを学習できることがわかった。
ユーザが手動でデータをフォーマットした場合でも,ユーザの条件付きフォーマットルールを簡素化し,ルールを回復するという,CORNETのさらなる利用を動機付けるための2つのケーススタディを提示した。
関連論文リスト
- Symbolic Working Memory Enhances Language Models for Complex Rule Application [87.34281749422756]
大規模言語モデル(LLM)は、顕著な推論性能を示しているが、多段階の推論に苦慮している。
本稿では,外部ワーキングメモリを用いたLLMの拡張と,ルール適用のためのニューロシンボリックフレームワークを提案する。
当社のフレームワークは,LLMベースのルール実装とシンボリックルールグラウンディングを反復的に実施する。
論文 参考訳(メタデータ) (2024-08-24T19:11:54Z) - Auto-Formula: Recommend Formulas in Spreadsheets using Contrastive Learning for Table Representations [36.2969566996675]
我々は,ユーザがターゲットのスプレッドシートセルで書きたい公式を正確に予測するオートフォーミュラシステムを開発した。
コンピュータビジョンの「類似顔認識」にインスパイアされたコントラスト学習技術を用いている。
論文 参考訳(メタデータ) (2024-04-19T03:28:18Z) - Studying and Recommending Information Highlighting in Stack Overflow Answers [47.98908661334215]
Stack Overflowの回答は31,169,429件でした。
推薦モデルのトレーニングには、CNNベースのモデルとBERTベースのモデルを選択します。
我々のモデルは、異なるフォーマットで0.50から0.72の精度を達成する。
論文 参考訳(メタデータ) (2024-01-03T00:13:52Z) - FormaT5: Abstention and Examples for Conditional Table Formatting with
Natural Language [20.014372488951533]
FormaT5は、テーブルの条件付きフォーマットルールを生成するトランスフォーマーベースのモデルである。
これらのタスクのユーザ記述は、しばしば不明確か曖昧であり、コード生成システムが所望のルールを正確に学習することが難しくなる。
FormaT5がプレースホルダーを予測することを学習するが、このプレースホルダーは第2のモデルで満たされるか、あるいはフォーマットすべき行の例を、プログラム・バイ・サンプル・システムで利用できる。
論文 参考訳(メタデータ) (2023-10-26T11:05:15Z) - Demonstration of CORNET: A System For Learning Spreadsheet Formatting
Rules By Example [17.187094058627615]
CORNETは条件付きフォーマットルールをユーザ例から学習するシステムである。
このデモでは、Microsoft Excelのシンプルなアドインとして、CORNETが動作していることを示す。
論文 参考訳(メタデータ) (2023-08-14T14:15:03Z) - SpreadsheetCoder: Formula Prediction from Semi-structured Context [70.41579328458116]
行ベースと列ベースの両方のフォーマットで表されるコンテキストを表現するために,BERTベースのモデルアーキテクチャを提案する。
我々はスプレッドシートの大きなデータセットでモデルをトレーニングし、SpreadsheetCoderが42.51%の予測精度でトップ1の予測を達成できることを実証した。
ルールベースのシステムと比較すると、SpreadsheetCoder 82%は、Google Sheetsで公式を作成する上で、より多くのユーザを支援する。
論文 参考訳(メタデータ) (2021-06-26T11:26:27Z) - TGRNet: A Table Graph Reconstruction Network for Table Structure
Recognition [76.06530816349763]
本稿では,表構造認識のためのエンドツーエンドのトレーニング可能な表グラフ再構成ネットワーク(TGRNet)を提案する。
具体的には,異なる細胞の空間的位置と論理的位置を共同で予測するために,細胞検出枝と細胞論理的位置分岐の2つの主枝を有する。
論文 参考訳(メタデータ) (2021-06-20T01:57:05Z) - LNN-EL: A Neuro-Symbolic Approach to Short-text Entity Linking [62.634516517844496]
本稿では,解釈可能なルールとニューラルネットワークの性能を併用したニューラルシンボリックアプローチであるLNN-ELを提案する。
ルールの使用に制約があるにもかかわらず、LNN-ELはSotAのブラックボックスニューラルアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-17T20:22:45Z) - ToTTo: A Controlled Table-To-Text Generation Dataset [61.83159452483026]
ToTToはオープンドメインの英語のテーブル・トゥ・テキストのデータセットで、12万以上のトレーニングサンプルがある。
本稿では、ウィキペディアから既存の候補文を直接修正するデータセット構築プロセスを紹介する。
通常流動的であるが、既存の方法は多くの場合、表がサポートしていないフレーズを幻覚させる。
論文 参考訳(メタデータ) (2020-04-29T17:53:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。