論文の概要: Tabularis Formatus: Predictive Formatting for Tables
- arxiv url: http://arxiv.org/abs/2508.11121v1
- Date: Thu, 14 Aug 2025 23:54:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-18 14:51:23.696986
- Title: Tabularis Formatus: Predictive Formatting for Tables
- Title(参考訳): Tabularis Formatus: テーブルの予測フォーマッティング
- Authors: Mukul Singh, José Cambronero, Sumit Gulwani, Vu Le, Gust Verbruggen,
- Abstract要約: 本稿では,テーブルに対するCF提案を生成するための神経シンボル的アプローチであるTaFoを提案する。
TaFoはコンポーネントベースの合成システムからインスピレーションを得て、言語モデルのセマンティックな知識でそれらを拡張します。
以上の結果から,TaFoは現在のシステムよりも正確で多様で完全なフォーマット提案を生成することがわかった。
- 参考スコア(独自算出の注目度): 13.746217995802448
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Spreadsheet manipulation software are widely used for data management and analysis of tabular data, yet the creation of conditional formatting (CF) rules remains a complex task requiring technical knowledge and experience with specific platforms. In this paper we present TaFo, a neuro-symbolic approach to generating CF suggestions for tables, addressing common challenges such as user unawareness, difficulty in rule creation, and inadequate user interfaces. TaFo takes inspiration from component based synthesis systems and extends them with semantic knowledge of language models and a diversity preserving rule ranking.Unlike previous methods focused on structural formatting, TaFo uniquely incorporates value-based formatting, automatically learning both the rule trigger and the associated visual formatting properties for CF rules. By removing the dependency on user specification used by existing techniques in the form of formatted examples or natural language instruction, TaFo makes formatting completely predictive and automated for the user. To evaluate TaFo, we use a corpus of 1.8 Million public workbooks with CF and manual formatting. We compare TaFo against a diverse set of symbolic and neural systems designed for or adapted for the task of table formatting. Our results show that TaFo generates more accurate, diverse and complete formatting suggestions than current systems and outperforms these by 15.6\%--26.5\% on matching user added ground truth rules in tables.
- Abstract(参考訳): スプレッドシート操作ソフトウェアは、表データのデータ管理や分析に広く使われているが、条件付きフォーマット(CF)ルールの作成は、特定のプラットフォームでの技術知識と経験を必要とする複雑な作業である。
本稿では,テーブルに対するCF提案を生成するためのニューラルシンボリックアプローチであるTaFoを提案する。
TaFoは、コンポーネントベースの合成システムからインスピレーションを得て、言語モデルのセマンティックな知識と、構造的フォーマッティングに重点を置く従来の方法とは異なり、価値ベースのフォーマッティングを独自に取り入れ、ルールトリガと関連するCFルールの視覚的フォーマッティング特性の両方を自動的に学習する。
TaFoは、フォーマット化された例や自然言語命令の形式で既存の技術が使用しているユーザ仕様への依存を取り除くことで、フォーマットを完全に予測し、ユーザのために自動化する。
TaFoを評価するために、CFと手動フォーマットを備えた1.8万のパブリックワークブックのコーパスを使用します。
テーブルフォーマッティングのタスク用に設計された,あるいは適応された,多種多様な記号型およびニューラルネットワークと比較した。
以上の結果から,TaFoは現在のシステムよりも正確で多様で完全なフォーマット提案を生成でき,一致したユーザに対して15.6\%-26.5\%の精度で実現可能であることがわかった。
関連論文リスト
- Table-LLM-Specialist: Language Model Specialists for Tables using Iterative Generator-Validator Fine-tuning [52.08794743921141]
本稿では,テーブルタスクに特化して設計された自己学習ファインチューニングパラダイムとして,テーブル-LLM-スペシャリスト(Table-LLM-Specialist,略してテーブル-スペシャリスト)を提案する。
論文 参考訳(メタデータ) (2024-10-16T02:04:17Z) - UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.153629718464565]
我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文 参考訳(メタデータ) (2024-09-20T01:26:32Z) - FLEXTAF: Enhancing Table Reasoning with Flexible Tabular Formats [48.47559543509975]
フレキシブルフォーマットを用いてテーブル推論性能を向上させるためのFLEXTAF-SingleとFLEXTAF-Voteを提案する。
WikiTableQuestionsとTabFactに関する我々の実験は、平均的な2.3%と4.8%の大幅な改善を示している。
論文 参考訳(メタデータ) (2024-08-16T17:00:11Z) - FormaT5: Abstention and Examples for Conditional Table Formatting with
Natural Language [20.014372488951533]
FormaT5は、テーブルの条件付きフォーマットルールを生成するトランスフォーマーベースのモデルである。
これらのタスクのユーザ記述は、しばしば不明確か曖昧であり、コード生成システムが所望のルールを正確に学習することが難しくなる。
FormaT5がプレースホルダーを予測することを学習するが、このプレースホルダーは第2のモデルで満たされるか、あるいはフォーマットすべき行の例を、プログラム・バイ・サンプル・システムで利用できる。
論文 参考訳(メタデータ) (2023-10-26T11:05:15Z) - SEMv2: Table Separation Line Detection Based on Instance Segmentation [96.36188168694781]
SEMv2(SEM: Split, Embed, Merge)と呼ばれるテーブル構造認識器を提案する。
本稿では,テーブル分離ラインのインスタンスレベルの識別問題に対処し,条件付き畳み込みに基づくテーブル分離ライン検出戦略を提案する。
SEMv2を包括的に評価するために、iFLYTABと呼ばれるテーブル構造認識のためのより困難なデータセットも提示する。
論文 参考訳(メタデータ) (2023-03-08T05:15:01Z) - CORNET: A neurosymbolic approach to learning conditional table
formatting rules by example [9.480976802275823]
我々は,データ依存型フォーマットルールを自動的に学習する新しい問題に対処する,ニューロシンボリックシステムであるCORNETを提案する。
CORNETは、帰納的プログラム合成からインスピレーションを得て、半教師付きクラスタリングと反復的決定木学習に基づくシンボリックルール列挙を組み合わせた。
以上の結果から,CORNETは,これらのベースラインと比較して,様々な条件で,より正確にルールを学習できることがわかった。
論文 参考訳(メタデータ) (2022-08-11T20:30:12Z) - GFTE: Graph-based Financial Table Extraction [66.26206038522339]
金融業界や他の多くの分野において、表は構造化されていないデジタルファイル、例えばポータブル文書フォーマット(PDF)や画像でしばしば開示される。
我々はFinTabという中国の標準データセットを公開しています。
今後の比較のためのベースラインとしてGFTEという新しいグラフベースの畳み込みネットワークモデルを提案する。
論文 参考訳(メタデータ) (2020-03-17T07:10:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。