論文の概要: Towards Platonic Representation for Table Reasoning: A Foundation for Permutation-Invariant Retrieval
- arxiv url: http://arxiv.org/abs/2604.12133v1
- Date: Mon, 13 Apr 2026 23:33:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.15872
- Title: Towards Platonic Representation for Table Reasoning: A Foundation for Permutation-Invariant Retrieval
- Title(参考訳): 表推論のためのプラトン表現に向けて:置換不変検索の基礎
- Authors: Willy Carlos Tchuitcheu, Tan Lu, Ann Dooms,
- Abstract要約: 我々は,表表表現学習(TRL)に対する歴史的アプローチが,自然言語処理(NLP)のシーケンシャルパラダイムを広く採用していることを論じる。
本稿では、テーブルに対するプラトン表現仮説(PRH)を導入し、テーブル推論のための意味論的に堅牢な潜在空間は本質的に置換不変量(PI)でなければならないと仮定する。
本稿では,セルヘッダアライメントの認知原理を明示する,構造を意識したTRLエンコーダアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Historical approaches to Table Representation Learning (TRL) have largely adopted the sequential paradigms of Natural Language Processing (NLP). We argue that this linearization of tables discards their essential geometric and relational structure, creating representations that are brittle to layout permutations. This paper introduces the Platonic Representation Hypothesis (PRH) for tables, positing that a semantically robust latent space for table reasoning must be intrinsically Permutation Invariant (PI). To ground this hypothesis, we first conduct a retrospective analysis of table-reasoning tasks, highlighting the pervasive serialization bias that compromises structural integrity. We then propose a formal framework to diagnose this bias, introducing two principled metrics based on Centered Kernel Alignment (CKA): (i) PI, which measures embedding drift under complete structural derangement, and (ii) rho, a Spearman-based metric that tracks the convergence of latent structures toward a canonical form as structural information is incrementally restored. Our empirical analysis quantifies an expected flaw in modern Large Language Models (LLMs): even minor layout permutations induce significant, disproportionate semantic shifts in their table embeddings. This exposes a fundamental vulnerability in RAG systems, in which table retrieval becomes fragile to layout-dependent noise rather than to semantic content. In response, we present a novel, structure-aware TRL encoder architecture that explicitly enforces the cognitive principle of cell header alignment. This model demonstrates superior geometric stability and moves towards the PI ideal. Our work provides both a foundational critique of linearized table encoders and the theoretical scaffolding for semantically stable, permutation invariant retrieval, charting a new direction for table reasoning in information systems.
- Abstract(参考訳): 表表現学習(TRL)の歴史的アプローチは、自然言語処理(NLP)のシーケンシャルパラダイムを多く採用している。
このテーブルの線形化は、その基本的な幾何学的および関係的な構造を捨て、レイアウトの置換に脆弱な表現を生み出していると論じる。
本稿では、テーブルに対するプラトン表現仮説(PRH)を導入し、テーブル推論のための意味論的に堅牢な潜在空間は本質的に置換不変量(PI)でなければならないと仮定する。
この仮説を基礎として、まずテーブル推論タスクの振り返り分析を行い、構造的整合性を損なう広範囲な直列化バイアスを強調した。
次に、このバイアスを診断するための正式なフレームワークを提案し、CKA(Centered Kernel Alignment)に基づく2つの原則付きメトリクスを導入します。
一 完全な構造上の乱れの下での埋没流を測定するPI及び
(ii) 構造情報としての正準形式への潜伏構造の収束を追跡するスピアマン測度が漸進的に復元される。
我々の経験的分析は、現代のLarge Language Models (LLMs) の期待する欠陥を定量化します。
これは、テーブル検索がセマンティックコンテンツよりもレイアウトに依存したノイズに脆弱になる、RAGシステムにおける根本的な脆弱性を露呈する。
そこで本研究では,セルヘッダアライメントの認知原理を明示的に適用した,構造を意識したTRLエンコーダアーキテクチャを提案する。
このモデルは優れた幾何学的安定性を示し、PIイデアルに向かう。
本研究は,線形化テーブルエンコーダの基本的批判と,意味論的に安定な変分不変検索のための理論的足場を提供し,情報システムにおけるテーブル推論の新しい方向を図示する。
関連論文リスト
- ASTRA: Adaptive Semantic Tree Reasoning Architecture for Complex Table Question Answering [55.55968342644846]
テーブルのシリアライゼーションは、複雑なテーブル質問応答において、LLM(Large Language Models)にとって重要なボトルネックであり続けている。
既存のシリアライゼーションメソッドは明示的な階層をキャプチャできず、スキーマの柔軟性が欠如している。
本稿では,AdaSTRとDuTRの2つの主要モジュールを含むASTRA(Adaptive Semantic Tree Reasoning Architecture)を提案する。
複雑なテーブルベンチマーク実験により,本手法がSOTA(State-of-the-art)性能を実現することを示す。
論文 参考訳(メタデータ) (2026-04-10T06:09:41Z) - Orthogonal Hierarchical Decomposition for Structure-Aware Table Understanding with Large Language Models [13.58784346599112]
LLMの複雑なテーブルの構造保存型入力表現を構成する直交階層分解(OHD)フレームワークを提案する。
この表現に基づいて、各セルのセマンティックな系統を対称的に再構築する2経路アソシエーションプロトコルを設計する。
AITQA と HiTab という2つの複雑なテーブル質問応答ベンチマーク上で OHD フレームワークを評価する。
論文 参考訳(メタデータ) (2026-02-02T11:22:43Z) - Invariance on Manifolds: Understanding Robust Visual Representations for Place Recognition [19.200074425090595]
本稿では,2次幾何統計フレームワークを提案する。
提案手法では、固定されたトレーニング済みのバックボーン上に構築されたトレーニング不要のフレームワークを導入し、パラメータ更新なしで強力なゼロショット一般化を実現する。
論文 参考訳(メタデータ) (2026-01-31T18:12:29Z) - Structural Entropy Guided Probabilistic Coding [52.01765333755793]
構造エントロピー誘導型確率的符号化モデルSEPCを提案する。
我々は、構造エントロピー正規化損失を提案することにより、潜在変数間の関係を最適化に組み込む。
分類タスクと回帰タスクの両方を含む12の自然言語理解タスクに対する実験結果は、SEPCの優れた性能を示す。
論文 参考訳(メタデータ) (2024-12-12T00:37:53Z) - Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。
本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文 参考訳(メタデータ) (2023-05-28T06:30:29Z) - TSRFormer: Table Structure Recognition with Transformers [15.708108572696064]
本稿では,TSRFormerと呼ばれる新しいテーブル構造認識手法を提案する。
新たな2段階DETRに基づくセパレータ予測手法である textbfSeparator textbfREgression textbfTRansformer (SepRETR) を提案する。
我々は、SciTSR、PubTabNet、WTWなど、いくつかのベンチマークデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-08-09T17:36:13Z) - Reasoning over Hybrid Chain for Table-and-Text Open Domain QA [69.8436986668218]
我々はChAin中心の推論と事前学習フレームワーク(CARP)を提案する。
CARPはハイブリッドチェーンを使用して、質問応答のための表とテキスト間の明示的な中間推論プロセスをモデル化する。
また,クロスモダリティ推論プロセスの同定において,事前学習モデルを強化するために,新しいチェーン中心の事前学習手法を提案する。
論文 参考訳(メタデータ) (2022-01-15T16:11:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。