論文の概要: The Power of Order: Fooling LLMs with Adversarial Table Permutations
- arxiv url: http://arxiv.org/abs/2605.00445v1
- Date: Fri, 01 May 2026 06:25:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.874368
- Title: The Power of Order: Fooling LLMs with Adversarial Table Permutations
- Title(参考訳): 秩序の力:逆表置換によるLDMの摂食
- Authors: Xinshuai Dong, Haifeng Chen, Xuyuan Liu, Shengyu Chen, Haoyu Wang, Shaoan Xie, Kun Zhang, Zhengzhang Chen,
- Abstract要約: 逆テーブル置換(Adversarial Table Permutation)は、モデル性能を最大限に破壊するために設計された最悪の順列を効率的に識別する勾配ベースの攻撃である。
実験の結果,ATPは広範囲のLDMの性能を著しく低下させることがわかった。
本研究は,現在のLLMが構造化データをどのように処理するかの根本的な弱点を明らかにし,信頼性の高い実世界のアプリケーションのための置換ロバストモデルの開発を急務に行う必要性を浮き彫りにした。
- 参考スコア(独自算出の注目度): 49.84535222399142
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models have achieved remarkable success and are increasingly deployed in critical applications involving tabular data, such as Table Question Answering. However, their robustness to the structure of this input remains a critical, unaddressed question. This paper demonstrates that modern LLMs exhibit a significant vulnerability to the layout of tabular data. Specifically, we show that semantically-invariant permutations of rows and columns - rearrangements that do not alter the table's underlying information - are sometimes sufficient to cause incorrect or inconsistent model outputs. To systematically probe this vulnerability, we introduce Adversarial Table Permutation, a novel, gradient-based attack that efficiently identifies worst-case permutations designed to maximally disrupt model performance. Our extensive experiments demonstrate that ATP significantly degrades the performance of a wide range of LLMs. This reveals a pervasive vulnerability across different model sizes and architectures, including the most recent and popular models. Our findings expose a fundamental weakness in how current LLMs process structured data, underscoring the urgent need to develop permutation-robust models for reliable, real-world applications.
- Abstract(参考訳): 大規模言語モデルは目覚ましい成功を収め、テーブル質問回答のような表データを含む重要なアプリケーションにますますデプロイされている。
しかし、この入力の構造に対するロバスト性は、批判的で非装飾的な問題のままである。
本稿では,現代のLCMが表データのレイアウトに重大な脆弱性があることを実証する。
具体的には,行や列の意味的に不変な置換 – テーブルの基盤となる情報を変更しない配列 – が,誤ったモデル出力や一貫性のないモデル出力を引き起こすのに十分であることを示す。
この脆弱性を系統的に調査するために,モデル性能を最大限に破壊するように設計された,新しい勾配型攻撃であるAdversarial Table Permutationを導入する。
広範な実験により, ATPは広範囲のLDMの性能を著しく低下させることが示された。
これにより、最新の人気モデルを含む、さまざまなモデルサイズとアーキテクチャにまたがる広範な脆弱性が明らかになる。
本研究は,現在のLLMが構造化データをどのように処理するかの根本的な弱点を明らかにし,信頼性の高い実世界のアプリケーションのための置換ロバストモデルの開発を急務に行う必要性を浮き彫りにした。
関連論文リスト
- An Empirical Investigation of Robustness in Large Language Models under Tabular Distortions [8.023379679609151]
大規模言語モデル(LLM)は、他の標準表現の表計算データが意味的および構造的歪みを受けると失敗する。
システムプロンプトを通じて明示的な事前情報を提供する場合のみ、モデルは推論戦略を部分的に調整し、いくつかの歪みを修正する。
論文 参考訳(メタデータ) (2026-01-08T15:10:32Z) - Table as a Modality for Large Language Models [28.392792653645998]
提案したStructQAベンチマークで探索実験を行った。
本稿では,テーブルをテキストトークンと統合した独立したモダリティとして扱うためのイデオロギーを持つTAMOを提案する。
論文 参考訳(メタデータ) (2025-11-30T15:59:56Z) - TableZoomer: A Collaborative Agent Framework for Large-scale Table Question Answering [26.00027389659854]
TableZoomerは、テーブル質問応答(TQA)タスクのためのプログラミングベースのエージェントフレームワークである。
2)列選択とエンティティリンクを通じてサブテーブルスキーマを動的に生成するクエリ対応テーブルズーム機構,(3)クエリを実行可能なコードに変換するプログラム・オブ・ソート(PoT)戦略により,数値幻覚を緩和する。
論文 参考訳(メタデータ) (2025-09-01T09:53:01Z) - LLM-Symbolic Integration for Robust Temporal Tabular Reasoning [69.27153114778748]
本研究では,システムおよび制御された評価のための合成データセットであるTempTabQA-Cを紹介する。
この構造化アプローチにより、LLM(Large Language Models)はsqlクエリの生成と実行を可能にし、一般化とバイアス軽減の強化を行う。
論文 参考訳(メタデータ) (2025-06-06T05:14:04Z) - Multimodal Tabular Reasoning with Privileged Structured Information [67.40011423365712]
ブリッジインfOrmation (sc Turbo) を用いたタブウラー推論(TabUlar Reasoning)について紹介する。
sc TurboはDeepSeek-R1をベースにした構造対応の推論トレースジェネレータの恩恵を受ける。
sc Turboは、複数のデータセットで最先端のパフォーマンス(+7.2%対以前のSOTA)を達成する。
論文 参考訳(メタデータ) (2025-06-04T15:46:30Z) - TableRAG: Million-Token Table Understanding with Language Models [53.039560091592215]
TableRAG(TableRAG)は、LMベースのテーブル理解用に特別に設計された検索拡張生成(RAG)フレームワークである。
TableRAGは、スキーマとセル検索を組み合わせたクエリ拡張を活用して、LMにそれを提供する前に重要な情報をピンポイントする。
以上の結果から,TableRAGは検索精度が向上し,大規模テーブル理解における最先端性能が向上することが示唆された。
論文 参考訳(メタデータ) (2024-10-07T04:15:02Z) - TAP4LLM: Table Provider on Sampling, Augmenting, and Packing Semi-structured Data for Large Language Model Reasoning [55.33939289989238]
テーブルベースタスクにおいて,大規模言語モデル(LLM)を効果的に活用するための汎用プリプロセッサスイートとして,TAP4LLMを提案する。
1)大きなテーブルをクエリセマンティクスに基づいて管理可能なサブテーブルに分解するテーブルサンプリング、(2)外部ソースやモデルから追加の知識でテーブルを拡張するテーブル拡張、(3)テーブルパッキングとシリアライゼーションによりテーブルをLLMの理解に適したさまざまなフォーマットに変換する。
論文 参考訳(メタデータ) (2023-12-14T15:37:04Z) - HeLM: Highlighted Evidence augmented Language Model for Enhanced Table-to-Text Generation [7.69801337810352]
LLaMA2モデル上でパラメータ効率の良い微調整を行う。
我々のアプローチは、テーブル固有の行データを強調することにより、推論情報を入力に注入することである。
FetaQAデータセットとQTSummデータセットの両方で、我々のアプローチは最先端の結果を得た。
論文 参考訳(メタデータ) (2023-11-15T12:02:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。