論文の概要: Structural Generalization on SLOG without Hand-Written Rules
- arxiv url: http://arxiv.org/abs/2604.26157v2
- Date: Sat, 02 May 2026 14:23:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 14:09:06.981004
- Title: Structural Generalization on SLOG without Hand-Written Rules
- Title(参考訳): 手書きルールのないSLOGの構造一般化
- Authors: Zichao Wei,
- Abstract要約: 本稿では、離散的なボトルネックを持つ神経セルオートマトンに基づく手書き構成規則を必要としない代替案を提案する。
すべての構成規則は、局所的な反復を通してデータから学習される。
CCGLOGベンチマークでは、17の構造一般化カテゴリのうち11のタイプエクサクティヴマッチを100%達成している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Structural generalization in semantic parsing requires systems to apply learned compositional rules to novel structural combinations. Existing approaches either rely on hand-written algebraic rules (AM-Parser) or fail to generalize structurally (Transformer-based models). We present an alternative requiring no hand-written compositional rules, based on a neural cellular automaton (NCA) with a discrete bottleneck: all compositional rules are learned from data through local iteration. On the SLOG benchmark, the system achieves 100% type-exact match on 11 of 17 structural generalization categories, including three where AM-Parser scores 0 to 74%, with an overall standard deviation of 0.2 across 10 seeds (vs. AM-Parser's 4.3). Analysis reveals that all 5,539 failure instances reduce to exactly two mechanisms: novel combinations of wh-extraction context with reduced verb types, and modifiers appearing on the subject side of verbs. When we decompose results by CCG structural features, each sub-pattern either succeeds on all instances or fails on all. Intermediate scores (e.g., 41.4%) are mixtures of structurally distinct CCG patterns, not partial generalization. All failures correspond to directed operations absent from training; all successes correspond to operations already covered.
- Abstract(参考訳): 意味解析における構造的一般化は、学習された構成規則を新しい構造的組み合わせに適用するシステムを必要とする。
既存のアプローチは手書き代数規則(AM-Parser)に依存しているか、構造的に一般化しない(Transformerベースのモデル)。
本稿では,局所的な反復を通してデータからすべての構成規則を学習する,離散的なボトルネックを持つ神経セルオートマトン(NCA)に基づく手書き構成規則を必要としない代替法を提案する。
SLOGベンチマークでは、AM-Parserが0から74%、標準偏差が10種に0.2の3種類(AM-Parserの4.3)を含む17種類の構造一般化カテゴリのうち11種に対して100%の型適合一致を達成した。
分析の結果,5,539件の失敗事例は,動詞の主語側に出現する修飾詞と,動詞型を縮小した単語抽出文脈の新たな組み合わせという,正確に2つのメカニズムに還元されることがわかった。
CCG構造的特徴によって結果が分解されると、各サブパターンはすべてのインスタンスで成功するか、全く失敗する。
中間スコア(41.4%)は構造的に異なるCCGパターンの混合であり、部分的な一般化ではない。
すべての障害は訓練から欠落した指示された操作に対応しており、すべての成功は既にカバーされている操作に対応する。
関連論文リスト
- Bit-Identical Medical Deep Learning via Structured Orthogonal Initialization [0.0]
深層学習トレーニングは非決定論的であり、異なるランダムなシードを持つ同一のコードは、集約メトリクスに異を唱えるが個々の予測に異を唱えるモデルを生成する。
ランダム性の3つの源を除去する検証ビット識別訓練の枠組みを提案する。
論文 参考訳(メタデータ) (2026-03-30T05:04:57Z) - PRECEPT: Planning Resilience via Experience, Context Engineering & Probing Trajectories A Unified Framework for Test-Time Adaptation with Compositional Rule Learning and Pareto-Guided Prompt Evolution [2.28438857884398]
自然言語として知識を格納するLLMエージェントは、条件数の増加に伴って急激な検索劣化に悩まされる。
本稿では,3つの密結合コンポーネントによるテスト時間適応のための統合フレームワークであるPreCEPTを紹介する。
論文 参考訳(メタデータ) (2026-03-10T13:16:45Z) - Exploring Compositional Generalization (in COGS/ReCOGS_pos) by Transformers using Restricted Access Sequence Processing (RASP) [0.0]
本研究では,トランスフォーマーデコーダが構成一般化(COGS)と意味論的に等価なReCOGS_posを実行できることを示す。
我々の RASP モデルは COGS と ReCOGS_pos 上の構造一般化分割の完全スコアに近い。
論文 参考訳(メタデータ) (2025-04-21T18:00:24Z) - Compositional Generalization for Data-to-Text Generation [86.79706513098104]
本稿では,群に述語をクラスタ化することで構成一般化に対処する新しいモデルを提案する。
本モデルでは,1つの述語を1度に1つのクラスタに依存して文単位でテキストを生成する。
すべての評価指標でT5ベースラインをはるかに上回る。
論文 参考訳(メタデータ) (2023-12-05T13:23:15Z) - SLOG: A Structural Generalization Benchmark for Semantic Parsing [68.19511282584304]
合成一般化ベンチマークの目的は、モデルがいかにして新しい複雑な言語表現に一般化するかを評価することである。
既存のベンチマークは、しばしば語彙一般化に焦点を当て、訓練に精通した構文構造における新しい語彙項目の解釈は、しばしば不足している。
SLOGは,COGSを拡張したセマンティック解析データセットである。
論文 参考訳(メタデータ) (2023-10-23T15:39:09Z) - Compositional Program Generation for Few-Shot Systematic Generalization [59.57656559816271]
コンポジションプログラムジェネレータ(CPG)と呼ばれるニューロシンボリックアーキテクチャに関する研究
CPGには3つの重要な特徴がある: 文法規則の形で、テキストモジュラリティ、テキストコンポジション、テキストタストラクションである。
SCAN と COGS のベンチマークでは,SCAN の14例と COGS の22例を使用して,完全な一般化を実現している。
論文 参考訳(メタデータ) (2023-09-28T14:33:20Z) - Compositional Generalization Requires Compositional Parsers [69.77216620997305]
直近のCOGSコーパスにおける構成原理によって導かれるシーケンス・ツー・シーケンスモデルとモデルを比較した。
構造一般化は構成一般化の重要な尺度であり、複雑な構造を認識するモデルを必要とする。
論文 参考訳(メタデータ) (2022-02-24T07:36:35Z) - Grounded Graph Decoding Improves Compositional Generalization in
Question Answering [68.72605660152101]
質問応答モデルは、長いシーケンスやより複雑なテスト構造のようなトレーニングパターンの新しい構成に一般化するのに苦労する。
構造化された予測をアテンション機構でグラウンド化することで,言語表現の合成一般化を改善する手法であるグラウンドドグラフデコーディングを提案する。
本モデルは,質問応答における合成一般化の挑戦的ベンチマークである構成自由ベース質問(CFQ)データセットにおいて,最先端のベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2021-11-05T17:50:14Z) - Inducing Transformer's Compositional Generalization Ability via
Auxiliary Sequence Prediction Tasks [86.10875837475783]
体系的な構成性は人間の言語において必須のメカニズムであり、既知の部品の組換えによって新しい表現を作り出すことができる。
既存のニューラルモデルには、記号構造を学習する基本的な能力がないことが示されている。
本稿では,関数の進行と引数のセマンティクスを追跡する2つの補助シーケンス予測タスクを提案する。
論文 参考訳(メタデータ) (2021-09-30T16:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。