論文の概要: Compositional Generalization without Trees using Multiset Tagging and
Latent Permutations
- arxiv url: http://arxiv.org/abs/2305.16954v1
- Date: Fri, 26 May 2023 14:09:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 14:24:28.996078
- Title: Compositional Generalization without Trees using Multiset Tagging and
Latent Permutations
- Title(参考訳): マルチセットタグと潜時置換を用いた木なし合成一般化
- Authors: Matthias Lindemann, Alexander Koller, Ivan Titov
- Abstract要約: まず、各入力トークンに複数の出力トークンをタグ付けします。
次に、新しいパラメータ化法と置換予測法を用いて、トークンを出力シーケンスに配置する。
我々のモデルは、事前訓練されたセq2seqモデルと、現実的なセマンティック解析タスクに関する先行研究より優れている。
- 参考スコア(独自算出の注目度): 121.37328648951993
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Seq2seq models have been shown to struggle with compositional generalization
in semantic parsing, i.e. generalizing to unseen compositions of phenomena that
the model handles correctly in isolation.
We phrase semantic parsing as a two-step process: we first tag each input
token with a multiset of output tokens. Then we arrange the tokens into an
output sequence using a new way of parameterizing and predicting permutations.
We formulate predicting a permutation as solving a regularized linear program
and we backpropagate through the solver. In contrast to prior work, our
approach does not place a priori restrictions on possible permutations, making
it very expressive.
Our model outperforms pretrained seq2seq models and prior work on realistic
semantic parsing tasks that require generalization to longer examples. We also
outperform non-tree-based models on structural generalization on the COGS
benchmark. For the first time, we show that a model without an inductive bias
provided by trees achieves high accuracy on generalization to deeper recursion.
- Abstract(参考訳): Seq2seqモデルは、セマンティックパーシングにおける構成一般化、すなわちモデルが孤立して正しく扱う現象の目に見えない組成に一般化するのに苦労することが示されている。
まず、各入力トークンに複数の出力トークンをタグ付けします。
次に、パラメータ化と置換予測の新しい手法を用いて、トークンを出力シーケンスに配置する。
正規化線形プログラムの解法として置換の予測を定式化し,その解法をバックプロパゲートする。
先行研究とは対照的に、我々の手法は置換の可能性に事前制限を設けておらず、非常に表現力がある。
我々のモデルは、事前訓練されたSeq2seqモデルと、より長い例への一般化を必要とする現実的な意味解析タスクの先行研究より優れている。
また,COGSベンチマークにおける構造一般化の非木モデルよりも優れていた。
まず,木が与える帰納バイアスのないモデルが,より深い再帰への一般化において高い精度が得られることを示す。
関連論文リスト
- Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Hierarchical Phrase-based Sequence-to-Sequence Learning [94.10257313923478]
本稿では、学習中の帰納バイアスの源として階層的フレーズを取り入れ、推論中の明示的な制約として、標準的なシーケンス・ツー・シーケンス(seq2seq)モデルの柔軟性を維持するニューラルトランスデューサについて述べる。
本手法では,木が原文と対象句を階層的に整列するブラケット文法に基づく識別的導出法と,整列した句を1対1で翻訳するニューラルネットワークセク2セックモデルという2つのモデルを訓練する。
論文 参考訳(メタデータ) (2022-11-15T05:22:40Z) - Translate First Reorder Later: Leveraging Monotonicity in Semantic
Parsing [4.396860522241306]
TPolは2段階のアプローチであり、入力文を単調に翻訳し、正しい出力を得るために再注文する。
2つの一般的なセマンティックパーシングデータセットでアプローチをテストする。
論文 参考訳(メタデータ) (2022-10-10T17:50:42Z) - Recursive Decoding: A Situated Cognition Approach to Compositional
Generation in Grounded Language Understanding [0.0]
本稿では,Seq2seqモデルをトレーニングおよび使用するための新しい手順であるRecursive Decodingを提案する。
1回のパスで出力シーケンス全体を生成するのではなく、モデルは一度に1つのトークンを予測するように訓練される。
RDは、gSCANの2つの以前に無視された一般化タスクに対して劇的な改善をもたらす。
論文 参考訳(メタデータ) (2022-01-27T19:13:42Z) - Grounded Graph Decoding Improves Compositional Generalization in
Question Answering [68.72605660152101]
質問応答モデルは、長いシーケンスやより複雑なテスト構造のようなトレーニングパターンの新しい構成に一般化するのに苦労する。
構造化された予測をアテンション機構でグラウンド化することで,言語表現の合成一般化を改善する手法であるグラウンドドグラフデコーディングを提案する。
本モデルは,質問応答における合成一般化の挑戦的ベンチマークである構成自由ベース質問(CFQ)データセットにおいて,最先端のベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2021-11-05T17:50:14Z) - Structured Reordering for Modeling Latent Alignments in Sequence
Transduction [86.94309120789396]
本稿では,分離可能な置換の辺りを正確に推定する効率的な動的プログラミングアルゴリズムを提案する。
結果のSeq2seqモデルは、合成問題やNLPタスクの標準モデルよりも体系的な一般化が優れている。
論文 参考訳(メタデータ) (2021-06-06T21:53:54Z) - Span-based Semantic Parsing for Compositional Generalization [53.24255235340056]
SpanBasedSPは入力発話上のスパンツリーを予測し、部分的なプログラムが入力内のスパンをどのように構成するかを明示的に符号化する。
GeoQuery、SCAN、CLOSUREでは、SpanBasedSPはランダムスプリットの強いseq2seqベースラインと似ているが、構成一般化を必要とするスプリットのベースラインに比べて劇的に性能が向上する。
論文 参考訳(メタデータ) (2020-09-13T16:42:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。