論文の概要: SUBS: Subtree Substitution for Compositional Semantic Parsing
- arxiv url: http://arxiv.org/abs/2205.01538v1
- Date: Tue, 3 May 2022 14:47:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-04 17:15:20.413721
- Title: SUBS: Subtree Substitution for Compositional Semantic Parsing
- Title(参考訳): subs:構文解析のためのサブツリー置換
- Authors: Jingfeng Yang, Le Zhang, Diyi Yang
- Abstract要約: 本稿では,類似のセマンティック関数を持つサブツリーを交換可能と考える合成データ拡張にサブツリー置換を用いることを提案する。
実験の結果、このような拡張されたデータはSCANとGeoQueryで大幅にパフォーマンスが向上し、GeoQueryの合成分割で新しいSOTAに達した。
- 参考スコア(独自算出の注目度): 50.63574492655072
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although sequence-to-sequence models often achieve good performance in
semantic parsing for i.i.d. data, their performance is still inferior in
compositional generalization. Several data augmentation methods have been
proposed to alleviate this problem. However, prior work only leveraged
superficial grammar or rules for data augmentation, which resulted in limited
improvement. We propose to use subtree substitution for compositional data
augmentation, where we consider subtrees with similar semantic functions as
exchangeable. Our experiments showed that such augmented data led to
significantly better performance on SCAN and GeoQuery, and reached new SOTA on
compositional split of GeoQuery.
- Abstract(参考訳): sequence-to-sequenceモデルはしばしばデータの意味解析において優れた性能を発揮するが、その性能は合成の一般化において依然として劣っている。
この問題を解決するために、いくつかのデータ拡張手法が提案されている。
しかし、事前の作業は表面文法やデータ拡張のルールのみを活用し、改善は限定された。
本稿では,類似のセマンティック関数を持つサブツリーを交換可能と考える合成データ拡張にサブツリー置換を用いることを提案する。
実験の結果,SCANとGeoQueryのパフォーマンスは大幅に向上し,GeoQueryの合成分割に関して新たなSOTAに達した。
関連論文リスト
- Holistic Exploration on Universal Decompositional Semantic Parsing:
Architecture, Data Augmentation, and LLM Paradigm [24.993992573870145]
複雑な解析タスクを意味的に適切なサブタスクに分解する UDS 解析のためのカスケードモデルを提案する。
提案手法は,推定時間を大幅に削減しつつ,先行モデルよりも優れる。
データ拡張のさまざまな方法が検討され、UDSパーシングをさらに改善した。
論文 参考訳(メタデータ) (2023-07-25T11:44:28Z) - GDA: Generative Data Augmentation Techniques for Relation Extraction
Tasks [81.51314139202152]
本稿では,意味的一貫性と構文構造を両立させるために2つの相補的モジュールを用いるGDAという,関係テキスト専用の拡張手法を提案する。
低リソース環境下での3つのデータセットによる実験結果から,GDAはエム2.0%のF1改善をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-26T06:21:01Z) - Recursive Neural Networks with Bottlenecks Diagnose
(Non-)Compositionality [65.60002535580298]
データの構成性の定量化は難しい課題であり、主に短い発話のために研究されている。
モデルにおけるデータの表現とボトルネックの有無を比較することで,構成性の測定値が得られることを示す。
本手法は、合成データを用いた算術式の評価と、自然言語データを用いた感情分類に適用する。
論文 参考訳(メタデータ) (2023-01-31T15:46:39Z) - Syntax-driven Data Augmentation for Named Entity Recognition [3.0603554929274908]
低リソース設定では、データ拡張戦略が一般的に活用され、パフォーマンスが向上する。
名前付きエンティティ認識を改善するために,簡易なマスク付き言語モデル置換法と選択木変異を用いた拡張法を比較した。
論文 参考訳(メタデータ) (2022-08-15T01:24:55Z) - TreeMix: Compositional Constituency-based Data Augmentation for Natural
Language Understanding [56.794981024301094]
自然言語理解のための合成データ拡張手法であるTreeMixを提案する。
具体的には、TreeMixは、選択構文解析木を利用して、文章を構成要素のサブ構造に分解し、ミックスアップデータ拡張技術を使って、それらを再結合して新しい文を生成する。
従来のアプローチと比較して、TreeMixは生成されたサンプルにより多様性を導入し、NLPデータの合成性を学ぶようモデルに促している。
論文 参考訳(メタデータ) (2022-05-12T15:25:12Z) - Measuring and Improving Compositional Generalization in Text-to-SQL via
Component Alignment [23.43452719573272]
合成一般化を生成するための節レベルの合成例生成法を提案する。
そこで本研究では,Spider-SSとSpider-CGのデータセットを構築し,構成を一般化するモデルの有効性を検証した。
実験の結果,既存のモデルではスパイダーCGで評価した場合,大幅な性能劣化がみられた。
我々は,Spider-SSのセグメント化データをトレーニングするために,多数の最先端モデルを修正し,この手法が一般化性能を向上させることを示す。
論文 参考訳(メタデータ) (2022-05-04T13:29:17Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z) - Substructure Substitution: Structured Data Augmentation for NLP [55.69800855705232]
SUB2は、同じラベルを持つサブ構造を置換して新しい例を生成する。
より一般的なタスクでは、選挙区解析木に基づくSUB2のバリエーションを示す。
ほとんどの場合、SUB2による強化データセットによるトレーニングは、元のトレーニングセットでのトレーニングよりも優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-01-02T09:54:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。