論文の概要: Hierarchical Neural Data Synthesis for Semantic Parsing
- arxiv url: http://arxiv.org/abs/2112.02212v1
- Date: Sat, 4 Dec 2021 01:33:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-11 05:38:16.403960
- Title: Hierarchical Neural Data Synthesis for Semantic Parsing
- Title(参考訳): 意味解析のための階層型ニューラルネットワーク合成
- Authors: Wei Yang, Peng Xu, Yanshuai Cao
- Abstract要約: セマンティック解析のためのデータ拡張の純粋にニューラルなアプローチを提案する。
ゼロショット増強による開発セットの最先端性能(精度77.2%)を達成する。
- 参考スコア(独自算出の注目度): 16.284764879030448
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic parsing datasets are expensive to collect. Moreover, even the
questions pertinent to a given domain, which are the input of a semantic
parsing system, might not be readily available, especially in cross-domain
semantic parsing. This makes data augmentation even more challenging. Existing
methods to synthesize new data use hand-crafted or induced rules, requiring
substantial engineering effort and linguistic expertise to achieve good
coverage and precision, which limits the scalability. In this work, we propose
a purely neural approach of data augmentation for semantic parsing that
completely removes the need for grammar engineering while achieving higher
semantic parsing accuracy. Furthermore, our method can synthesize in the
zero-shot setting, where only a new domain schema is available without any
input-output examples of the new domain. On the Spider cross-domain text-to-SQL
semantic parsing benchmark, we achieve the state-of-the-art performance on the
development set (77.2% accuracy) using our zero-shot augmentation.
- Abstract(参考訳): セマンティクス解析データセットは収集にコストがかかる。
さらに、セマンティクス解析システムの入力である所定の領域に関連する質問でさえ、特にクロスドメインセマンティクスにおいて、容易には利用できないかもしれない。
これにより、データ拡張がさらに困難になる。
新しいデータを合成する既存の方法は手作りまたは誘導されたルールを使用しており、スケーラビリティを制限した優れたカバレッジと精度を達成するためには、相当な技術的努力と専門知識が必要である。
本研究では,意味解析の精度を高めつつ,文法工学の必要性を完全に排除する,意味解析のためのデータ拡張の純粋ニューラルネットワーク手法を提案する。
さらに,提案手法はゼロショット設定で合成可能であり,新たなドメインの入出力例を使わずに新たなドメインスキーマのみ利用可能である。
Spiderのクロスドメインテキスト-SQLセマンティック解析ベンチマークでは、ゼロショット拡張を用いて開発セット(77.2%の精度)における最先端のパフォーマンスを達成する。
関連論文リスト
- StyDeSty: Min-Max Stylization and Destylization for Single Domain Generalization [85.18995948334592]
単一のドメインの一般化(単一DG)は、単一のトレーニングドメインからのみ見えないドメインに一般化可能な堅牢なモデルを学ぶことを目的としている。
最先端のアプローチは、主に新しいデータを合成するために、敵対的な摂動やスタイルの強化といったデータ拡張に頼っている。
データ拡張の過程で、ソースと擬似ドメインのアライメントを明示的に考慮したemphStyDeStyを提案する。
論文 参考訳(メタデータ) (2024-06-01T02:41:34Z) - Laziness Is a Virtue When It Comes to Compositionality in Neural
Semantic Parsing [20.856601758389544]
本稿では,論理形式の葉から始まる論理形式をボトムアップから構築するニューラルセマンティック解析生成手法を提案する。
我々の新しいボトムアップ・パーシング・セマンティック・テクニックは、汎用的なセマンティクスよりも優れており、同等のニューラル・セマンティクスと競合していることを示す。
論文 参考訳(メタデータ) (2023-05-07T17:53:08Z) - Training Naturalized Semantic Parsers with Very Little Data [10.709587018625275]
State-of-the-art(SOTA)セマンティクスは、大量のテキストに基づいて事前訓練された大規模な言語モデルに基づくセク2セックアーキテクチャである。
最近の研究は意味解析の改革を探求しており、出力シーケンスはそれ自体が自然言語文である。
本手法は,Overnightデータセット上で新たなSOTA数ショット性能を実現する。
論文 参考訳(メタデータ) (2022-04-29T17:14:54Z) - Unsupervised Domain Adaptation for Semantic Segmentation via Low-level
Edge Information Transfer [27.64947077788111]
セマンティックセグメンテーションのための教師なしドメイン適応は、合成データに基づいて訓練されたモデルを実際の画像に適応させることを目的としている。
従来の特徴レベルの対数学習手法は、高レベルの意味的特徴に適応するモデルのみを考慮していた。
本稿では,ドメイン間ギャップが小さい低レベルエッジ情報を明示的に利用して意味情報の伝達をガイドする試みについて紹介する。
論文 参考訳(メタデータ) (2021-09-18T11:51:31Z) - Content Disentanglement for Semantically Consistent
Synthetic-to-RealDomain Adaptation in Urban Traffic Scenes [39.38387505091648]
合成データ生成は、自動運転における新しい交通シナリオを生成する魅力的なアプローチです。
合成データだけで訓練されたディープラーニング技術は、実際のデータでテストされたときに劇的なパフォーマンス低下に遭遇します。
本稿では,合成データと実データの間で意味的に一貫性のあるドメイン適応を実現する,教師なしのエンドツーエンドドメイン適応ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-05-18T17:42:26Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z) - Generating Synthetic Data for Task-Oriented Semantic Parsing with
Hierarchical Representations [0.8203855808943658]
本研究では,ニューラルセマンティック解析のための合成データ生成の可能性を検討する。
具体的には、まず既存のラベル付き発話からマスク付きテンプレートを抽出し、次に微調整BARTを用いて合成発話条件を生成する。
ナビゲーション領域のためのFacebook TOPデータセットを評価する際に、我々のアプローチの可能性を示す。
論文 参考訳(メタデータ) (2020-11-03T22:55:40Z) - Meta-Learning for Domain Generalization in Semantic Parsing [124.32975734073949]
セマンティック解析のためにゼロショットドメインをターゲットにしたメタラーニングフレームワークを使用する。
ゼロショット解析の仮想トレインと非結合領域からのテストセットをシミュレートするモデル非依存のトレーニングアルゴリズムを適用した。
論文 参考訳(メタデータ) (2020-10-22T19:00:36Z) - Low-Resource Domain Adaptation for Compositional Task-Oriented Semantic
Parsing [85.35582118010608]
タスク指向のセマンティックパーシングは仮想アシスタントの重要なコンポーネントである。
近年のディープラーニングの進歩は、より複雑なクエリを解析するいくつかのアプローチを可能にしている。
そこで本研究では,教師付きニューラルネットワークを10倍の精度で高速化する手法を提案する。
論文 参考訳(メタデータ) (2020-10-07T17:47:53Z) - Domain Adversarial Fine-Tuning as an Effective Regularizer [80.14528207465412]
自然言語処理(NLP)では、下流タスクに転送される事前訓練された言語モデル(LM)が、最先端の結果を得るために最近示されている。
標準的な微調整は、事前トレーニング中にキャプチャされた汎用ドメイン表現を分解することができる。
本稿では,新しい正規化手法である After; 有効正規化器としてのドメイン・アダクショナル・ファイン・チューニングを提案する。
論文 参考訳(メタデータ) (2020-09-28T14:35:06Z) - Domain Adaptation for Semantic Parsing [68.81787666086554]
本稿では,ドメイン適応のための新しいセマンティクスを提案する。このセマンティクスでは,ソースドメインと比較して,対象ドメインのアノテーション付きデータがはるかに少ない。
我々のセマンティックな利点は、2段階の粗大なフレームワークから得ており、2段階の異なる正確な処理を提供できる。
ベンチマークデータセットの実験により、我々の手法はいくつかの一般的なドメイン適応戦略より一貫して優れていることが示された。
論文 参考訳(メタデータ) (2020-06-23T14:47:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。