論文の概要: Revisit Out-Of-Vocabulary Problem for Slot Filling: A Unified
Contrastive Frameword with Multi-level Data Augmentations
- arxiv url: http://arxiv.org/abs/2302.13584v1
- Date: Mon, 27 Feb 2023 08:42:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 16:24:47.852819
- Title: Revisit Out-Of-Vocabulary Problem for Slot Filling: A Unified
Contrastive Frameword with Multi-level Data Augmentations
- Title(参考訳): スロット充填のボキャブラリー問題の再検討:マルチレベルデータ拡張を用いたコントラスト・フレームワードの統一
- Authors: Daichi Guo and Guanting Dong and Dayuan Fu and Yuxiang Wu and Chen
Zeng and Tingfeng Hui and Liwen Wang and Xuefeng Li and Zechen Wang and
Keqing He and Xinyue Cui and Weiran Xu
- Abstract要約: マルチレベルデータ拡張に基づくOOVロバストスロット充足モデルを提案する。
本稿では,原点サンプルと増補サンプルをまとめて表現する,一貫したコントラスト学習フレームワークを提案する。
2つのデータセットに対する実験により,従来のソタ手法よりもOOVスロットとワードの両面で優れていたことが判明した。
- 参考スコア(独自算出の注目度): 25.58584022851584
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In real dialogue scenarios, the existing slot filling model, which tends to
memorize entity patterns, has a significantly reduced generalization facing
Out-of-Vocabulary (OOV) problems. To address this issue, we propose an OOV
robust slot filling model based on multi-level data augmentations to solve the
OOV problem from both word and slot perspectives. We present a unified
contrastive learning framework, which pull representations of the origin sample
and augmentation samples together, to make the model resistant to OOV problems.
We evaluate the performance of the model from some specific slots and carefully
design test data with OOV word perturbation to further demonstrate the
effectiveness of OOV words. Experiments on two datasets show that our approach
outperforms the previous sota methods in terms of both OOV slots and words.
- Abstract(参考訳): 実対話シナリオでは、既存のスロットフィリングモデルはエンティティパターンを記憶する傾向があり、外語彙(OOV)問題に直面する一般化を著しく減少させる。
この問題に対処するために,複数レベルのデータ拡張に基づくOOVロバストスロット充填モデルを提案し,単語とスロットの両面からOOV問題を解決する。
本稿では,モデルがOOV問題に耐性を持つように,原点サンプルと増補サンプルの表現を併用したコントラスト学習フレームワークを提案する。
特定のスロットからモデルの性能を評価し、OOV単語摂動を用いたテストデータを慎重に設計し、OOV単語の有効性をさらに実証する。
2つのデータセットに対する実験により,従来のソタ手法よりもOOVスロットとワードの両面で優れていることが示された。
関連論文リスト
- Beyond Coarse-Grained Matching in Video-Text Retrieval [50.799697216533914]
きめ細かい評価のための新しいアプローチを導入する。
テストキャプションを自動的に生成することで,既存のデータセットにアプローチを適用することができる。
きめ細かい評価実験は、このアプローチがきめ細かな違いを理解するモデルの能力を高めることを実証している。
論文 参考訳(メタデータ) (2024-10-16T09:42:29Z) - DiPT: Enhancing LLM reasoning through diversified perspective-taking [27.443341091299168]
既存の言語モデル推論の改善作業は、通常、単一のソリューションパスを探索する。
本稿では,社会学における視点学習にヒントを得て,新しいアプローチであるDiPTを紹介する。
これにより、モデルは問題のコンテキストをより深く理解し、最も効果的なソリューションパスを特定することができる。
論文 参考訳(メタデータ) (2024-09-10T06:17:27Z) - MarvelOVD: Marrying Object Recognition and Vision-Language Models for Robust Open-Vocabulary Object Detection [107.15164718585666]
開語彙検出コンテキスト下でのVLMの偏り予測の根本原因について検討した。
私たちの観察は、非常に優れたトレーニングターゲットを生成する、単純で効果的なパラダイム、コード化されたMarvelOVDにつながります。
我々の手法は、他の最先端技術よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2024-07-31T09:23:57Z) - OOVs in the Spotlight: How to Inflect them? [1.0235882892795396]
語彙外条件(OOV)における形態的屈折に着目した。
LSTMとTransformerに基づく2つのシーケンス・ツー・シーケンス(Sequence-to-Sequence:seq2seq)モデルである。
論文 参考訳(メタデータ) (2024-04-13T11:40:06Z) - Improving the Robustness of Summarization Systems with Dual Augmentation [68.53139002203118]
頑健な要約システムは、入力中の特定の単語の選択やノイズに関わらず、文書のギストをキャプチャできるべきである。
まず,単語レベルの同義語置換や雑音を含む摂動に対する要約モデルの頑健性について検討する。
SummAttackerを提案する。これは言語モデルに基づく対数サンプルを生成するための効率的な手法である。
論文 参考訳(メタデータ) (2023-06-01T19:04:17Z) - Deep Incomplete Multi-view Clustering with Cross-view Partial Sample and
Prototype Alignment [50.82982601256481]
深層不完全なマルチビュークラスタリングのためのクロスビュー部分サンプルとプロトタイプアライメントネットワーク(CPSPAN)を提案する。
従来のコントラストベースの手法とは異なり、インスタンスとインスタンスの対応構築を導くために、ペア観測データアライメントを「プロキシ監視信号」として採用する。
論文 参考訳(メタデータ) (2023-03-28T02:31:57Z) - UBARv2: Towards Mitigating Exposure Bias in Task-Oriented Dialogs [28.051423938045843]
トレーニング中にダイアログコンテキストのサンプル生成内容にモデルを明示的に公開するセッションレベルサンプリングを提案する。
我々は,マスク戦略R-Maskを用いたドロップアウト型整合性正規化を用いて,モデルの堅牢性と性能をさらに向上する。
UBARv2は、標準化された評価ベンチマークMultiWOZ上で最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-09-15T12:14:46Z) - Discrete Auto-regressive Variational Attention Models for Text Modeling [53.38382932162732]
変分オートエンコーダ(VAE)はテキストモデリングに広く応用されている。
情報不足と後部崩壊という2つの課題に悩まされている。
本稿では,自己回帰変動注意モデル(DAVAM)を提案する。
論文 参考訳(メタデータ) (2021-06-16T06:36:26Z) - A Variational Information Bottleneck Approach to Multi-Omics Data
Integration [98.6475134630792]
本稿では,不完全な多視点観測のための深い変動情報ボトルネック (IB) 手法を提案する。
本手法は,対象物に関連のある視点内および視点間相互作用に焦点をあてるために,観測された視点の辺縁および結合表現にISBフレームワークを適用した。
実世界のデータセットの実験から、我々の手法はデータ統合から常に利益を得て、最先端のベンチマークより優れています。
論文 参考訳(メタデータ) (2021-02-05T06:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。