論文の概要: Wasserstein Distance Regularized Sequence Representation for Text
Matching in Asymmetrical Domains
- arxiv url: http://arxiv.org/abs/2010.07717v2
- Date: Sat, 17 Oct 2020 01:32:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 04:37:24.336631
- Title: Wasserstein Distance Regularized Sequence Representation for Text
Matching in Asymmetrical Domains
- Title(参考訳): 非対称領域におけるテキストマッチングのためのwasserstein距離正規化シーケンス表現
- Authors: Weijie Yu, Chen Xu, Jun Xu, Liang Pang, Xiaopeng Gao, Xiaozhao Wang
and Ji-Rong Wen
- Abstract要約: WD-Matchと呼ばれる非対称領域におけるテキストマッチングに適した新しいマッチング手法を提案する。
WD-Matchでは、ワッサーシュタイン距離に基づく正規化器が定義され、異なる領域から投影される特徴ベクトルを正規化する。
WD-Matchのトレーニングプロセスは、ワッサースタイン距離によって正規化されるマッチング損失を最小限に抑えるゲームに相当する。
- 参考スコア(独自算出の注目度): 51.91456788949489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One approach to matching texts from asymmetrical domains is projecting the
input sequences into a common semantic space as feature vectors upon which the
matching function can be readily defined and learned. In real-world matching
practices, it is often observed that with the training goes on, the feature
vectors projected from different domains tend to be indistinguishable. The
phenomenon, however, is often overlooked in existing matching models. As a
result, the feature vectors are constructed without any regularization, which
inevitably increases the difficulty of learning the downstream matching
functions. In this paper, we propose a novel match method tailored for text
matching in asymmetrical domains, called WD-Match. In WD-Match, a Wasserstein
distance-based regularizer is defined to regularize the features vectors
projected from different domains. As a result, the method enforces the feature
projection function to generate vectors such that those correspond to different
domains cannot be easily discriminated. The training process of WD-Match
amounts to a game that minimizes the matching loss regularized by the
Wasserstein distance. WD-Match can be used to improve different text matching
methods, by using the method as its underlying matching model. Four popular
text matching methods have been exploited in the paper. Experimental results
based on four publicly available benchmarks showed that WD-Match consistently
outperformed the underlying methods and the baselines.
- Abstract(参考訳): 非対称領域からテキストをマッチングする1つのアプローチは、入力列を特徴ベクトルとして共通の意味空間に投影し、マッチング関数を容易に定義し学習することである。
実世界のマッチングプラクティスでは、トレーニングが進むと、異なるドメインから投影される特徴ベクトルは区別できない傾向があることがしばしば観察される。
しかし、この現象は既存のマッチングモデルでは見過ごされがちである。
その結果, 特徴ベクトルは正規化せずに構築され, 下流マッチング関数の学習の難しさが必然的に増大する。
本稿では WD-Match と呼ばれる非対称領域におけるテキストマッチングに適した新しいマッチング手法を提案する。
WD-Matchでは、ワッサーシュタイン距離に基づく正規化器が定義され、異なる領域から投影される特徴ベクトルを正規化する。
その結果、異なる領域に対応するベクトルが容易に判別できないようなベクトルを生成するために特徴投影関数を強制する。
WD-Matchのトレーニングプロセスは、ワッサースタイン距離によって正規化されるマッチング損失を最小限に抑えるゲームに相当する。
WD-Matchは、その基礎となるマッチングモデルとして、異なるテキストマッチング方法を改善するために使用することができる。
論文では4つの一般的なテキストマッチング手法が活用されている。
4つの公開ベンチマークに基づく実験の結果、WD-Matchは基盤となるメソッドやベースラインよりも一貫して優れていた。
関連論文リスト
- On Partial Shape Correspondence and Functional Maps [9.175560202201819]
関数写像は部分性を呼び出すと推定された一致に誤差をもたらすと論じる。
部分形状マッチングのための新しい手法を提案する。
提案手法はSHREC'16データセットにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-10-23T08:32:50Z) - LRANet: Towards Accurate and Efficient Scene Text Detection with
Low-Rank Approximation Network [63.554061288184165]
低ランク近似に基づく新しいパラメータ化テキスト形状法を提案する。
異なるテキストの輪郭間の形状相関を探索することにより, 形状表現における一貫性, コンパクト性, 単純性, 頑健性を実現する。
我々はLRANetという名前の正確で効率的な任意の形状のテキスト検出器を実装した。
論文 参考訳(メタデータ) (2023-06-27T02:03:46Z) - RE-Matching: A Fine-Grained Semantic Matching Method for Zero-Shot
Relation Extraction [40.90544879476107]
ゼロショット関係抽出に適した微粒なセマンティックマッチング法を提案する。
文レベルの類似度スコアをエンティティとコンテキストマッチングスコアに分解する。
冗長なコンポーネントの明示的なアノテーションが欠如しているため、関係のない特徴を適応的に識別する特徴蒸留モジュールを設計する。
論文 参考訳(メタデータ) (2023-06-08T06:02:34Z) - Adaptive Assignment for Geometry Aware Local Feature Matching [22.818457285745733]
検出不要な特徴マッチングアプローチは、その優れたパフォーマンスのおかげで、現在大きな注目を集めている。
本稿では,AdaMatcherについて紹介する。AdaMatcherは特徴相関と協調可視領域推定を,精巧な特徴相互作用モジュールを通じて実現する。
次に、AdaMatcherは、画像間のスケールを推定しながらパッチレベルのマッチングに適応的な割り当てを行い、最後に、スケールアライメントとサブピクセルレグレッションモジュールを通じて、コビジブルマッチングを洗練する。
論文 参考訳(メタデータ) (2022-07-18T08:22:18Z) - VLAD-VSA: Cross-Domain Face Presentation Attack Detection with
Vocabulary Separation and Adaptation [87.9994254822078]
顔提示攻撃(PAD)の場合、スプーフィングキューのほとんどは微妙で局所的な画像パターンである。
VLADアグリゲーション法は,特徴空間を局所的に分割する視覚語彙を用いて局所特徴を定量化する。
提案する語彙分離法は,語彙をドメイン共有語とドメイン固有語に分割する。
論文 参考訳(メタデータ) (2022-02-21T15:27:41Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z) - Match-Ignition: Plugging PageRank into Transformer for Long-form Text
Matching [66.71886789848472]
実効性と効率性に対処する新しい階層型ノイズフィルタリングモデルであるMatch-Ignitionを提案する。
基本的なアイデアは、よく知られたPageRankアルゴリズムをTransformerに接続し、文と単語レベルの騒々しい情報を識別およびフィルタリングすることです。
文が長文の基本単位であるため、ノイズの多い文はたいてい簡単に検出できるので、PageRankを直接使用してそのような情報をフィルタリングする。
論文 参考訳(メタデータ) (2021-01-16T10:34:03Z) - Accelerating Text Mining Using Domain-Specific Stop Word Lists [57.76576681191192]
本稿では,超平面的アプローチと呼ばれるドメイン固有語の自動抽出手法を提案する。
ハイパープレーンベースのアプローチは、無関係な特徴を排除することによって、テキストの寸法を著しく削減することができる。
その結果,超平面型アプローチはコーパスの寸法を90%削減し,相互情報より優れることがわかった。
論文 参考訳(メタデータ) (2020-11-18T17:42:32Z) - Discovering linguistic (ir)regularities in word embeddings through
max-margin separating hyperplanes [0.0]
単語埋め込み空間において,関係する単語の相対的な位置を学習するための新しい手法を示す。
私たちのモデルであるSVMCosは、単語埋め込みのトレーニングにおいて、さまざまな実験的な選択に対して堅牢です。
論文 参考訳(メタデータ) (2020-03-07T20:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。