論文の概要: Cross-Domain Generalization Through Memorization: A Study of Nearest
Neighbors in Neural Duplicate Question Detection
- arxiv url: http://arxiv.org/abs/2011.11090v1
- Date: Sun, 22 Nov 2020 19:19:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 09:08:59.199512
- Title: Cross-Domain Generalization Through Memorization: A Study of Nearest
Neighbors in Neural Duplicate Question Detection
- Title(参考訳): 暗記によるドメイン間一般化:ニューラルドプリケート質問検出における近隣住民の検討
- Authors: Yadollah Yaghoobzadeh, Alexandre Rochette and Timothy J. Hazen
- Abstract要約: 重複質問検出(DQD)は,コミュニティの効率向上と自動質問応答システムの実現に重要である。
我々は、DQDのクロスドメイン一般化のために、ニューラル表現を活用し、近接する隣人を研究する。
StackExchange、Spring、Quoraの各データセットの異なるクロスドメインシナリオにおいて、このメソッドの堅牢なパフォーマンスを観察します。
- 参考スコア(独自算出の注目度): 72.01292864036087
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Duplicate question detection (DQD) is important to increase efficiency of
community and automatic question answering systems. Unfortunately, gathering
supervised data in a domain is time-consuming and expensive, and our ability to
leverage annotations across domains is minimal. In this work, we leverage
neural representations and study nearest neighbors for cross-domain
generalization in DQD. We first encode question pairs of the source and target
domain in a rich representation space and then using a k-nearest neighbour
retrieval-based method, we aggregate the neighbors' labels and distances to
rank pairs. We observe robust performance of this method in different
cross-domain scenarios of StackExchange, Spring and Quora datasets,
outperforming cross-entropy classification in multiple cases.
- Abstract(参考訳): 重複質問検出(DQD)は,コミュニティと自動質問応答システムの効率化に重要である。
残念ながら、ドメイン内の教師付きデータの収集には時間と費用がかかり、ドメイン間でアノテーションを活用する能力は最小限です。
本研究では,dqdにおけるクロスドメイン一般化のために,ニューラル表現を活用し,最近傍の研究を行う。
まず、音源と対象領域の質問対をリッチな表現空間にエンコードし、次にk-nearest近傍検索に基づく手法を用いて、隣人のラベルと距離をランク付けする。
stackexchange、spring、quoraといったさまざまなクロスドメインシナリオにおいて、この方法の堅牢なパフォーマンスを観察し、複数のケースでクロスエントロピー分類を上回っています。
関連論文リスト
- Context-aware Domain Adaptation for Time Series Anomaly Detection [69.3488037353497]
時系列異常検出は、幅広い現実世界の応用において難しい課題である。
近年,類似分野の知識を活用するため,時系列領域適応への取り組みが進められている。
本研究では,コンテキストサンプリングと異常検出を併用した共同学習手法を提案する。
論文 参考訳(メタデータ) (2023-04-15T02:28:58Z) - Exploiting Graph Structured Cross-Domain Representation for Multi-Domain
Recommendation [71.45854187886088]
マルチドメインレコメンデータシステムは、クロスドメイン表現学習とポジティブな知識伝達の恩恵を受ける。
我々はMAGRecと呼ばれる手法のコンテキスト情報として時間的ドメイン内相互作用とドメイン間相互作用を用いる。
我々は、MAGRecが最先端の手法を一貫して上回る様々なシナリオで、公開データセットで実験を行う。
論文 参考訳(メタデータ) (2023-02-12T19:51:32Z) - Efficient Hierarchical Domain Adaptation for Pretrained Language Models [77.02962815423658]
生成言語モデルは、多種多様な一般的なドメインコーパスに基づいて訓練される。
計算効率のよいアダプタアプローチを用いて,ドメイン適応を多種多様なドメインに拡張する手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T11:09:29Z) - Adaptive Methods for Aggregated Domain Generalization [26.215904177457997]
多くの設定において、プライバシに関する懸念は、トレーニングデータサンプルのドメインラベルを取得することを禁止している。
本稿では,この問題に対するドメイン適応的アプローチを提案する。
提案手法は,ドメインラベルを使わずに,様々な領域一般化ベンチマークにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2021-12-09T08:57:01Z) - MD-CSDNetwork: Multi-Domain Cross Stitched Network for Deepfake
Detection [80.83725644958633]
現在のディープフェイク生成法では、偽画像やビデオの周波数スペクトルに識別的アーティファクトが残されている。
MD-CSDNetwork(MD-CSDNetwork)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2021-09-15T14:11:53Z) - Universal Cross-Domain Retrieval: Generalizing Across Classes and
Domains [27.920212868483702]
SnMpNetは、テスト中に遭遇した未確認のクラスとドメインを考慮に入れた2つの新しい損失を含む。
具体的には,目に見えるクラスと目に見えないクラスの知識ギャップを埋めるために,セマンティック・ネイバーフッド・ロスを導入した。
また、画像レベルでのミックスアップに基づく監視や、ミックスチャー予測損失を伴うトレーニング用データのセマンティックレベルも導入する。
論文 参考訳(メタデータ) (2021-08-18T19:21:04Z) - SPARTA: Efficient Open-Domain Question Answering via Sparse Transformer
Matching Retrieval [24.77260903221371]
SPARTAは,オープンドメイン質問応答の性能,一般化,解釈可能性を示す新しいニューラル検索手法である。
SPARTAはインバージョンインデックスとして効率的に実装可能なスパース表現を学習する。
我々は4つのオープンドメイン質問応答(OpenQA)タスクと11の検索質問応答(ReQA)タスクに対するアプローチを検証した。
論文 参考訳(メタデータ) (2020-09-28T02:11:02Z) - Mind the Gap: Enlarging the Domain Gap in Open Set Domain Adaptation [65.38975706997088]
オープンセットドメイン適応(OSDA)は、ターゲットドメインに未知のクラスが存在することを前提としている。
既存の最先端手法は、より大きなドメインギャップが存在する場合、かなりの性能低下を被ることを示す。
我々は、より大きなドメインギャップに特に対処するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-08T14:20:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。