論文の概要: Self-Supervised Contrastive BERT Fine-tuning for Fusion-based
Reviewed-Item Retrieval
- arxiv url: http://arxiv.org/abs/2308.00762v1
- Date: Tue, 1 Aug 2023 18:01:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-03 14:48:56.423923
- Title: Self-Supervised Contrastive BERT Fine-tuning for Fusion-based
Reviewed-Item Retrieval
- Title(参考訳): 核融合によるレビュー項目検索のための自己監督コントラストBERTファインタニング
- Authors: Mohammad Mahdi Abdollah Pour, Parsa Farinneya, Armin Toroghi, Anton
Korikov, Ali Pesaranghader, Touqir Sajed, Manasa Bharadwaj, Borislav Mavrin,
and Scott Sanner
- Abstract要約: 我々は、クエリをドキュメントにマッチさせるニューラルネットワーク検索(IR)手法を、項目をレビューするタスクに拡張する。
我々は,クエリとレビューの両方に対して,BERT埋め込みのコントラスト学習に自己教師付き手法を用いる。
レイトフュージョンのシナリオにおける対照的な学習について、同じ項目および/または同じ評価の正のレビューサンプルの使用について検討する。
よりエンドツーエンドのEarly Fusionアプローチでは、レビューを単一項目の埋め込みに融合するために、対照的なアイテム埋め込み学習を導入します。
- 参考スコア(独自算出の注目度): 12.850360384298712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As natural language interfaces enable users to express increasingly complex
natural language queries, there is a parallel explosion of user review content
that can allow users to better find items such as restaurants, books, or movies
that match these expressive queries. While Neural Information Retrieval (IR)
methods have provided state-of-the-art results for matching queries to
documents, they have not been extended to the task of Reviewed-Item Retrieval
(RIR), where query-review scores must be aggregated (or fused) into item-level
scores for ranking. In the absence of labeled RIR datasets, we extend Neural IR
methodology to RIR by leveraging self-supervised methods for contrastive
learning of BERT embeddings for both queries and reviews. Specifically,
contrastive learning requires a choice of positive and negative samples, where
the unique two-level structure of our item-review data combined with meta-data
affords us a rich structure for the selection of these samples. For contrastive
learning in a Late Fusion scenario, we investigate the use of positive review
samples from the same item and/or with the same rating, selection of hard
positive samples by choosing the least similar reviews from the same anchor
item, and selection of hard negative samples by choosing the most similar
reviews from different items. We also explore anchor sub-sampling and
augmenting with meta-data. For a more end-to-end Early Fusion approach, we
introduce contrastive item embedding learning to fuse reviews into single item
embeddings. Experimental results show that Late Fusion contrastive learning for
Neural RIR outperforms all other contrastive IR configurations, Neural IR, and
sparse retrieval baselines, thus demonstrating the power of exploiting the
two-level structure in Neural RIR approaches as well as the importance of
preserving the nuance of individual review content via Late Fusion methods.
- Abstract(参考訳): 自然言語インタフェースによって、ユーザーはますます複雑な自然言語クエリを表現できるようになるため、レストラン、本、映画などの、表現力のあるクエリにマッチするアイテムをよりよく見つけることができるように、ユーザーレビューコンテンツが急増している。
Neural Information Retrieval (IR)メソッドは、クエリをドキュメントにマッチさせるための最先端の結果を提供しているが、クエリレビュースコアをアイテムレベルのスコアに集約(あるいは融合)する必要があるRIR(Reviewed-Item Retrieval)タスクには拡張されていない。
ラベル付きRIRデータセットがない場合には、クエリとレビューの両方にBERT埋め込みを対比学習するための自己教師付き手法を活用することで、Neural IRの方法論をRIRに拡張する。
特に、対照的な学習には正と負のサンプルを選択する必要があり、項目レビューデータのユニークな2レベル構造とメタデータを組み合わせることで、これらのサンプルを選択するための豊富な構造が得られます。
後期融合シナリオにおける対比学習のために,同一項目からの肯定的なレビューサンプルと/または同一のレーティング,同じアンカー項目から最も類似しないレビューを選択することでハードポジティブなサンプルの選択,異なる項目から最も類似したレビューを選択することでハードネガティブなサンプルの選択について検討する。
アンカーサブサンプリングやメタデータの拡張についても検討しています。
よりエンドツーエンドの早期融合アプローチでは、レビューを単一の項目埋め込みに融合するために、対照的な項目埋め込み学習を導入する。
実験の結果,ニューラルrirにおけるレイトフュージョンコントラスト学習は,他のすべてのコントラストir構成,ニューラルir,スパース検索ベースラインよりも優れており,ニューラルrirアプローチにおいて2段階構造を利用する能力と,レイトフュージョン法による個々のレビューコンテンツのニュアンス保持の重要性が示された。
関連論文リスト
- Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - AMRFact: Enhancing Summarization Factuality Evaluation with AMR-driven
Training Data Generation [63.18211192998151]
本稿では,現実的に一貫性のない要約を生成する新しいフレームワークであるAMRFactを提案する。
提案手法は, 現実的に正しい要約をAMRグラフに解析し, 否定的な例を生成するために制御された事実矛盾を注入する。
提案手法は,AggreFact-SOTAデータセットにおいて,従来のシステムよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-11-16T02:56:29Z) - Topology-aware Debiased Self-supervised Graph Learning for
Recommendation [6.893289671937124]
本稿では,TDGL(Topology-aware De Self-supervised Graph Learning)を提案する。
TDSGLはユーザ間の意味的類似性(items)に応じてコントラッシブなペアを構成する
その結果,提案モデルが3つの公開データセット上で,最先端モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-10-24T14:16:19Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Feature Extraction Framework based on Contrastive Learning with Adaptive
Positive and Negative Samples [1.4467794332678539]
フレームワークは、教師なし、教師なし、および半教師なしの単一ビュー特徴抽出に適している。
CL-FEFAは、特徴抽出の結果から正および負のサンプルを適応的に構成する。
CL-FEFAは、ポテンシャル構造の類似したサンプルである正のサンプル間の相互情報を考慮し、特徴抽出の利点を理論的に支持する。
論文 参考訳(メタデータ) (2022-01-11T13:34:03Z) - SIFN: A Sentiment-aware Interactive Fusion Network for Review-based Item
Recommendation [48.1799451277808]
本稿では、レビューに基づく項目推薦のための感性認識型インタラクティブフュージョンネットワーク(SIFN)を提案する。
まず、BERTを介してユーザ/イテムレビューをエンコードし、各レビューのセマンティックな特徴を抽出する軽量な感情学習者を提案する。
そこで我々は,感情学習者が明示的な感情ラベルを用いて感情認識特徴を抽出するための感情予測タスクを提案する。
論文 参考訳(メタデータ) (2021-08-18T08:04:38Z) - Generation-Augmented Retrieval for Open-domain Question Answering [134.27768711201202]
GAR(Generation-Augmented Retrieval)は、オープンドメインの質問に答える機能である。
クエリーに対して多様なコンテキストを生成することは、結果の融合が常により良い検索精度をもたらすので有益であることを示す。
GARは、抽出読取装置を備えた場合、抽出QA設定の下で、自然質問およびトリビアQAデータセットの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-09-17T23:08:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。