論文の概要: Self-Supervised Contrastive BERT Fine-tuning for Fusion-based
Reviewed-Item Retrieval
- arxiv url: http://arxiv.org/abs/2308.00762v1
- Date: Tue, 1 Aug 2023 18:01:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-03 14:48:56.423923
- Title: Self-Supervised Contrastive BERT Fine-tuning for Fusion-based
Reviewed-Item Retrieval
- Title(参考訳): 核融合によるレビュー項目検索のための自己監督コントラストBERTファインタニング
- Authors: Mohammad Mahdi Abdollah Pour, Parsa Farinneya, Armin Toroghi, Anton
Korikov, Ali Pesaranghader, Touqir Sajed, Manasa Bharadwaj, Borislav Mavrin,
and Scott Sanner
- Abstract要約: 我々は、クエリをドキュメントにマッチさせるニューラルネットワーク検索(IR)手法を、項目をレビューするタスクに拡張する。
我々は,クエリとレビューの両方に対して,BERT埋め込みのコントラスト学習に自己教師付き手法を用いる。
レイトフュージョンのシナリオにおける対照的な学習について、同じ項目および/または同じ評価の正のレビューサンプルの使用について検討する。
よりエンドツーエンドのEarly Fusionアプローチでは、レビューを単一項目の埋め込みに融合するために、対照的なアイテム埋め込み学習を導入します。
- 参考スコア(独自算出の注目度): 12.850360384298712
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As natural language interfaces enable users to express increasingly complex
natural language queries, there is a parallel explosion of user review content
that can allow users to better find items such as restaurants, books, or movies
that match these expressive queries. While Neural Information Retrieval (IR)
methods have provided state-of-the-art results for matching queries to
documents, they have not been extended to the task of Reviewed-Item Retrieval
(RIR), where query-review scores must be aggregated (or fused) into item-level
scores for ranking. In the absence of labeled RIR datasets, we extend Neural IR
methodology to RIR by leveraging self-supervised methods for contrastive
learning of BERT embeddings for both queries and reviews. Specifically,
contrastive learning requires a choice of positive and negative samples, where
the unique two-level structure of our item-review data combined with meta-data
affords us a rich structure for the selection of these samples. For contrastive
learning in a Late Fusion scenario, we investigate the use of positive review
samples from the same item and/or with the same rating, selection of hard
positive samples by choosing the least similar reviews from the same anchor
item, and selection of hard negative samples by choosing the most similar
reviews from different items. We also explore anchor sub-sampling and
augmenting with meta-data. For a more end-to-end Early Fusion approach, we
introduce contrastive item embedding learning to fuse reviews into single item
embeddings. Experimental results show that Late Fusion contrastive learning for
Neural RIR outperforms all other contrastive IR configurations, Neural IR, and
sparse retrieval baselines, thus demonstrating the power of exploiting the
two-level structure in Neural RIR approaches as well as the importance of
preserving the nuance of individual review content via Late Fusion methods.
- Abstract(参考訳): 自然言語インタフェースによって、ユーザーはますます複雑な自然言語クエリを表現できるようになるため、レストラン、本、映画などの、表現力のあるクエリにマッチするアイテムをよりよく見つけることができるように、ユーザーレビューコンテンツが急増している。
Neural Information Retrieval (IR)メソッドは、クエリをドキュメントにマッチさせるための最先端の結果を提供しているが、クエリレビュースコアをアイテムレベルのスコアに集約(あるいは融合)する必要があるRIR(Reviewed-Item Retrieval)タスクには拡張されていない。
ラベル付きRIRデータセットがない場合には、クエリとレビューの両方にBERT埋め込みを対比学習するための自己教師付き手法を活用することで、Neural IRの方法論をRIRに拡張する。
特に、対照的な学習には正と負のサンプルを選択する必要があり、項目レビューデータのユニークな2レベル構造とメタデータを組み合わせることで、これらのサンプルを選択するための豊富な構造が得られます。
後期融合シナリオにおける対比学習のために,同一項目からの肯定的なレビューサンプルと/または同一のレーティング,同じアンカー項目から最も類似しないレビューを選択することでハードポジティブなサンプルの選択,異なる項目から最も類似したレビューを選択することでハードネガティブなサンプルの選択について検討する。
アンカーサブサンプリングやメタデータの拡張についても検討しています。
よりエンドツーエンドの早期融合アプローチでは、レビューを単一の項目埋め込みに融合するために、対照的な項目埋め込み学習を導入する。
実験の結果,ニューラルrirにおけるレイトフュージョンコントラスト学習は,他のすべてのコントラストir構成,ニューラルir,スパース検索ベースラインよりも優れており,ニューラルrirアプローチにおいて2段階構造を利用する能力と,レイトフュージョン法による個々のレビューコンテンツのニュアンス保持の重要性が示された。
関連論文リスト
- Data Fusion of Synthetic Query Variants With Generative Large Language Models [1.864807003137943]
本研究は,データ融合実験において,命令調整型大規模言語モデルによって生成される合成クエリ変種を用いることの実現可能性について検討する。
我々は、プロンプトとデータ融合の原則を生かした、軽量で教師なしで費用効率のよいアプローチを導入します。
解析の結果,合成クエリの変種に基づくデータ融合は,単一クエリのベースラインよりもはるかに優れており,擬似関連フィードバック手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-11-06T12:54:27Z) - Multi-Aspect Reviewed-Item Retrieval via LLM Query Decomposition and Aspect Fusion [15.630734768499826]
本稿では,自然言語製品クエリに対処する新しいアスペクト融合戦略を提案する。
不均衡なレビューコーパスでは、AF は MAP@10 を 0.36 から 0.52 に増加させ、バランスの取れたレビューコーパスに対して同等のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-01T19:04:10Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8363998797433]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。
提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文 参考訳(メタデータ) (2023-11-16T02:56:29Z) - Topology-aware Debiased Self-supervised Graph Learning for
Recommendation [6.893289671937124]
本稿では,TDGL(Topology-aware De Self-supervised Graph Learning)を提案する。
TDSGLはユーザ間の意味的類似性(items)に応じてコントラッシブなペアを構成する
その結果,提案モデルが3つの公開データセット上で,最先端モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-10-24T14:16:19Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - SIFN: A Sentiment-aware Interactive Fusion Network for Review-based Item
Recommendation [48.1799451277808]
本稿では、レビューに基づく項目推薦のための感性認識型インタラクティブフュージョンネットワーク(SIFN)を提案する。
まず、BERTを介してユーザ/イテムレビューをエンコードし、各レビューのセマンティックな特徴を抽出する軽量な感情学習者を提案する。
そこで我々は,感情学習者が明示的な感情ラベルを用いて感情認識特徴を抽出するための感情予測タスクを提案する。
論文 参考訳(メタデータ) (2021-08-18T08:04:38Z) - Generation-Augmented Retrieval for Open-domain Question Answering [134.27768711201202]
GAR(Generation-Augmented Retrieval)は、オープンドメインの質問に答える機能である。
クエリーに対して多様なコンテキストを生成することは、結果の融合が常により良い検索精度をもたらすので有益であることを示す。
GARは、抽出読取装置を備えた場合、抽出QA設定の下で、自然質問およびトリビアQAデータセットの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-09-17T23:08:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。