Fugu-MT 論文翻訳(概要): Self-Supervised Contrastive BERT Fine-tuning for Fusion-based Reviewed-Item Retrieval

論文の概要: Self-Supervised Contrastive BERT Fine-tuning for Fusion-based Reviewed-Item Retrieval

arxiv url: http://arxiv.org/abs/2308.00762v1
Date: Tue, 1 Aug 2023 18:01:21 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-03 14:48:56.423923
Title: Self-Supervised Contrastive BERT Fine-tuning for Fusion-based Reviewed-Item Retrieval
Title（参考訳）: 核融合によるレビュー項目検索のための自己監督コントラストBERTファインタニング
Authors: Mohammad Mahdi Abdollah Pour, Parsa Farinneya, Armin Toroghi, Anton Korikov, Ali Pesaranghader, Touqir Sajed, Manasa Bharadwaj, Borislav Mavrin, and Scott Sanner
Abstract要約: 我々は、クエリをドキュメントにマッチさせるニューラルネットワーク検索(IR)手法を、項目をレビューするタスクに拡張する。我々は,クエリとレビューの両方に対して,BERT埋め込みのコントラスト学習に自己教師付き手法を用いる。レイトフュージョンのシナリオにおける対照的な学習について、同じ項目および/または同じ評価の正のレビューサンプルの使用について検討する。よりエンドツーエンドのEarly Fusionアプローチでは、レビューを単一項目の埋め込みに融合するために、対照的なアイテム埋め込み学習を導入します。
参考スコア（独自算出の注目度）: 12.850360384298712
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As natural language interfaces enable users to express increasingly complex natural language queries, there is a parallel explosion of user review content that can allow users to better find items such as restaurants, books, or movies that match these expressive queries. While Neural Information Retrieval (IR) methods have provided state-of-the-art results for matching queries to documents, they have not been extended to the task of Reviewed-Item Retrieval (RIR), where query-review scores must be aggregated (or fused) into item-level scores for ranking. In the absence of labeled RIR datasets, we extend Neural IR methodology to RIR by leveraging self-supervised methods for contrastive learning of BERT embeddings for both queries and reviews. Specifically, contrastive learning requires a choice of positive and negative samples, where the unique two-level structure of our item-review data combined with meta-data affords us a rich structure for the selection of these samples. For contrastive learning in a Late Fusion scenario, we investigate the use of positive review samples from the same item and/or with the same rating, selection of hard positive samples by choosing the least similar reviews from the same anchor item, and selection of hard negative samples by choosing the most similar reviews from different items. We also explore anchor sub-sampling and augmenting with meta-data. For a more end-to-end Early Fusion approach, we introduce contrastive item embedding learning to fuse reviews into single item embeddings. Experimental results show that Late Fusion contrastive learning for Neural RIR outperforms all other contrastive IR configurations, Neural IR, and sparse retrieval baselines, thus demonstrating the power of exploiting the two-level structure in Neural RIR approaches as well as the importance of preserving the nuance of individual review content via Late Fusion methods.
Abstract（参考訳）: 自然言語インタフェースによって、ユーザーはますます複雑な自然言語クエリを表現できるようになるため、レストラン、本、映画などの、表現力のあるクエリにマッチするアイテムをよりよく見つけることができるように、ユーザーレビューコンテンツが急増している。 Neural Information Retrieval (IR)メソッドは、クエリをドキュメントにマッチさせるための最先端の結果を提供しているが、クエリレビュースコアをアイテムレベルのスコアに集約(あるいは融合)する必要があるRIR(Reviewed-Item Retrieval)タスクには拡張されていない。ラベル付きRIRデータセットがない場合には、クエリとレビューの両方にBERT埋め込みを対比学習するための自己教師付き手法を活用することで、Neural IRの方法論をRIRに拡張する。特に、対照的な学習には正と負のサンプルを選択する必要があり、項目レビューデータのユニークな2レベル構造とメタデータを組み合わせることで、これらのサンプルを選択するための豊富な構造が得られます。後期融合シナリオにおける対比学習のために,同一項目からの肯定的なレビューサンプルと/または同一のレーティング,同じアンカー項目から最も類似しないレビューを選択することでハードポジティブなサンプルの選択,異なる項目から最も類似したレビューを選択することでハードネガティブなサンプルの選択について検討する。アンカーサブサンプリングやメタデータの拡張についても検討しています。よりエンドツーエンドの早期融合アプローチでは、レビューを単一の項目埋め込みに融合するために、対照的な項目埋め込み学習を導入する。実験の結果,ニューラルrirにおけるレイトフュージョンコントラスト学習は,他のすべてのコントラストir構成,ニューラルir,スパース検索ベースラインよりも優れており,ニューラルrirアプローチにおいて2段階構造を利用する能力と,レイトフュージョン法による個々のレビューコンテンツのニュアンス保持の重要性が示された。

関連論文リスト

Test-time Corpus Feedback: From Retrieval to RAG [21.517949407443453]
Retrieval-Augmented Generation (RAG) は知識集約型NLPタスクの標準フレームワークとして登場した。ほとんどのRAGパイプラインは、検索と推論を独立したコンポーネントとして扱い、ドキュメントを一度取り出し、さらに相互作用することなく回答を生成する。情報検索(IR)とNLPのコミュニティにおける最近の研究は、フィードバックを取り入れた適応的検索とランキング手法を導入して、このギャップを埋め始めている。
論文参考訳（メタデータ） (2025-08-21T10:57:38Z)
MIRAGE: A Metric-Intensive Benchmark for Retrieval-Augmented Generation Evaluation [8.950307082012763]
大規模言語モデル(LLM)の生成能力向上に有効な手法として,検索拡張生成(RAG)が注目されている。本稿では,RAG評価に特化して設計された質問応答データセットであるMIRAGEについて述べる。 MIRAGEは、37,800エントリの検索プールにマッピングされた7,560のキュレートされたインスタンスで構成され、検索と生成の両方のタスクの効率的かつ正確な評価を可能にする。
論文参考訳（メタデータ） (2025-04-23T23:05:46Z)
A Comprehensive Survey on Composed Image Retrieval [54.54527281731775]
Composed Image Retrieval (CIR)は、ユーザがマルチモーダルクエリを使ってターゲットイメージを検索できる、新しくて困難なタスクである。現在、この分野のタイムリーな概要を提供するため、CIRの包括的なレビューは行われていない。我々は、ACM TOIS、SIGIR、CVPRなど、トップカンファレンスやジャーナルで120以上の出版物から洞察を合成する。
論文参考訳（メタデータ） (2025-02-19T01:37:24Z)
Data Fusion of Synthetic Query Variants With Generative Large Language Models [1.864807003137943]
本研究は,データ融合実験において,命令調整型大規模言語モデルによって生成される合成クエリ変種を用いることの実現可能性について検討する。我々は、プロンプトとデータ融合の原則を生かした、軽量で教師なしで費用効率のよいアプローチを導入します。解析の結果,合成クエリの変種に基づくデータ融合は,単一クエリのベースラインよりもはるかに優れており,擬似関連フィードバック手法よりも優れていることがわかった。
論文参考訳（メタデータ） (2024-11-06T12:54:27Z)
Multi-Aspect Reviewed-Item Retrieval via LLM Query Decomposition and Aspect Fusion [15.630734768499826]
本稿では,自然言語製品クエリに対処する新しいアスペクト融合戦略を提案する。不均衡なレビューコーパスでは、AF は MAP@10 を 0.36 から 0.52 に増加させ、バランスの取れたレビューコーパスに対して同等のパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-08-01T19:04:10Z)
Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文参考訳（メタデータ） (2023-12-27T09:03:43Z)
AMRFact: Enhancing Summarization Factuality Evaluation with AMR-Driven Negative Samples Generation [57.8363998797433]
抽象的意味表現(AMR)を用いた摂動要約を生成するフレームワークであるAMRFactを提案する。提案手法は,AMRグラフに一貫した要約を解析し,制御された事実不整合を注入して負の例を生成し,一貫性のない事実不整合要約を高い誤差型カバレッジで生成する。
論文参考訳（メタデータ） (2023-11-16T02:56:29Z)
Topology-aware Debiased Self-supervised Graph Learning for Recommendation [6.893289671937124]
本稿では,TDGL(Topology-aware De Self-supervised Graph Learning)を提案する。 TDSGLはユーザ間の意味的類似性(items)に応じてコントラッシブなペアを構成するその結果,提案モデルが3つの公開データセット上で,最先端モデルよりも優れていたことが示唆された。
論文参考訳（メタデータ） (2023-10-24T14:16:19Z)
Incorporating Relevance Feedback for Information-Seeking Retrieval using Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文参考訳（メタデータ） (2022-10-19T16:19:37Z)
A Closer Look at Debiased Temporal Sentence Grounding in Videos: Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文参考訳（メタデータ） (2022-03-10T08:58:18Z)
SIFN: A Sentiment-aware Interactive Fusion Network for Review-based Item Recommendation [48.1799451277808]
本稿では、レビューに基づく項目推薦のための感性認識型インタラクティブフュージョンネットワーク(SIFN)を提案する。まず、BERTを介してユーザ/イテムレビューをエンコードし、各レビューのセマンティックな特徴を抽出する軽量な感情学習者を提案する。そこで我々は,感情学習者が明示的な感情ラベルを用いて感情認識特徴を抽出するための感情予測タスクを提案する。
論文参考訳（メタデータ） (2021-08-18T08:04:38Z)
SelfCF: A Simple Framework for Self-supervised Collaborative Filtering [72.68215241599509]
協調フィルタリング(CF)は、観測された相互作用からユーザやアイテムの情報的潜在表現を学習するために広く用いられている。本稿では,暗黙的なフィードバックを伴うレコメンデータシナリオに特化して設計された自己教師型協調フィルタリングフレームワーク(SelfCF)を提案する。自制フレームワークのBUIRと比較して,SelfCFは平均17.79%の精度向上を実現している。
論文参考訳（メタデータ） (2021-07-07T05:21:12Z)
Generation-Augmented Retrieval for Open-domain Question Answering [134.27768711201202]
GAR(Generation-Augmented Retrieval)は、オープンドメインの質問に答える機能である。クエリーに対して多様なコンテキストを生成することは、結果の融合が常により良い検索精度をもたらすので有益であることを示す。 GARは、抽出読取装置を備えた場合、抽出QA設定の下で、自然質問およびトリビアQAデータセットの最先端性能を達成する。
論文参考訳（メタデータ） (2020-09-17T23:08:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。