論文の概要: Semi-supervised Collaborative Filtering by Text-enhanced Domain
Adaptation
- arxiv url: http://arxiv.org/abs/2007.07085v1
- Date: Sun, 28 Jun 2020 05:28:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-16 02:23:53.295314
- Title: Semi-supervised Collaborative Filtering by Text-enhanced Domain
Adaptation
- Title(参考訳): テキストエンハンスドメイン適応による半教師あり協調フィルタリング
- Authors: Wenhui Yu and Xiao Lin and Junfeng Ge and Wenwu Ou and Zheng Qin
- Abstract要約: 半教師付き学習課題として、疎い暗黙のフィードバックを推奨する問題を考察する。
もっとも難しいケースにフォーカスします -- ユーザや項目の重複はありません。
我々は、潜在空間を整列させるためにアンカーポイントとして、ドメイン不変のテキスト特徴を採用する。
- 参考スコア(独自算出の注目度): 32.93934837792708
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data sparsity is an inherent challenge in the recommender systems, where most
of the data is collected from the implicit feedbacks of users. This causes two
difficulties in designing effective algorithms: first, the majority of users
only have a few interactions with the system and there is no enough data for
learning; second, there are no negative samples in the implicit feedbacks and
it is a common practice to perform negative sampling to generate negative
samples. However, this leads to a consequence that many potential positive
samples are mislabeled as negative ones and data sparsity would exacerbate the
mislabeling problem. To solve these difficulties, we regard the problem of
recommendation on sparse implicit feedbacks as a semi-supervised learning task,
and explore domain adaption to solve it. We transfer the knowledge learned from
dense data to sparse data and we focus on the most challenging case -- there is
no user or item overlap. In this extreme case, aligning embeddings of two
datasets directly is rather sub-optimal since the two latent spaces encode very
different information. As such, we adopt domain-invariant textual features as
the anchor points to align the latent spaces. To align the embeddings, we
extract the textual features for each user and item and feed them into a domain
classifier with the embeddings of users and items. The embeddings are trained
to puzzle the classifier and textual features are fixed as anchor points. By
domain adaptation, the distribution pattern in the source domain is transferred
to the target domain. As the target part can be supervised by domain
adaptation, we abandon negative sampling in target dataset to avoid label
noise. We adopt three pairs of real-world datasets to validate the
effectiveness of our transfer strategy. Results show that our models outperform
existing models significantly.
- Abstract(参考訳): データスパシティは、ユーザーの暗黙のフィードバックからほとんどのデータが収集されるレコメンデータシステムにおいて、固有の課題である。
これは効果的なアルゴリズムを設計するのに2つの困難を生じさせる: 第一に、ユーザーの大多数はシステムとのわずかなインタラクションしか持たず、学習に十分なデータがない;第二に、暗黙的なフィードバックに負のサンプルはなく、負のサンプルを生成するために負のサンプリングを実行するのが一般的である。
しかし、この結果、多くの潜在的な正のサンプルが負のサンプルとして誤記され、データのスパーシティが誤記問題を悪化させる結果となる。
これらの課題を解決するため,暗黙的なフィードバックを半教師付き学習課題として推薦する問題を考察し,それを解決するためのドメイン適応を探る。
密なデータから学んだ知識を疎いデータに転送し、最も困難なケースに焦点を当てます。
この極端なケースでは、2つのデータセットを直接埋め込むことは、非常に異なる情報をエンコードするため、むしろ準最適である。
したがって、潜在空間を整列するアンカーポイントとして、ドメイン不変なテクスト的特徴を採用する。
埋め込みを整合させるために,各ユーザとアイテムのテキストの特徴を抽出し,ユーザとアイテムの埋め込みを伴うドメイン分類器に入力する。
埋め込みは分類器を困らせるように訓練され、テキストの特徴はアンカーポイントとして固定される。
ドメイン適応により、ソースドメイン内の分散パターンはターゲットドメインに転送される。
対象部分はドメイン適応によって監視できるため、ラベルノイズを避けるために対象データセットの負のサンプリングを放棄する。
転送戦略の有効性を検証するために,実世界のデータセットを3組採用する。
その結果,我々のモデルは既存モデルよりも大幅に優れていた。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - High-order Neighborhoods Know More: HyperGraph Learning Meets Source-free Unsupervised Domain Adaptation [34.08681468394247]
Source-free Unsupervised Domain Adaptationは、未学習のソースモデルと未学習のターゲットモデルにのみアクセスすることで、ターゲットサンプルを分類することを目的としている。
既存の手法は、通常、対象サンプル間のペアワイズ関係を利用して、これらのサンプルを意味的特徴に基づいてクラスタリングすることで、それらの相関関係を見つけようとする。
本研究では、高次近傍関係を利用して、ドメインシフト効果を明示的に考慮した新しいSFDA法を提案する。
論文 参考訳(メタデータ) (2024-05-11T05:07:43Z) - Holistic Transfer: Towards Non-Disruptive Fine-Tuning with Partial
Target Data [32.91362206231936]
本稿では,事前学習したソースモデルを対象領域に適応させ,ソースデータに現れるすべてのクラスを分類する学習問題を提案する。
対象のエンドユーザが適応前にすべてのクラスのデータを集めるのは現実的ではないため,この問題は現実的だ。
欠落したクラスの精度を保ち、全体的な性能を向上する有効なソリューションをいくつか提示する。
論文 参考訳(メタデータ) (2023-11-02T17:35:16Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - AcroFOD: An Adaptive Method for Cross-domain Few-shot Object Detection [59.10314662986463]
クロスドメインの少数ショットオブジェクト検出は、いくつかの注釈付きターゲットデータで対象ドメイン内のオブジェクト検出器を適応することを目的としている。
提案手法は,複数のベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-09-22T10:23:40Z) - Low-confidence Samples Matter for Domain Adaptation [47.552605279925736]
ドメイン適応(DA)は、知識をラベルの豊富なソースドメインから関連するがラベルの少ないターゲットドメインに転送することを目的としている。
低信頼度サンプルの処理による新しいコントラスト学習法を提案する。
提案手法を教師なしと半教師付きの両方のDA設定で評価する。
論文 参考訳(メタデータ) (2022-02-06T15:45:45Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Domain Adaptive Semantic Segmentation without Source Data [50.18389578589789]
モデルがソースドメイン上で事前学習されていることを前提として、ソースデータのないドメイン適応セマンティックセマンティックセマンティックセマンティクスについて検討する。
本稿では,この課題に対して,肯定的学習と否定的学習という2つの要素を用いた効果的な枠組みを提案する。
私たちのフレームワークは、パフォーマンスをさらに向上するために、他のメソッドに簡単に実装および組み込むことができます。
論文 参考訳(メタデータ) (2021-10-13T04:12:27Z) - Alleviating Semantic-level Shift: A Semi-supervised Domain Adaptation
Method for Semantic Segmentation [97.8552697905657]
このタスクの重要な課題は、ソースとターゲットドメイン間のデータ分散の相違を緩和する方法である。
本稿では,グローバルな視点とローカルな視点の両方から分布の整合性を促進できるASS(Alleviating Semantic-level Shift)を提案する。
GTA5、Cityscapes、Synthia、Cityscapesの2つのドメイン適応タスクにASSを適用します。
論文 参考訳(メタデータ) (2020-04-02T03:25:05Z) - Person Re-identification: Implicitly Defining the Receptive Fields of
Deep Learning Classification Frameworks [5.123298347655088]
本稿では,ネットワークの受容領域の推論を暗黙的に駆動する手法について述べる。
セグメンテーションモジュールを使用して、各学習インスタンスの前景(重要)/バックグラウンド(無関係)を区別します。
この戦略は典型的にネットワークを早期収束と適切な解へと駆り立て、アイデンティティと記述は相関しない。
論文 参考訳(メタデータ) (2020-01-30T11:45:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。