論文の概要: PR-Net: Preference Reasoning for Personalized Video Highlight Detection
- arxiv url: http://arxiv.org/abs/2109.01799v1
- Date: Sat, 4 Sep 2021 06:12:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-07 16:40:35.858896
- Title: PR-Net: Preference Reasoning for Personalized Video Highlight Detection
- Title(参考訳): PR-Net:パーソナライズされたビデオハイライト検出のための参照推論
- Authors: Runnan Chen, Penghao Zhou, Wenzhe Wang, Nenglun Chen, Pai Peng, Xing
Sun, Wenping Wang
- Abstract要約: 本稿では,フレームレベルのハイライト予測を考慮し,多種多様な関心事を考慮した簡易かつ効率的な選好推論フレームワーク(PR-Net)を提案する。
提案手法は, 平均精度が12%向上し, 最先端手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 34.71807317380797
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Personalized video highlight detection aims to shorten a long video to
interesting moments according to a user's preference, which has recently raised
the community's attention. Current methods regard the user's history as
holistic information to predict the user's preference but negating the inherent
diversity of the user's interests, resulting in vague preference
representation. In this paper, we propose a simple yet efficient preference
reasoning framework (PR-Net) to explicitly take the diverse interests into
account for frame-level highlight prediction. Specifically, distinct
user-specific preferences for each input query frame are produced, presented as
the similarity weighted sum of history highlights to the corresponding query
frame. Next, distinct comprehensive preferences are formed by the user-specific
preferences and a learnable generic preference for more overall highlight
measurement. Lastly, the degree of highlight and non-highlight for each query
frame is calculated as semantic similarity to its comprehensive and
non-highlight preferences, respectively. Besides, to alleviate the ambiguity
due to the incomplete annotation, a new bi-directional contrastive loss is
proposed to ensure a compact and differentiable metric space. In this way, our
method significantly outperforms state-of-the-art methods with a relative
improvement of 12% in mean accuracy precision.
- Abstract(参考訳): パーソナライズされたビデオハイライト検出は、ユーザの好みに応じて、長い動画を興味深い瞬間に短縮することを目的としている。
現在の手法では、ユーザの履歴を総合的な情報として、ユーザの嗜好を予測するが、ユーザの興味の固有の多様性を否定し、曖昧な選好表現をもたらす。
本稿では,フレームレベルのハイライト予測を考慮し,多種多様性を考慮した簡易かつ効率的な選好推論フレームワーク(PR-Net)を提案する。
具体的には、それぞれの入力クエリフレームに対して異なるユーザ固有の好みを生成し、対応するクエリフレームに対する履歴ハイライトの類似度重み付け和として提示する。
次に、ユーザ固有の選好と、より全体的なハイライト測定のための学習可能な総合選好によって、異なる包括的選好が形成される。
最後に、各クエリフレームのハイライト度と非ハイライト度を、その包括的および非ハイライト的嗜好と意味的類似度として算出する。
さらに、不完全アノテーションによる曖昧さを軽減するために、コンパクトで微分可能な距離空間を確保するために、新しい双方向のコントラスト損失を提案する。
このように,本手法は,平均精度が12%の相対的改善で最先端手法を著しく上回っている。
関連論文リスト
- ComPO: Community Preferences for Language Model Personalization [122.54846260663922]
ComPOは、言語モデルにおける好みの最適化をパーソナライズする手法である。
ComPRedはRedditからコミュニティレベルの好みを持った質問応答データセットです。
論文 参考訳(メタデータ) (2024-10-21T14:02:40Z) - Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。
本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。
提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文 参考訳(メタデータ) (2024-06-04T20:33:22Z) - Beyond Item Dissimilarities: Diversifying by Intent in Recommender Systems [20.04619904064599]
我々は,提案システムの最終段階を対象とした確率論的意図に基づく全ページ多様化フレームワークを開発する。
さまざまな意図のライブ実験は、私たちのフレームワークがデイリーアクティブユーザーを増やし、全体のユーザーを楽しませていることを示している。
論文 参考訳(メタデータ) (2024-05-20T18:52:33Z) - Beyond Static Calibration: The Impact of User Preference Dynamics on Calibrated Recommendation [3.324986723090369]
推薦システムの校正は重要な性能基準である。
誤校正を緩和するための標準的な方法は、通常、ユーザの好みプロファイルが静的であると仮定する。
このアプローチは、校正されたように見えるが、実際にはユーザの真の嗜好を歪めているようなレコメンデーションに繋がる可能性があると推測する。
論文 参考訳(メタデータ) (2024-05-16T16:33:34Z) - Separating and Learning Latent Confounders to Enhancing User Preferences Modeling [6.0853798070913845]
我々は、推薦のための新しいフレームワーク、SLFR(Separating and Learning Latent Confounders for Recommendation)を提案する。
SLFRは、未測定の共同設立者の表現を取得し、ユーザ嗜好と未測定の共同設立者を遠ざけ、反実的なフィードバックを識別する。
5つの実世界のデータセットで実験を行い、本手法の利点を検証した。
論文 参考訳(メタデータ) (2023-11-02T08:42:50Z) - Show Me What I Like: Detecting User-Specific Video Highlights Using Content-Based Multi-Head Attention [52.84233165201391]
そこで本稿では,従来視聴したビデオに表示されていたハイライトクリップに基づいて,対象ビデオの個別化ハイライトを検出する手法を提案する。
本手法は,対象物と人的活動の事前学習機能を用いて,好むクリップの内容と対象ビデオの両方を明示的に活用する。
論文 参考訳(メタデータ) (2022-07-18T02:32:48Z) - Everyone's Preference Changes Differently: Weighted Multi-Interest
Retrieval Model [18.109035867113217]
MIPモデル(Multi-Interest Preference)は、ユーザのシーケンシャルエンゲージメントをより効果的に利用することで、ユーザにとってマルチエンゲージメントを生み出すアプローチである。
本手法の有効性を実証するため,様々な産業規模のデータセットを用いて大規模な実験を行った。
論文 参考訳(メタデータ) (2022-07-14T04:29:54Z) - Price DOES Matter! Modeling Price and Interest Preferences in
Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。
セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。
セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文 参考訳(メタデータ) (2022-05-09T10:47:15Z) - Set2setRank: Collaborative Set to Set Ranking for Implicit Feedback
based Recommendation [59.183016033308014]
本稿では,暗黙的フィードバックの特徴を探究し,推奨するSet2setRankフレームワークを提案する。
提案するフレームワークはモデルに依存しず,ほとんどの推奨手法に容易に適用できる。
論文 参考訳(メタデータ) (2021-05-16T08:06:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。