論文の概要: PR-Net: Preference Reasoning for Personalized Video Highlight Detection
- arxiv url: http://arxiv.org/abs/2109.01799v1
- Date: Sat, 4 Sep 2021 06:12:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-07 16:40:35.858896
- Title: PR-Net: Preference Reasoning for Personalized Video Highlight Detection
- Title(参考訳): PR-Net:パーソナライズされたビデオハイライト検出のための参照推論
- Authors: Runnan Chen, Penghao Zhou, Wenzhe Wang, Nenglun Chen, Pai Peng, Xing
Sun, Wenping Wang
- Abstract要約: 本稿では,フレームレベルのハイライト予測を考慮し,多種多様な関心事を考慮した簡易かつ効率的な選好推論フレームワーク(PR-Net)を提案する。
提案手法は, 平均精度が12%向上し, 最先端手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 34.71807317380797
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Personalized video highlight detection aims to shorten a long video to
interesting moments according to a user's preference, which has recently raised
the community's attention. Current methods regard the user's history as
holistic information to predict the user's preference but negating the inherent
diversity of the user's interests, resulting in vague preference
representation. In this paper, we propose a simple yet efficient preference
reasoning framework (PR-Net) to explicitly take the diverse interests into
account for frame-level highlight prediction. Specifically, distinct
user-specific preferences for each input query frame are produced, presented as
the similarity weighted sum of history highlights to the corresponding query
frame. Next, distinct comprehensive preferences are formed by the user-specific
preferences and a learnable generic preference for more overall highlight
measurement. Lastly, the degree of highlight and non-highlight for each query
frame is calculated as semantic similarity to its comprehensive and
non-highlight preferences, respectively. Besides, to alleviate the ambiguity
due to the incomplete annotation, a new bi-directional contrastive loss is
proposed to ensure a compact and differentiable metric space. In this way, our
method significantly outperforms state-of-the-art methods with a relative
improvement of 12% in mean accuracy precision.
- Abstract(参考訳): パーソナライズされたビデオハイライト検出は、ユーザの好みに応じて、長い動画を興味深い瞬間に短縮することを目的としている。
現在の手法では、ユーザの履歴を総合的な情報として、ユーザの嗜好を予測するが、ユーザの興味の固有の多様性を否定し、曖昧な選好表現をもたらす。
本稿では,フレームレベルのハイライト予測を考慮し,多種多様性を考慮した簡易かつ効率的な選好推論フレームワーク(PR-Net)を提案する。
具体的には、それぞれの入力クエリフレームに対して異なるユーザ固有の好みを生成し、対応するクエリフレームに対する履歴ハイライトの類似度重み付け和として提示する。
次に、ユーザ固有の選好と、より全体的なハイライト測定のための学習可能な総合選好によって、異なる包括的選好が形成される。
最後に、各クエリフレームのハイライト度と非ハイライト度を、その包括的および非ハイライト的嗜好と意味的類似度として算出する。
さらに、不完全アノテーションによる曖昧さを軽減するために、コンパクトで微分可能な距離空間を確保するために、新しい双方向のコントラスト損失を提案する。
このように,本手法は,平均精度が12%の相対的改善で最先端手法を著しく上回っている。
関連論文リスト
- Separating and Learning Latent Confounders to Enhancing User Preferences
Modeling [6.839357057621987]
本研究では,過去のフィードバックからユーザの好みを捉え,候補項目に対するユーザ固有のフィードバックを予測するリコメンデータモデルについて検討する。
既存のデバイアスモデルでは,(1)特定のバイアスの解決に特化しているか,(2)ユーザの履歴フィードバックから直接補助情報を取得するかのいずれかである。
我々は,textbfSeparating and textbfLearning Latent Confounders textbfFor textbfRecommendationを提案する。
論文 参考訳(メタデータ) (2023-11-02T08:42:50Z) - Disentangled Representation for Diversified Recommendations [41.477162048806434]
正確性と多様性は、リコメンデーションの2つの相反する目標だと考えられてきた。
本稿では,推薦アルゴリズムの選択に依存しない一般的な多様化フレームワークを提案する。
我々のソリューションは、レコメンデーションモジュールの学習したユーザ表現を、カテゴリに依存しない、カテゴリに依存しないコンポーネントに切り離します。
論文 参考訳(メタデータ) (2023-01-13T11:47:10Z) - Show Me What I Like: Detecting User-Specific Video Highlights Using
Content-Based Multi-Head Attention [58.44096082508686]
そこで本稿では,従来視聴したビデオに表示されていたハイライトクリップに基づいて,対象ビデオの個別化ハイライトを検出する手法を提案する。
本手法は,対象物と人的活動の事前学習機能を用いて,好むクリップの内容と対象ビデオの両方を明示的に活用する。
論文 参考訳(メタデータ) (2022-07-18T02:32:48Z) - Everyone's Preference Changes Differently: Weighted Multi-Interest
Retrieval Model [18.109035867113217]
MIPモデル(Multi-Interest Preference)は、ユーザのシーケンシャルエンゲージメントをより効果的に利用することで、ユーザにとってマルチエンゲージメントを生み出すアプローチである。
本手法の有効性を実証するため,様々な産業規模のデータセットを用いて大規模な実験を行った。
論文 参考訳(メタデータ) (2022-07-14T04:29:54Z) - Meta-Wrapper: Differentiable Wrapping Operator for User Interest
Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。
近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。
そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2022-06-28T03:28:15Z) - OptWedge: Cognitive Optimized Guidance toward Off-screen POIs [0.0]
本稿では,画面外関心点(POI)を小型デバイスに導く新しい方法を提案する。
精度を向上させるために,その影響を考慮した認知的コストを用いて図形を最適化することを提案する。
また、異なるパラメータを持つ2つのタイプの最適化を設計する: Unbiased OptWedge (UOW) と biased OptWedge (BOW) である。
論文 参考訳(メタデータ) (2022-06-09T05:56:16Z) - Price DOES Matter! Modeling Price and Interest Preferences in
Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。
セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。
セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文 参考訳(メタデータ) (2022-05-09T10:47:15Z) - An Efficient and Accurate Rough Set for Feature Selection,
Classification and Knowledge Representation [89.5951484413208]
本稿では, 特徴選択, 分類, 知識表現を同時に実現する, 粗集合に基づく強力なデータマイニング手法を提案する。
まず, ノイズ特性の処理において, 粗集合の非効率性について検討し, 相対的重要度と呼ばれる特性のロバストな測定法を提案する。
公開ベンチマークデータセットによる実験結果から,提案フレームワークは7つの人気や最先端の機能選択手法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2021-12-29T12:45:49Z) - Set2setRank: Collaborative Set to Set Ranking for Implicit Feedback
based Recommendation [59.183016033308014]
本稿では,暗黙的フィードバックの特徴を探究し,推奨するSet2setRankフレームワークを提案する。
提案するフレームワークはモデルに依存しず,ほとんどの推奨手法に容易に適用できる。
論文 参考訳(メタデータ) (2021-05-16T08:06:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。