Fugu-MT 論文翻訳(概要): PR-Net: Preference Reasoning for Personalized Video Highlight Detection

論文の概要: PR-Net: Preference Reasoning for Personalized Video Highlight Detection

arxiv url: http://arxiv.org/abs/2109.01799v1
Date: Sat, 4 Sep 2021 06:12:13 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-07 16:40:35.858896
Title: PR-Net: Preference Reasoning for Personalized Video Highlight Detection
Title（参考訳）: PR-Net:パーソナライズされたビデオハイライト検出のための参照推論
Authors: Runnan Chen, Penghao Zhou, Wenzhe Wang, Nenglun Chen, Pai Peng, Xing Sun, Wenping Wang
Abstract要約: 本稿では,フレームレベルのハイライト予測を考慮し,多種多様な関心事を考慮した簡易かつ効率的な選好推論フレームワーク(PR-Net)を提案する。提案手法は, 平均精度が12%向上し, 最先端手法を著しく上回っている。
参考スコア（独自算出の注目度）: 34.71807317380797
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Personalized video highlight detection aims to shorten a long video to interesting moments according to a user's preference, which has recently raised the community's attention. Current methods regard the user's history as holistic information to predict the user's preference but negating the inherent diversity of the user's interests, resulting in vague preference representation. In this paper, we propose a simple yet efficient preference reasoning framework (PR-Net) to explicitly take the diverse interests into account for frame-level highlight prediction. Specifically, distinct user-specific preferences for each input query frame are produced, presented as the similarity weighted sum of history highlights to the corresponding query frame. Next, distinct comprehensive preferences are formed by the user-specific preferences and a learnable generic preference for more overall highlight measurement. Lastly, the degree of highlight and non-highlight for each query frame is calculated as semantic similarity to its comprehensive and non-highlight preferences, respectively. Besides, to alleviate the ambiguity due to the incomplete annotation, a new bi-directional contrastive loss is proposed to ensure a compact and differentiable metric space. In this way, our method significantly outperforms state-of-the-art methods with a relative improvement of 12% in mean accuracy precision.
Abstract（参考訳）: パーソナライズされたビデオハイライト検出は、ユーザの好みに応じて、長い動画を興味深い瞬間に短縮することを目的としている。現在の手法では、ユーザの履歴を総合的な情報として、ユーザの嗜好を予測するが、ユーザの興味の固有の多様性を否定し、曖昧な選好表現をもたらす。本稿では,フレームレベルのハイライト予測を考慮し,多種多様性を考慮した簡易かつ効率的な選好推論フレームワーク(PR-Net)を提案する。具体的には、それぞれの入力クエリフレームに対して異なるユーザ固有の好みを生成し、対応するクエリフレームに対する履歴ハイライトの類似度重み付け和として提示する。次に、ユーザ固有の選好と、より全体的なハイライト測定のための学習可能な総合選好によって、異なる包括的選好が形成される。最後に、各クエリフレームのハイライト度と非ハイライト度を、その包括的および非ハイライト的嗜好と意味的類似度として算出する。さらに、不完全アノテーションによる曖昧さを軽減するために、コンパクトで微分可能な距離空間を確保するために、新しい双方向のコントラスト損失を提案する。このように,本手法は,平均精度が12%の相対的改善で最先端手法を著しく上回っている。

関連論文リスト

Beyond the Binary: Capturing Diverse Preferences With Reward Regularization [15.518838657050173]
この二項選択への依存は、現実のタスクにおいて対象ユーザのより広範囲で集約的な嗜好を捉えるものではない、と我々は主張する。本稿では、既存の二分選好データセットを合成選好判断で拡張し、潜在的なユーザ不一致を推定する、シンプルで効果的な方法を提案する。
論文参考訳（メタデータ） (2024-12-05T02:35:46Z)
ComPO: Community Preferences for Language Model Personalization [122.54846260663922]
ComPOは、言語モデルにおける好みの最適化をパーソナライズする手法である。 ComPRedはRedditからコミュニティレベルの好みを持った質問応答データセットです。
論文参考訳（メタデータ） (2024-10-21T14:02:40Z)
Adaptive Preference Scaling for Reinforcement Learning with Human Feedback [103.36048042664768]
人間からのフィードバックからの強化学習(RLHF)は、AIシステムと人間の価値を合わせるための一般的なアプローチである。本稿では,分散ロバスト最適化(DRO)に基づく適応的優先損失を提案する。提案手法は多用途であり,様々な選好最適化フレームワークに容易に適用可能である。
論文参考訳（メタデータ） (2024-06-04T20:33:22Z)
Beyond Item Dissimilarities: Diversifying by Intent in Recommender Systems [20.04619904064599]
我々は,提案システムの最終段階を対象とした確率論的意図に基づく全ページ多様化フレームワークを開発する。さまざまな意図のライブ実験は、私たちのフレームワークがデイリーアクティブユーザーを増やし、全体のユーザーを楽しませていることを示している。
論文参考訳（メタデータ） (2024-05-20T18:52:33Z)
Beyond Static Calibration: The Impact of User Preference Dynamics on Calibrated Recommendation [3.324986723090369]
推薦システムの校正は重要な性能基準である。誤校正を緩和するための標準的な方法は、通常、ユーザの好みプロファイルが静的であると仮定する。このアプローチは、校正されたように見えるが、実際にはユーザの真の嗜好を歪めているようなレコメンデーションに繋がる可能性があると推測する。
論文参考訳（メタデータ） (2024-05-16T16:33:34Z)
Separating and Learning Latent Confounders to Enhancing User Preferences Modeling [6.0853798070913845]
我々は、推薦のための新しいフレームワーク、SLFR(Separating and Learning Latent Confounders for Recommendation)を提案する。 SLFRは、未測定の共同設立者の表現を取得し、ユーザ嗜好と未測定の共同設立者を遠ざけ、反実的なフィードバックを識別する。 5つの実世界のデータセットで実験を行い、本手法の利点を検証した。
論文参考訳（メタデータ） (2023-11-02T08:42:50Z)
Show Me What I Like: Detecting User-Specific Video Highlights Using Content-Based Multi-Head Attention [52.84233165201391]
そこで本稿では,従来視聴したビデオに表示されていたハイライトクリップに基づいて,対象ビデオの個別化ハイライトを検出する手法を提案する。本手法は,対象物と人的活動の事前学習機能を用いて,好むクリップの内容と対象ビデオの両方を明示的に活用する。
論文参考訳（メタデータ） (2022-07-18T02:32:48Z)
Everyone's Preference Changes Differently: Weighted Multi-Interest Retrieval Model [18.109035867113217]
MIPモデル(Multi-Interest Preference)は、ユーザのシーケンシャルエンゲージメントをより効果的に利用することで、ユーザにとってマルチエンゲージメントを生み出すアプローチである。本手法の有効性を実証するため,様々な産業規模のデータセットを用いて大規模な実験を行った。
論文参考訳（メタデータ） (2022-07-14T04:29:54Z)
Price DOES Matter! Modeling Price and Interest Preferences in Session-based Recommendation [55.0391061198924]
セッションベースのレコメンデーションは、匿名ユーザが自分の短い行動シーケンスに基づいて購入したいアイテムを予測することを目的としている。セッションベースのレコメンデーションの価格設定を組み込むのは簡単ではない。セッションベースレコメンデーションのためのCoHHN(Co-guided Heterogeneous Hypergraph Network)を提案する。
論文参考訳（メタデータ） (2022-05-09T10:47:15Z)
Set2setRank: Collaborative Set to Set Ranking for Implicit Feedback based Recommendation [59.183016033308014]
本稿では,暗黙的フィードバックの特徴を探究し,推奨するSet2setRankフレームワークを提案する。提案するフレームワークはモデルに依存しず,ほとんどの推奨手法に容易に適用できる。
論文参考訳（メタデータ） (2021-05-16T08:06:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。