論文の概要: Robust Relevance Feedback for Interactive Known-Item Video Search
- arxiv url: http://arxiv.org/abs/2505.15128v1
- Date: Wed, 21 May 2025 05:31:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:58.906053
- Title: Robust Relevance Feedback for Interactive Known-Item Video Search
- Title(参考訳): 対話型ノウンアイテムビデオ検索のためのロバスト関連フィードバック
- Authors: Zhixin Ma, Chong-Wah Ngo,
- Abstract要約: 我々は、トップk選択の安定性を改善するためのペアワイズ相対判定フィードバックを導入する。
ユーザ認識を複数のサブパーセプションに分解し,それぞれが独立した埋め込み空間として表現される。
我々は,各ユーザフィードバックインスタンスに基づいて,サブパーセプションの組み合わせを推定する予測的ユーザモデルを開発する。
- 参考スコア(独自算出の注目度): 30.382002857815497
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Known-item search (KIS) involves only a single search target, making relevance feedback-typically a powerful technique for efficiently identifying multiple positive examples to infer user intent-inapplicable. PicHunter addresses this issue by asking users to select the top-k most similar examples to the unique search target from a displayed set. Under ideal conditions, when the user's perception aligns closely with the machine's perception of similarity, consistent and precise judgments can elevate the target to the top position within a few iterations. However, in practical scenarios, expecting users to provide consistent judgments is often unrealistic, especially when the underlying embedding features used for similarity measurements lack interpretability. To enhance robustness, we first introduce a pairwise relative judgment feedback that improves the stability of top-k selections by mitigating the impact of misaligned feedback. Then, we decompose user perception into multiple sub-perceptions, each represented as an independent embedding space. This approach assumes that users may not consistently align with a single representation but are more likely to align with one or several among multiple representations. We develop a predictive user model that estimates the combination of sub-perceptions based on each user feedback instance. The predictive user model is then trained to filter out the misaligned sub-perceptions. Experimental evaluations on the large-scale open-domain dataset V3C indicate that the proposed model can optimize over 60% search targets to the top rank when their initial ranks at the search depth between 10 and 50. Even for targets initially ranked between 1,000 and 5,000, the model achieves a success rate exceeding 40% in optimizing ranks to the top, demonstrating the enhanced robustness of relevance feedback in KIS despite inconsistent feedback.
- Abstract(参考訳): Known-item search (KIS) は単一の検索対象のみを含み、関連性フィードバックは典型的には、複数のポジティブな例を効率的に識別してユーザ意図を適用できないようにするための強力なテクニックである。
PicHunterは、表示されたセットから、一意の検索ターゲットに最もよく似たトップkの例を選択して、この問題に対処する。
理想的な条件下では、ユーザの知覚が機械の類似性に対する認識と密接に一致している場合、一貫性のある正確な判断は、数回のイテレーションで目標を最上位の位置に引き上げることができる。
しかし、実際のシナリオでは、ユーザが一貫した判断を期待することは、特に類似度測定に使用される基礎となる埋め込み機能が解釈可能性に欠ける場合、しばしば非現実的である。
強靭性を高めるために,まず,不整合フィードバックの影響を軽減し,トップk選択の安定性を向上するペアワイズ相対判定フィードバックを導入する。
そして、ユーザ認識を複数のサブパーセプションに分解し、それぞれが独立した埋め込み空間として表現する。
このアプローチでは、ユーザーは単一の表現に一貫して整合しないかもしれないが、複数の表現のうち1つまたは複数の表現に整合する可能性が高いと仮定する。
我々は,各ユーザフィードバックインスタンスに基づいて,サブパーセプションの組み合わせを推定する予測的ユーザモデルを開発する。
予測的ユーザモデルは、ミスマッチしたサブパーセプションをフィルタリングするように訓練される。
大規模オープンドメインデータセットV3Cを用いた実験の結果,提案モデルでは,探索深度が10~50のとき,60%以上の探索目標を最上位に最適化できることがわかった。
当初1000から5000にランク付けされた目標であっても、このモデルはトップにランクを最適化する上で40%を超える成功率を達成し、一貫性のないフィードバックにもかかわらず、KISにおける関連フィードバックの堅牢性の向上を実証した。
関連論文リスト
- Mind the Gap! Static and Interactive Evaluations of Large Audio Models [55.87220295533817]
大型オーディオモデル(LAM)は、音声ネイティブな体験をパワーアップするために設計されている。
本研究は,484名の参加者から,LAMを評価し,7,500名のLAMインタラクションを収集する対話的アプローチを提案する。
論文 参考訳(メタデータ) (2025-02-21T20:29:02Z) - Unbiased Learning to Rank with Query-Level Click Propensity Estimation: Beyond Pointwise Observation and Relevance [74.43264459255121]
現実のシナリオでは、ユーザーは複数の関連するオプションを調べた後、1つまたは2つの結果だけをクリックします。
本稿では,ユーザが異なる検索結果リストをクリックする確率を捉えるために,クエリレベルのクリック確率モデルを提案する。
本手法では,2次元逆重み付け機構を導入し,相対飽和度と位置偏差に対処する。
論文 参考訳(メタデータ) (2025-02-17T03:55:51Z) - Conformal Prediction in Multi-User Settings: An Evaluation [0.10231119246773925]
マシンラーニングモデルは、ユーザを区別することなく、トレーニングされ、評価される。
これにより、マルチユーザ設定で不正確なパフォーマンス指標が生成される。
本研究では,複数のマルチユーザ設定における共形予測フレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-12-08T17:33:23Z) - End-to-End Context-Aided Unicity Matching for Person Re-identification [100.02321122258638]
本稿では,人間同士の一致関係を学習・精査するための,エンドツーエンドの対人一意整合アーキテクチャを提案する。
サンプルのグローバルコンテキスト関係を用いて,ソフトマッチング結果を洗練し,両部グラフマッチングにより一致ユニシティに到達する。
実世界における人物再識別の応用を十分に考慮し, ワンショットとマルチショットの双方で一様マッチングを実現する。
論文 参考訳(メタデータ) (2022-10-20T07:33:57Z) - Ordinal Graph Gamma Belief Network for Social Recommender Systems [54.9487910312535]
我々は,階層型ベイズモデルであるオーディナルグラフファクター解析(OGFA)を開発し,ユーザ・イテムとユーザ・ユーザインタラクションを共同でモデル化する。
OGFAは、優れたレコメンデーションパフォーマンスを達成するだけでなく、代表ユーザの好みに応じた解釈可能な潜在因子も抽出する。
我々はOGFAを,マルチ確率層深層確率モデルであるオーディナルグラフガンマ信念ネットワークに拡張する。
論文 参考訳(メタデータ) (2022-09-12T09:19:22Z) - Unbiased Pairwise Learning to Rank in Recommender Systems [4.058828240864671]
アルゴリズムをランク付けする偏見のない学習は、候補をアピールし、既に単一の分類ラベルを持つ多くのアプリケーションに適用されている。
本稿では,この課題に対処するための新しい非バイアス付きLTRアルゴリズムを提案する。
パブリックベンチマークデータセットと内部ライブトラフィックを用いた実験結果から,分類ラベルと連続ラベルのいずれにおいても提案手法の優れた結果が得られた。
論文 参考訳(メタデータ) (2021-11-25T06:04:59Z) - Set2setRank: Collaborative Set to Set Ranking for Implicit Feedback
based Recommendation [59.183016033308014]
本稿では,暗黙的フィードバックの特徴を探究し,推奨するSet2setRankフレームワークを提案する。
提案するフレームワークはモデルに依存しず,ほとんどの推奨手法に容易に適用できる。
論文 参考訳(メタデータ) (2021-05-16T08:06:22Z) - SetRank: A Setwise Bayesian Approach for Collaborative Ranking from
Implicit Feedback [50.13745601531148]
提案手法は,提案システムにおける暗黙的フィードバックの特性に対応するために,協調的ランキング(SeetRank)のためのセッティングワイドベイズ的手法を提案する。
具体的には、SetRankは、新しい設定された選好比較の後方確率を最大化することを目的としている。
また、SetRankの理論解析により、余剰リスクの境界が$sqrtM/N$に比例できることを示す。
論文 参考訳(メタデータ) (2020-02-23T06:40:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。