論文の概要: Incorporating Vision Bias into Click Models for Image-oriented Search
Engine
- arxiv url: http://arxiv.org/abs/2101.02459v1
- Date: Thu, 7 Jan 2021 10:01:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 13:39:15.760957
- Title: Incorporating Vision Bias into Click Models for Image-oriented Search
Engine
- Title(参考訳): 画像指向検索エンジンのクリックモデルに視覚バイアスを組み込む
- Authors: Ningxin Xu, Cheng Yang, Yixin Zhu, Xiaowei Hu, Changhu Wang
- Abstract要約: 本論文では,画像指向検索エンジンに視覚バイアスが存在することを,位置以外の検査確率に影響する重要な要因と仮定する。
候補文書から抽出した視覚特徴から視覚バイアスを予測するために回帰型emアルゴリズムを用いた。
- 参考スコア(独自算出の注目度): 51.192784793764176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most typical click models assume that the probability of a document to be
examined by users only depends on position, such as PBM and UBM. It works well
in various kinds of search engines. However, in a search engine where massive
candidate documents display images as responses to the query, the examination
probability should not only depend on position. The visual appearance of an
image-oriented document also plays an important role in its opportunity to be
examined. In this paper, we assume that vision bias exists in an image-oriented
search engine as another crucial factor affecting the examination probability
aside from position. Specifically, we apply this assumption to classical click
models and propose an extended model, to better capture the examination
probabilities of documents. We use regression-based EM algorithm to predict the
vision bias given the visual features extracted from candidate documents.
Empirically, we evaluate our model on a dataset developed from a real-world
online image-oriented search engine, and demonstrate that our proposed model
can achieve significant improvements over its baseline model in data fitness
and sparsity handling.
- Abstract(参考訳): 典型的なクリックモデルは、ユーザーが文書を調べる確率はpbmやubmのような位置のみに依存すると仮定している。
さまざまな検索エンジンでうまく機能する。
しかし、大量の候補文書がクエリに対する応答として画像を表示する検索エンジンでは、検査確率は位置に依存するものではない。
画像指向文書の視覚的外観もまた、その検討の機会において重要な役割を果たす。
本稿では,画像指向型検索エンジンに視覚バイアスが存在することを,位置以外の検査確率に影響を与える重要な要因と仮定する。
具体的には、この仮定を古典的なクリックモデルに適用し、文書の検査可能性をよりよく把握する拡張モデルを提案する。
候補文書から抽出した視覚特徴から視覚バイアスを予測するために回帰型emアルゴリズムを用いた。
本研究では,実世界のオンライン画像指向検索エンジンから開発したデータセット上でのモデル評価を行い,提案モデルがデータ適合性とスパース性処理におけるベースラインモデルよりも大幅に改善できることを実証する。
関連論文リスト
- Measuring Agreeableness Bias in Multimodal Models [0.3529736140137004]
本稿では,複数モーダル言語モデルにおける画像に対する事前マーク付きオプションがモデル応答に影響を及ぼす現象について検討する。
複数選択質問の画像付きモデルを提示し、まず最初に正解し、次に予めマークされたオプションで同じモデルをバージョンに公開する。
この結果から,中立条件下での回答に矛盾する場合でも,事前マーク付きオプションに対するモデルの反応が著しく変化していることが判明した。
論文 参考訳(メタデータ) (2024-08-17T06:25:36Z) - Text-to-Image Diffusion Models are Great Sketch-Photo Matchmakers [120.49126407479717]
本稿では,ゼロショットスケッチに基づく画像検索(ZS-SBIR)のためのテキスト・画像拡散モデルについて検討する。
スケッチと写真の間のギャップをシームレスに埋めるテキストと画像の拡散モデルの能力。
論文 参考訳(メタデータ) (2024-03-12T00:02:03Z) - Debiasing Vision-Language Models via Biased Prompts [79.04467131711775]
本稿では,テキスト埋め込みにおけるバイアスのある方向を投影することで,視覚言語基盤モデルを疎外する一般的な手法を提案する。
偏平投影行列を組み込んだテキストのみをデバイアスすることで、ロバストな分類器と公正な生成モデルが得られることを示す。
論文 参考訳(メタデータ) (2023-01-31T20:09:33Z) - Pattern Spotting and Image Retrieval in Historical Documents using Deep
Hashing [60.67014034968582]
本稿では,歴史文書のデジタルコレクションにおける画像検索とパターンスポッティングのためのディープラーニング手法を提案する。
ディープラーニングモデルは、実数値またはバイナリコード表現を提供する2つの異なるバリエーションを考慮して、特徴抽出に使用される。
また,提案手法により検索時間を最大200倍に短縮し,関連する作業と比較してストレージコストを最大6,000倍に削減する。
論文 参考訳(メタデータ) (2022-08-04T01:39:37Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - Vision Models Are More Robust And Fair When Pretrained On Uncurated
Images Without Supervision [38.22842778742829]
差別的な自己教師型学習は、インターネット画像の任意のランダムなグループでのトレーニングモデルを可能にする。
データ前処理や事前の仮定なしで、何十億ものランダムなイメージでモデルをトレーニングします。
フェアネス、分布シフト、地理的多様性、微粒化認識、画像コピー検出、および多くの画像分類データセットを含む50以上のベンチマークにおいて、我々のモデル性能を広範囲に研究し、検証した。
論文 参考訳(メタデータ) (2022-02-16T22:26:47Z) - Visual Recognition with Deep Learning from Biased Image Datasets [6.10183951877597]
視覚認知の文脈において、バイアスモデルがどのように治療問題に適用できるかを示す。
作業中のバイアス機構に関する(近似的な)知識に基づいて、我々のアプローチは観察を再重み付けする。
本稿では,画像データベース間で共有される低次元画像表現を提案する。
論文 参考訳(メタデータ) (2021-09-06T10:56:58Z) - An Intelligent Hybrid Model for Identity Document Classification [0.0]
デジタル化は、生産性の向上、災害復旧、環境に優しいソリューションなどの機会とビジネスへの挑戦を提供する。
主な課題の1つは、顧客によって毎日アップロードされた多数のスキャンされたドキュメントを正確に分類することである。
画像分類の応用としてこの課題に対処する研究はほとんどない。
提案手法はPythonを用いて実装され、合成および実世界のデータセットで実験的に検証されている。
論文 参考訳(メタデータ) (2021-06-07T13:08:00Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。