論文の概要: Retrieving Black-box Optimal Images from External Databases
- arxiv url: http://arxiv.org/abs/2112.14921v1
- Date: Thu, 30 Dec 2021 04:22:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 04:38:42.365678
- Title: Retrieving Black-box Optimal Images from External Databases
- Title(参考訳): 外部データベースからのブラックボックス最適画像検索
- Authors: Ryoma Sato
- Abstract要約: 我々は,画像データベースへのアクセスに制限のあるユーザが,自身のブラックボックス機能を使って画像を取得する方法を検討する。
この問題に対して効率的な検索アルゴリズムTiaraを提案する。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Suppose we have a black-box function (e.g., deep neural network) that takes
an image as input and outputs a value that indicates preference. How can we
retrieve optimal images with respect to this function from an external database
on the Internet? Standard retrieval problems in the literature (e.g., item
recommendations) assume that an algorithm has full access to the set of items.
In other words, such algorithms are designed for service providers. In this
paper, we consider the retrieval problem under different assumptions.
Specifically, we consider how users with limited access to an image database
can retrieve images using their own black-box functions. This formulation
enables a flexible and finer-grained image search defined by each user. We
assume the user can access the database through a search query with tight API
limits. Therefore, a user needs to efficiently retrieve optimal images in terms
of the number of queries. We propose an efficient retrieval algorithm Tiara for
this problem. In the experiments, we confirm that our proposed method performs
better than several baselines under various settings.
- Abstract(参考訳): イメージを入力として取り、好みを示す値を出力するブラックボックス関数(ディープニューラルネットワークなど)があると仮定する。
インターネット上の外部データベースからこの機能に関して最適な画像を取得するには?
文献における標準的な検索問題(例:アイテムレコメンデーション)は、アルゴリズムがアイテムの集合に完全にアクセスできると仮定する。
言い換えれば、そのようなアルゴリズムはサービスプロバイダ向けに設計されている。
本稿では,異なる仮定の下での検索問題を考察する。
具体的には,画像データベースへのアクセスに制限のあるユーザが,自身のブラックボックス機能を使って画像を検索する方法を検討する。
この定式化により、各ユーザが定義したフレキシブルできめ細かい画像検索が可能になる。
ユーザは、apiの制限が厳しい検索クエリを通じてデータベースにアクセスすることができると仮定する。
したがって、ユーザはクエリ数の観点から最適な画像を効率的に検索する必要がある。
この問題に対して効率的な検索アルゴリズムTiaraを提案する。
実験では,提案手法が複数のベースラインよりも優れた性能を示すことを確認した。
関連論文リスト
- Unified Text-to-Image Generation and Retrieval [96.72318842152148]
MLLM(Multimodal Large Language Models)の文脈における統一フレームワークを提案する。
まず,MLLMの内在的識別能力について検討し,学習自由な方法で検索を行うための生成的検索手法を提案する。
次に、自動回帰生成方式で生成と検索を統一し、生成した画像と検索した画像の最も適合した画像を選択する自律的決定モジュールを提案する。
論文 参考訳(メタデータ) (2024-06-09T15:00:28Z) - MaskSearch: Querying Image Masks at Scale [60.82746984506577]
MaskSearchは、クエリ結果の正確性を確保しながら、イメージマスクのデータベース上でクエリを高速化するシステムである。
試行錯誤実験の結果,圧縮データサイズの約5%のインデックスを用いたMaskSearchは,最大2桁のクエリを高速化することがわかった。
論文 参考訳(メタデータ) (2023-05-03T18:28:14Z) - ZeroSearch: Local Image Search from Text with Zero Shot Learning [0.0]
本稿では、ゼロショット学習を利用して、ユーザが提供するテキスト記述だけで画像クエリを作成するソリューションを提案する。
この論文の主な貢献は、事前訓練されたモデルを用いて画像から特徴を抽出するアルゴリズムの開発である。
アルゴリズムの出力は、類似性の下位順にソートされた画像のリストであり、ユーザーがより効率的に特定の画像を見つけるのに役立つ。
論文 参考訳(メタデータ) (2023-05-01T08:27:24Z) - Efficient Image-Text Retrieval via Keyword-Guided Pre-Screening [53.1711708318581]
現在の画像テキスト検索法は、N$関連時間複雑さに悩まされている。
本稿では,画像テキスト検索のための簡易かつ効果的なキーワード誘導事前スクリーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-14T09:36:42Z) - ALADIN: Distilling Fine-grained Alignment Scores for Efficient
Image-Text Matching and Retrieval [51.588385824875886]
クロスモーダル検索は、与えられたクエリテキストまたはバイヴァーサに関連する画像を見つけることで構成される。
近年の多くの手法が画像テキストマッチング問題に対する効果的な解法を提案しており、主に近年の大規模視覚言語(VL)トランスフォーマーネットワークを用いている。
本稿では,有効性と効率のギャップを埋めるため,ALADIN(ALign And Distill Network)を提案する。
論文 参考訳(メタデータ) (2022-07-29T16:01:48Z) - Probabilistic Compositional Embeddings for Multimodal Image Retrieval [48.450232527041436]
画像検索において複数のマルチモーダルクエリを構成する上で,より困難なシナリオについて検討する。
任意の数のクエリイメージと(あるいは)テキストが与えられた場合、我々のゴールは、複数のマルチモーダルクエリで指定されたセマンティックな概念を含むターゲットイメージを検索することである。
様々なクエリのセマンティクスを柔軟にエンコードできる情報埋め込みを学習するための,新しい多モード確率的合成法(MPC)を提案する。
論文 参考訳(メタデータ) (2022-04-12T14:45:37Z) - Beyond ANN: Exploiting Structural Knowledge for Efficient Place
Recognition [8.121462458089143]
オンラインで適用可能な効率的な位置認識のための新しい高速シーケンスベースの方法を提案する。
提案手法は,2つの最先端手法と,多くの場合,フル画像比較に優れる。
論文 参考訳(メタデータ) (2021-03-15T13:10:57Z) - Efficient image retrieval using multi neural hash codes and bloom
filters [0.0]
本稿では,複数のニューラルハッシュ符号を用いた画像検索手法を提案する。
また、事前に偽陽性を識別することで、ブルームフィルタを使用したクエリの数を制限する。
論文 参考訳(メタデータ) (2020-11-06T08:46:31Z) - Compositional Learning of Image-Text Query for Image Retrieval [3.9348884623092517]
画像検索のための画像とテキストクエリの合成を学習するための自動エンコーダベースモデルComposeAEを提案する。
我々は、深層メトリック学習アプローチを採用し、ソース画像とテキストクエリの合成をターゲット画像に近づけるメトリクスを学習する。
論文 参考訳(メタデータ) (2020-06-19T14:21:41Z) - Sequential Gallery for Interactive Visual Design Optimization [51.52002870143971]
本稿では,適切なパラメータ集合を効率的に見つけることができるループ最適化手法を提案する。
また、アダプティブグリッドビューに配置された2次元部分空間にオプションを提供するギャラリーベースのインタフェースも提案する。
合成関数を用いた実験により, 逐次平面探索は, ベースラインよりも少ないイテレーションで満足な解を見出すことができた。
論文 参考訳(メタデータ) (2020-05-08T15:24:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。