論文の概要: MaskSearch: Querying Image Masks at Scale
- arxiv url: http://arxiv.org/abs/2305.02375v2
- Date: Mon, 8 Jan 2024 08:26:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-10 00:00:13.154135
- Title: MaskSearch: Querying Image Masks at Scale
- Title(参考訳): MaskSearch: イメージマスクを大規模にクエリする
- Authors: Dong He, Jieyu Zhang, Maureen Daum, Alexander Ratner, Magdalena
Balazinska
- Abstract要約: MaskSearchは、クエリ結果の正確性を確保しながら、イメージマスクのデータベース上でクエリを高速化するシステムである。
試行錯誤実験の結果,圧縮データサイズの約5%のインデックスを用いたMaskSearchは,最大2桁のクエリを高速化することがわかった。
- 参考スコア(独自算出の注目度): 60.82746984506577
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning tasks over image databases often generate masks that
annotate image content (e.g., saliency maps, segmentation maps, depth maps) and
enable a variety of applications (e.g., determine if a model is learning
spurious correlations or if an image was maliciously modified to mislead a
model). While queries that retrieve examples based on mask properties are
valuable to practitioners, existing systems do not support them efficiently. In
this paper, we formalize the problem and propose MaskSearch, a system that
focuses on accelerating queries over databases of image masks while
guaranteeing the correctness of query results. MaskSearch leverages a novel
indexing technique and an efficient filter-verification query execution
framework. Experiments with our prototype show that MaskSearch, using indexes
approximately 5% of the compressed data size, accelerates individual queries by
up to two orders of magnitude and consistently outperforms existing methods on
various multi-query workloads that simulate dataset exploration and analysis
processes.
- Abstract(参考訳): 画像データベース上の機械学習タスクは、しばしば画像コンテンツに注釈をつけるマスク(例えば、塩分マップ、セグメンテーションマップ、深度マップ)を生成し、様々なアプリケーションを可能にする(例えば、モデルがスプリアス相関を学習しているかどうか、または、画像が悪意を持ってモデルを見誤っているかどうかを判断する)。
マスク特性に基づいて例を検索するクエリは実践者にとって価値があるが、既存のシステムはそれらを効率的にサポートしていない。
本稿では,この問題を形式化し,クエリ結果の正確性を確保しつつ,画像マスクのデータベース上でクエリを高速化するシステムであるmasksearchを提案する。
MaskSearchは、新しいインデックス技術と効率的なフィルタ検証クエリ実行フレームワークを活用している。
プロトタイプを用いた実験では,圧縮されたデータサイズの約5%のインデックスを使用して,個々のクエリを最大2桁高速化し,データセット探索と分析プロセスをシミュレートした,さまざまなマルチクエリワークロードの既存メソッドを一貫して上回っている。
関連論文リスト
- Variance-insensitive and Target-preserving Mask Refinement for
Interactive Image Segmentation [68.16510297109872]
ポイントベースのインタラクティブなイメージセグメンテーションは、セマンティックセグメンテーションや画像編集といったアプリケーションにおけるマスクアノテーションの負担を軽減することができる。
本稿では,ユーザ入力の少ないセグメンテーション品質を向上する新しい手法である可変無感・ターゲット保存マスクリファインメントを提案する。
GrabCut、バークレー、SBD、DAVISデータセットの実験は、インタラクティブな画像セグメンテーションにおける我々の手法の最先端性能を実証している。
論文 参考訳(メタデータ) (2023-12-22T02:31:31Z) - DPPMask: Masked Image Modeling with Determinantal Point Processes [49.65141962357528]
Masked Image Modeling (MIM)は、ランダムにマスキングされた画像の再構成を目的として、印象的な代表的性能を達成した。
先行研究で広く使われている一様ランダムマスキングは、必然的にいくつかの重要なオブジェクトを失い、元のセマンティック情報を変更する。
この問題に対処するため、MIMを新しいマスキング戦略であるDPPMaskで強化する。
提案手法は単純だが有効であり,様々なフレームワークで実装される場合,余分に学習可能なパラメータは不要である。
論文 参考訳(メタデータ) (2023-03-13T13:40:39Z) - Improving Masked Autoencoders by Learning Where to Mask [65.89510231743692]
マスケ画像モデリングは視覚データに対する有望な自己教師型学習手法である。
本稿では,Gumbel-Softmax を用いて,対向学習マスク生成装置とマスク誘導画像モデリングプロセスとを相互接続するフレームワーク AutoMAE を提案する。
実験の結果,AutoMAEは,標準の自己監督型ベンチマークや下流タスクに対して,効果的な事前学習モデルを提供することがわかった。
論文 参考訳(メタデータ) (2023-03-12T05:28:55Z) - Few-shot semantic segmentation via mask aggregation [5.886986014593717]
セマンティックセグメンテーションは、ラベル付きデータが少ない新しいクラスを認識することを目的としている。
従来の研究では、これをピクセル単位の分類問題と見なしていた。
この問題に対処するためのマスクベースの分類手法を提案する。
論文 参考訳(メタデータ) (2022-02-15T07:13:09Z) - MaskMTL: Attribute prediction in masked facial images with deep
multitask learning [9.91045425400833]
本稿では,マスク付き顔画像から多種多様な特徴を共同で推定する深層マルチタスク学習(MTL)手法を提案する。
提案手法は、他の競合技術よりも性能が優れている。
論文 参考訳(メタデータ) (2022-01-09T13:03:29Z) - Learning Sparse Masks for Diffusion-based Image Inpainting [10.633099921979674]
拡散ベースの塗布はスパースデータから画像の再構成に強力なツールである。
我々は高効率な適応マスク生成モデルを提供する。
実験により,我々のモデルは最大4桁の加速度で競争品質を達成できることが示唆された。
論文 参考訳(メタデータ) (2021-10-06T10:20:59Z) - Scaling up instance annotation via label propagation [69.8001043244044]
本稿では,オブジェクトセグメンテーションマスクを用いた大規模データセット構築のための高効率アノテーション手法を提案する。
セグメンテーションモデルによるマスク予測に階層的クラスタリングを用いることにより,これらの類似性を生かした。
総アノテーション時間はたった290時間である100万個のオブジェクトセグメンテーションマスクが得られた。
論文 参考訳(メタデータ) (2021-10-05T18:29:34Z) - QueryInst: Parallelly Supervised Mask Query for Instance Segmentation [53.5613957875507]
本稿では,動的マスクヘッドの並列監視によるクエリベースインスタンスセグメンテーション手法であるqueryinstを提案する。
COCO、CityScapes、YouTube-VISの3つの挑戦的なベンチマークについて広範な実験を行っています。
QueryInstは、すべてのオンラインVISアプローチの中で最高のパフォーマンスを達成し、十分なスピード精度のトレードオフを打ち負かす。
論文 参考訳(メタデータ) (2021-05-05T08:38:25Z) - Beyond ANN: Exploiting Structural Knowledge for Efficient Place
Recognition [8.121462458089143]
オンラインで適用可能な効率的な位置認識のための新しい高速シーケンスベースの方法を提案する。
提案手法は,2つの最先端手法と,多くの場合,フル画像比較に優れる。
論文 参考訳(メタデータ) (2021-03-15T13:10:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。