論文の概要: Accurate and Fast Pixel Retrieval with Spatial and Uncertainty Aware Hypergraph Diffusion
- arxiv url: http://arxiv.org/abs/2406.11242v1
- Date: Mon, 17 Jun 2024 06:11:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-18 18:14:15.046915
- Title: Accurate and Fast Pixel Retrieval with Spatial and Uncertainty Aware Hypergraph Diffusion
- Title(参考訳): 空間的・不確実性を考慮したハイパーグラフ拡散による高精度・高速画素検索
- Authors: Guoyuan An, Yuchi Huo, Sung-Eui Yoon,
- Abstract要約: 本稿では,探索時間に局所的な特徴を用いて空間情報を効率的に伝播するハイパーグラフベースのフレームワークを提案する。
我々はまた、「コミュニティ選択」と呼ぶ手法により、画像グラフの構造情報を革新的に活用する。
画像レベルの検索と画素レベルの検索では,SOTA(State-of-the-art)の精度が向上し,処理速度も向上した。
- 参考スコア(独自算出の注目度): 21.503456950721844
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel method designed to enhance the efficiency and accuracy of both image retrieval and pixel retrieval. Traditional diffusion methods struggle to propagate spatial information effectively in conventional graphs due to their reliance on scalar edge weights. To overcome this limitation, we introduce a hypergraph-based framework, uniquely capable of efficiently propagating spatial information using local features during query time, thereby accurately retrieving and localizing objects within a database. Additionally, we innovatively utilize the structural information of the image graph through a technique we term "community selection". This approach allows for the assessment of the initial search result's uncertainty and facilitates an optimal balance between accuracy and speed. This is particularly crucial in real-world applications where such trade-offs are often necessary. Our experimental results, conducted on the (P)ROxford and (P)RParis datasets, demonstrate the significant superiority of our method over existing diffusion techniques. We achieve state-of-the-art (SOTA) accuracy in both image-level and pixel-level retrieval, while also maintaining impressive processing speed. This dual achievement underscores the effectiveness of our hypergraph-based framework and community selection technique, marking a notable advancement in the field of content-based image retrieval.
- Abstract(参考訳): 本稿では,画像検索と画素検索の双方の効率性と精度を高めるために,新しい手法を提案する。
従来の拡散法は、スカラーエッジ重みに依存するため、従来のグラフにおいて空間情報を効果的に伝播させるのに苦労する。
この制限を克服するために,クエリ時間内に局所的な特徴を用いて空間情報を効率的に伝播し,データベース内のオブジェクトを正確に検索・ローカライズするハイパーグラフベースのフレームワークを提案する。
さらに、我々は「コミュニティ選択」と呼ぶ手法により、画像グラフの構造情報を革新的に活用する。
このアプローチにより、初期探索結果の不確実性の評価が可能となり、精度と速度の最適なバランスが図られる。
このようなトレードオフが頻繁に必要となる現実世界のアプリケーションでは、これは特に重要です。
The (P)ROxford and (P)RParis datasets, conducted on the (P)ROxford and (P)RParis datasets, showed the significant superiority of our method than existing diffusion techniques。
画像レベルの検索と画素レベルの検索では,SOTA(State-of-the-art)の精度が向上し,処理速度も向上した。
この2つの成果は、ハイパーグラフベースのフレームワークとコミュニティ選択技術の有効性を強調し、コンテンツベースの画像検索の分野における顕著な進歩を示している。
関連論文リスト
- Topograph: An efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation [78.54656076915565]
位相的正しさは多くの画像分割タスクにおいて重要な役割を果たす。
ほとんどのネットワークは、Diceのようなピクセル単位の損失関数を使って、トポロジカルな精度を無視して訓練されている。
トポロジ的に正確な画像セグメンテーションのための新しいグラフベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T16:20:14Z) - Precise Pick-and-Place using Score-Based Diffusion Networks [10.760482305679053]
ロボット操作タスクにおけるピック・アンド・プレイス操作の精度を高めるために、粗い連続ポーズ拡散法。
提案手法は,RGB-Dカメラから投影されるトップダウンのRGB画像を利用し,粗いアーキテクチャを採用する。
論文 参考訳(メタデータ) (2024-09-15T13:09:09Z) - Rethinking Score Distillation as a Bridge Between Image Distributions [97.27476302077545]
提案手法は, 劣化した画像(ソース)を自然画像分布(ターゲット)に転送することを目的としている。
本手法は,複数の領域にまたがって容易に適用可能であり,特殊な手法の性能のマッチングや評価を行うことができる。
テキストから2D、テキストベースのNeRF最適化、絵画を実画像に変換すること、光学錯視生成、および3Dスケッチから実画像に変換することにおいて、その実用性を実証する。
論文 参考訳(メタデータ) (2024-06-13T17:59:58Z) - Resource Efficient Perception for Vision Systems [0.0]
本研究では,高解像度画像に対するメモリ効率のパッチベース処理を活用することにより,これらの課題を軽減するためのフレームワークを提案する。
ローカルなパッチ情報と共にグローバルなコンテキスト表現が組み込まれており、画像の内容の包括的な理解を可能にする。
分類,オブジェクト検出,セグメンテーションにまたがる7つのベンチマークにおいて,本手法の有効性を示す。
論文 参考訳(メタデータ) (2024-05-12T05:33:00Z) - Secure Information Embedding in Images with Hybrid Firefly Algorithm [2.9182357325967145]
本研究は,ホストイメージ内に機密文書フォーマット(PDF)を隠蔽する新たなステガノグラフィ手法を提案する。
この探索の目的は、ホスト画像のキャパシティを増大させ、歪みを減少させる2つの主要な目標を達成することである。
その結果,画像の歪みの減少と探索過程における収束速度の加速が示唆された。
論文 参考訳(メタデータ) (2023-12-21T01:50:02Z) - A Survey of Graph and Attention Based Hyperspectral Image Classification
Methods for Remote Sensing Data [5.1901440366375855]
ハイパースペクトルイメージング(HSI)の分類におけるディープラーニング技術の利用は急速に増加している。
最近の手法では、グラフ畳み込みネットワークの利用と、予測にノード機能を使用するユニークな機能についても検討されている。
論文 参考訳(メタデータ) (2023-10-16T00:42:25Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - A parameter refinement method for Ptychography based on Deep Learning
concepts [55.41644538483948]
伝播距離、位置誤差、部分的コヒーレンスにおける粗いパラメトリゼーションは、しばしば実験の生存性を脅かす。
最新のDeep Learningフレームワークは、セットアップの不整合を自律的に補正するために使用され、ポチコグラフィーの再構築の質が向上する。
我々は,elettra シンクロトロン施設のツインミックビームラインで取得した合成データセットと実データの両方でシステムをテストした。
論文 参考訳(メタデータ) (2021-05-18T10:15:17Z) - Unsupervised Feature Learning for Event Data: Direct vs Inverse Problem
Formulation [53.850686395708905]
イベントベースのカメラは、ピクセルごとの明るさ変化の非同期ストリームを記録する。
本稿では,イベントデータからの表現学習のための単一層アーキテクチャに焦点を当てる。
我々は,最先端手法と比較して,認識精度が最大9%向上したことを示す。
論文 参考訳(メタデータ) (2020-09-23T10:40:03Z) - A Novel Spatial-Spectral Framework for the Classification of
Hyperspectral Satellite Imagery [1.066048003460524]
本研究では,土地被覆分類データに含まれるスペクトル情報と空間情報の両方を考慮に入れた新しい枠組みを提案する。
提案手法は,パヴィア大学とインド・パインズのデータセットでそれぞれ99.52%,98.31%の精度を達成し,従来の手法よりも優れている。
論文 参考訳(メタデータ) (2020-07-22T16:12:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。