論文の概要: On the Minimal Recognizable Image Patch
- arxiv url: http://arxiv.org/abs/2010.05858v1
- Date: Mon, 12 Oct 2020 17:06:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 07:25:34.837174
- Title: On the Minimal Recognizable Image Patch
- Title(参考訳): 最小認識可能な画像パッチについて
- Authors: Mark Fonaryov and Michael Lindenbaum
- Abstract要約: 人間の視覚とは対照的に、一般的な認識アルゴリズムは部分的に隠された画像で失敗することが多い。
本稿では,画像を認識するのに十分な最小限のパッチ(MRP)を見つけることにより,アルゴリズムの限界を特徴付けることを提案する。
専門的なディープネットワークによって、与えられたサイズの最も情報に富むパッチを見つけ出すことができ、実験ツールとして機能する。
- 参考スコア(独自算出の注目度): 6.3455238301221675
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In contrast to human vision, common recognition algorithms often fail on
partially occluded images. We propose characterizing, empirically, the
algorithmic limits by finding a minimal recognizable patch (MRP) that is by
itself sufficient to recognize the image. A specialized deep network allows us
to find the most informative patches of a given size, and serves as an
experimental tool. A human vision study recently characterized related (but
different) minimally recognizable configurations (MIRCs) [1], for which we
specify computational analogues (denoted cMIRCs). The drop in human decision
accuracy associated with size reduction of these MIRCs is substantial and
sharp. Interestingly, such sharp reductions were also found for the
computational versions we specified.
- Abstract(参考訳): 人間の視覚とは対照的に、一般的な認識アルゴリズムは部分的に遮蔽された画像では失敗する。
本稿では,画像を認識するのに十分な最小限のパッチ(MRP)を見つけることにより,アルゴリズムの限界を特徴付けることを提案する。
専門的なディープネットワークにより、特定のサイズの最も情報性の高いパッチを見つけ、実験ツールとして機能する。
人間の視覚研究は、最近、関連する(しかし異なる)最小認識可能な構成(MIRC)[1]を特徴付け、計算類似体(cMIRC)を指定した。
これらのmircのサイズ削減に伴う人間の決定精度の低下は、相当で鋭い。
興味深いことに、我々が指定した計算バージョンでも、このような鋭利な削減が見つかりました。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Semantic Ensemble Loss and Latent Refinement for High-Fidelity Neural Image Compression [58.618625678054826]
本研究は、最適な視覚的忠実度のために設計された強化されたニューラル圧縮手法を提案する。
我々は,洗練されたセマンティック・アンサンブル・ロス,シャルボニエ・ロス,知覚的損失,スタイル・ロス,非バイナリ・ディバイザ・ロスを組み込んだモデルを構築した。
実験により,本手法は神経画像圧縮の統計的忠実度を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-01-25T08:11:27Z) - PatchMorph: A Stochastic Deep Learning Approach for Unsupervised 3D
Brain Image Registration with Small Patches [0.8933002528026627]
PatchMorphは、教師なしの3D脳画像登録に適した新しいディープラーニングアルゴリズムである。
本手法では, 局所変形と大域変換を結合する解を導出するために, 一定サイズのコンパクトパッチを用いる。
連続2光子断層撮影によるヒトT1MRI脳画像とマーモセット脳画像の実験により、PatchMorphの優れた性能が確認された。
論文 参考訳(メタデータ) (2023-12-12T03:37:57Z) - R-LPIPS: An Adversarially Robust Perceptual Similarity Metric [71.33812578529006]
本稿では,Robust Learned Perceptual Image Patch similarity(R-LPIPS)メトリクスを提案する。
R-LPIPSは、敵対的に訓練された深い特徴を活用する新しい指標である。
従来のLPIPSメトリックと比較して,R-LPIPSの優位性を示す。
論文 参考訳(メタデータ) (2023-07-27T19:11:31Z) - What's Behind the Mask: Estimating Uncertainty in Image-to-Image
Problems [29.55144604924458]
画像間ネットワークの不確実性を推定することは重要な課題である。
マスキングに基づく新しい手法を提案する。
マスクを用いた画像カラー化,画像補完,超解像処理における不確実性の評価を行った。
論文 参考訳(メタデータ) (2022-11-28T10:41:34Z) - Learning-Based Dimensionality Reduction for Computing Compact and
Effective Local Feature Descriptors [101.62384271200169]
特徴の形でのイメージパッチの独特な表現は多くのコンピュータビジョンとロボティクスのタスクの重要な構成要素である。
マルチ層パーセプトロン(MLP)を用いて,低次元ながら高品質な記述子を抽出する。
視覚的ローカライゼーション、パッチ検証、画像マッチング、検索など、さまざまなアプリケーションについて検討する。
論文 参考訳(メタデータ) (2022-09-27T17:59:04Z) - Robust and efficient computation of retinal fractal dimension through
deep approximation [2.580765958706854]
網膜特性を計算する方法は、高画質の画像にのみ適用可能な複雑で多段階のパイプラインである傾向がある。
本稿では,DART(Deep Approximation of Retinal Traits)を提案する。
論文 参考訳(メタデータ) (2022-07-12T15:34:35Z) - HHP-Net: A light Heteroscedastic neural network for Head Pose estimation
with uncertainty [2.064612766965483]
そこで,本研究では,頭部キーポイントの小さなセットから始まる,単一画像中の人物の頭部ポーズを推定する新しい手法を提案する。
私たちのモデルは実装が簡単で、芸術の状況に関してより効率的です。
論文 参考訳(メタデータ) (2021-11-02T08:55:45Z) - Geometrically Mappable Image Features [85.81073893916414]
地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
本稿では,画像検索を対象とした画像特徴学習手法を提案する。
論文 参考訳(メタデータ) (2020-03-21T15:36:38Z) - Exploiting Semantics for Face Image Deblurring [121.44928934662063]
本稿では,深層畳み込みニューラルネットワークによる意味的手がかりを利用して,効果的かつ効率的な顔分解アルゴリズムを提案する。
顔のセマンティックラベルを入力先として組み込んで,顔の局所構造を正規化するための適応的構造損失を提案する。
提案手法は、より正確な顔の特徴と細部を持つシャープ画像を復元する。
論文 参考訳(メタデータ) (2020-01-19T13:06:27Z) - Deep Residual Dense U-Net for Resolution Enhancement in Accelerated MRI
Acquisition [19.422926534305837]
本稿では,MRIの高速化による高画質画像の再構成を目的としたディープラーニング手法を提案する。
具体的には、畳み込みニューラルネットワーク(CNN)を用いて、エイリアス画像と元の画像の違いを学習する。
ダウンサンプリングされたk空間データの特異性を考慮すると、与えられたk空間データを効果的に活用する学習における損失関数に新しい用語を導入する。
論文 参考訳(メタデータ) (2020-01-13T19:01:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。