論文の概要: Canonical Saliency Maps: Decoding Deep Face Models
- arxiv url: http://arxiv.org/abs/2105.01386v1
- Date: Tue, 4 May 2021 09:42:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 17:52:38.507213
- Title: Canonical Saliency Maps: Decoding Deep Face Models
- Title(参考訳): canonical saliency maps:デコードディープフェイスモデル
- Authors: Thrupthi Ann John, Vineeth N Balasubramanian, C V Jawahar
- Abstract要約: そこで本研究では, 顔面モデルにサリエンシーマップを投影し, 関連する顔面領域を強調表示する新しい手法"Canonical Saliency Map"を提案する。
提案手法は, アーキテクチャに関係なく, 任意の深層モデルで使用可能な正準塩分マップの有用性を示す。
- 参考スコア(独自算出の注目度): 47.036036069156104
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As Deep Neural Network models for face processing tasks approach human-like
performance, their deployment in critical applications such as law enforcement
and access control has seen an upswing, where any failure may have far-reaching
consequences. We need methods to build trust in deployed systems by making
their working as transparent as possible. Existing visualization algorithms are
designed for object recognition and do not give insightful results when applied
to the face domain. In this work, we present 'Canonical Saliency Maps', a new
method that highlights relevant facial areas by projecting saliency maps onto a
canonical face model. We present two kinds of Canonical Saliency Maps:
image-level maps and model-level maps. Image-level maps highlight facial
features responsible for the decision made by a deep face model on a given
image, thus helping to understand how a DNN made a prediction on the image.
Model-level maps provide an understanding of what the entire DNN model focuses
on in each task and thus can be used to detect biases in the model. Our
qualitative and quantitative results show the usefulness of the proposed
canonical saliency maps, which can be used on any deep face model regardless of
the architecture.
- Abstract(参考訳): 顔処理タスクのためのディープニューラルネットワークモデルが人間のようなパフォーマンスに近づくにつれ、法執行やアクセス制御といった重要なアプリケーションへのデプロイメントが増加し、失敗がはるかに大きな結果をもたらす可能性がある。
可能な限り透明にすることで、デプロイされたシステムに対する信頼を構築する方法が必要です。
既存の可視化アルゴリズムはオブジェクト認識のために設計されており、顔領域に適用しても洞察力のある結果を与えない。
本研究では,標準顔モデルにサリエンシマップを投影することにより,関連する顔領域をハイライトする新しい手法である「カノニカル・サリエンシマップ」を提案する。
画像レベルマップとモデルレベルマップの2種類のカノニカル・サリエンシマップを提示する。
画像レベルのマップは、与えられた画像上のディープフェイスモデルによる決定に責任がある顔の特徴を強調し、DNNが画像上でどのように予測したかを理解するのに役立つ。
モデルレベルのマップは、各タスクでDNNモデル全体が何を重視しているかを理解し、モデル内のバイアスを検出するために使用できる。
筆者らの定性的かつ定量的な結果は, アーキテクチャによらず, 任意の深層面モデルで使用可能な標準塩分マップの有用性を示している。
関連論文リスト
- SHIC: Shape-Image Correspondences with no Keypoint Supervision [106.99157362200867]
正準曲面マッピングは、オブジェクトの各ピクセルを3Dテンプレートの対応する点に割り当てることで、キーポイント検出を一般化する。
人間の分析のためにDensePoseによって人気を得た著者は、この概念をより多くのカテゴリに適用しようと試みている。
そこで本研究では,手動による指導を伴わない標準地図学習手法ShiCを紹介し,ほとんどのカテゴリにおいて教師付き手法よりも優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2024-07-26T17:58:59Z) - DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model [15.803614800117781]
DiffMapは,マップセグメンテーションマスクの構造をモデル化する新しい手法である。
この手法を取り入れることで,既存のセマンティックセグメンテーション手法の性能を大幅に向上させることができる。
本モデルは,実世界の地図レイアウトをより正確に反映した結果を生成する上で,優れた習熟度を示す。
論文 参考訳(メタデータ) (2024-05-03T11:16:27Z) - Faceptor: A Generalist Model for Face Perception [52.8066001012464]
Faceptorは、よく設計されたシングルエンコーダのデュアルデコーダアーキテクチャを採用するために提案されている。
Faceptorへのレイヤアテンションにより、モデルが最適なレイヤから機能を適応的に選択して、望ましいタスクを実行することができる。
我々のトレーニングフレームワークは補助的な教師付き学習にも適用でき、年齢推定や表現認識といったデータスパースタスクの性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2024-03-14T15:42:31Z) - SNAP: Self-Supervised Neural Maps for Visual Positioning and Semantic
Understanding [57.108301842535894]
我々は、地上と頭上の画像からリッチなニューラル2Dマップを学習するディープネットワークSNAPを紹介する。
我々は、異なる入力から推定されるニューラルマップの整列をトレーニングし、何千万ものストリートビュー画像のカメラポーズでのみ監視する。
SNAPは、従来の手法の範囲を超えて、挑戦的な画像クエリの場所を解決できる。
論文 参考訳(メタデータ) (2023-06-08T17:54:47Z) - Deriving Explanation of Deep Visual Saliency Models [6.808418311272862]
我々は,その深部ニューラルネットワークに基づくサリエンシモデルから説明可能なサリエンシモデルを導出する手法を開発した。
我々は2つの最先端のディープ・サリエンシ・モデル、すなわちUNISALとMSI-Netを解釈として検討する。
我々はまた、サリエンシ予測のためのクロスコンカレントマルチスケール残差ブロックベースネットワーク(CMRNet)という独自のディープサリエンシモデルを構築した。
論文 参考訳(メタデータ) (2021-09-08T12:22:32Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。