論文の概要: Interpreting Face Inference Models using Hierarchical Network Dissection
- arxiv url: http://arxiv.org/abs/2108.10360v1
- Date: Mon, 23 Aug 2021 18:52:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-25 14:21:13.441973
- Title: Interpreting Face Inference Models using Hierarchical Network Dissection
- Title(参考訳): 階層型ネットワーク分割を用いた顔認識モデルの解析
- Authors: Divyang Teotia, Agata Lapedriza, Sarah Ostadabbas
- Abstract要約: 階層的ネットワーク分割(Hierarchical Network Dissection)は、顔中心推論モデルの内部表現を解釈するパイプラインである。
私たちのパイプラインは、オブジェクト中心およびシーン中心モデルの一般的な解釈可能性モデルであるNetwork Dissectionにインスパイアされています。
- 参考スコア(独自算出の注目度): 10.852613235927958
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper presents Hierarchical Network Dissection, a general pipeline to
interpret the internal representation of face-centric inference models. Using a
probabilistic formulation, Hierarchical Network Dissection pairs units of the
model with concepts in our "Face Dictionary" (a collection of facial concepts
with corresponding sample images). Our pipeline is inspired by Network
Dissection, a popular interpretability model for object-centric and
scene-centric models. However, our formulation allows to deal with two
important challenges of face-centric models that Network Dissection cannot
address: (1) spacial overlap of concepts: there are different facial concepts
that simultaneously occur in the same region of the image, like "nose" (facial
part) and "pointy nose" (facial attribute); and (2) global concepts: there are
units with affinity to concepts that do not refer to specific locations of the
face (e.g. apparent age). To validate the effectiveness of our unit-concept
pairing formulation, we first conduct controlled experiments on biased data.
These experiments illustrate how Hierarchical Network Dissection can be used to
discover bias in the training data. Then, we dissect different face-centric
inference models trained on widely-used facial datasets. The results show
models trained for different tasks have different internal representations.
Furthermore, the interpretability results reveal some biases in the training
data and some interesting characteristics of the face-centric inference tasks.
- Abstract(参考訳): 本稿では,顔中心推論モデルの内部表現を解釈する汎用パイプラインである階層型ネットワーク分割を提案する。
階層型ネットワーク分割法は,確率論的定式化を用いて,モデルの単位と「顔辞書」(対応するサンプル画像を含む顔概念の集合)の概念をペアリングする。
私たちのパイプラインは、オブジェクト中心およびシーン中心モデルの一般的な解釈可能性モデルであるNetwork Dissectionにインスパイアされています。
しかし,ネットワーク分割が対処できない顔中心モデルの2つの重要な課題は,(1) 概念の空間的重なり:(2) イメージの同じ領域に同時に発生する異なる顔概念,例えば、"nose"(顔面部分)と"pointy nose"(顔面属性)、(2) グローバル概念: 顔の特定の位置を指しない概念に親和性のある単位(例: 顔の特定の位置を参照しない単位)である。
年齢)。
単位概念ペアリングの定式化の有効性を検証するために,まずバイアスデータを用いた制御実験を行った。
これらの実験は、階層的ネットワーク分割を用いてトレーニングデータのバイアスを検出する方法を示している。
そして、広く使われている顔データセットに基づいて訓練された異なる顔中心推論モデルを識別する。
結果は、異なるタスクのために訓練されたモデルが異なる内部表現を持つことを示す。
さらに, 解析結果から, トレーニングデータのバイアスと, 顔中心推論タスクの興味深い特徴が明らかになった。
関連論文リスト
- Closely Interactive Human Reconstruction with Proxemics and Physics-Guided Adaption [64.07607726562841]
既存の人間再建アプローチは主に、正確なポーズの回復や侵入を避けることに焦点を当てている。
本研究では,モノクロ映像から密に対話的な人間を再構築する作業に取り組む。
本稿では,視覚情報の欠如を補うために,確率的行動や物理からの知識を活用することを提案する。
論文 参考訳(メタデータ) (2024-04-17T11:55:45Z) - Appearance Debiased Gaze Estimation via Stochastic Subject-Wise
Adversarial Learning [33.55397868171977]
外観に基づく視線推定はコンピュータビジョンにおいて注目されており、様々な深層学習技術を用いて顕著な改善が達成されている。
本稿では,被験者の外観を一般化するネットワークを訓練する,SAZE学習という新しい枠組みを提案する。
実験の結果,MPIIGazeデータセットとEyeDiapデータセットの3.89と4.42をそれぞれ達成した。
論文 参考訳(メタデータ) (2024-01-25T00:23:21Z) - Evaluating alignment between humans and neural network representations in image-based learning tasks [5.657101730705275]
トレーニング済みの860ドルのニューラルネットワークモデルの表現が、人間の学習軌跡にどのようにマッピングされているかテストしました。
トレーニングデータセットのサイズは人間の選択に沿った中核的な決定要因であるのに対し、マルチモーダルデータ(テキストと画像)による対照的なトレーニングは、人間の一般化を予測するために現在公開されているモデルの一般的な特徴であることがわかった。
結論として、事前訓練されたニューラルネットワークは、タスク間で伝達可能な認知の基本的な側面を捉えているように見えるため、認知モデルのための表現を抽出するのに役立つ。
論文 参考訳(メタデータ) (2023-06-15T08:18:29Z) - FaceTopoNet: Facial Expression Recognition using Face Topology Learning [23.139108533273777]
本稿では,顔の効果的なツリートポロジーを学習可能な,表情認識のためのエンドツーエンドの深層モデルを提案する。
我々のモデルは学習した木をトラバースしてシーケンスを生成し、次に埋め込みを形成してシーケンシャルな学習者に供給する。
提案手法を評価するために,大規模な4つの顔表情データセットについて広範囲に実験を行った。
論文 参考訳(メタデータ) (2022-09-13T22:02:54Z) - Drawing out of Distribution with Neuro-Symbolic Generative Models [49.79371715591122]
ドローイング・アウト・オブ・ディストリクト(英: Drawing out of Distribution)は、ストローク・ベース・ドローイングの神経象徴的生成モデルである。
DooDは画像を直接操作するが、監視や高価なテストタイム推論は必要ない。
我々は、データとタスクをまたいだ一般化能力について、DooDを評価した。
論文 参考訳(メタデータ) (2022-06-03T21:40:22Z) - Unsupervised learning of features and object boundaries from local
prediction [0.0]
本稿では,各因子が追加のバイナリ変数とペアリングされ,その因子をオン/オフに切り替える,ペアワイズマルコフ確率場モデルによる特徴写像の層を導入する。
マルコフ確率場要素の特徴とパラメータの両方を、さらなる監視信号なしで画像から学習することができる。
宇宙空間での計算予測はセグメンテーションと特徴学習の両方に役立ち、これらの予測を最適化するために訓練されたモデルは人間の視覚システムと類似性を示す。
論文 参考訳(メタデータ) (2022-05-27T18:54:10Z) - Expression-preserving face frontalization improves visually assisted
speech processing [35.647888055229956]
本論文の主な貢献は,非剛性顔の変形を保存したフロンダル化手法である。
深層学習パイプラインに組み込むと、音声認識と音声の不信度スコアがかなりの差で向上することを示す。
論文 参考訳(メタデータ) (2022-04-06T13:22:24Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Understanding the Role of Individual Units in a Deep Neural Network [85.23117441162772]
本稿では,画像分類と画像生成ネットワーク内の隠れ単位を系統的に同定する分析フレームワークを提案する。
まず、シーン分類に基づいて訓練された畳み込みニューラルネットワーク(CNN)を分析し、多様なオブジェクト概念にマッチするユニットを発見する。
第2に、シーンを生成するために訓練されたGANモデルについて、同様の分析手法を用いて分析する。
論文 参考訳(メタデータ) (2020-09-10T17:59:10Z) - InterFaceGAN: Interpreting the Disentangled Face Representation Learned
by GANs [73.27299786083424]
我々は、最先端のGANモデルによって学習された不整合顔表現を解釈するInterFaceGANというフレームワークを提案する。
まず、GANは潜在空間の線型部分空間で様々な意味学を学ぶ。
次に、異なる意味論間の相関関係について詳細な研究を行い、部分空間射影を通してそれらをよりよく解離させる。
論文 参考訳(メタデータ) (2020-05-18T18:01:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。