論文の概要: Understanding Inhibition Through Maximally Tense Images
- arxiv url: http://arxiv.org/abs/2406.05598v1
- Date: Sat, 8 Jun 2024 23:53:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-11 19:06:24.379885
- Title: Understanding Inhibition Through Maximally Tense Images
- Title(参考訳): 最大テンス画像による抑制の理解
- Authors: Chris Hamblin, Srijani Saha, Talia Konkle, George Alvarez,
- Abstract要約: 与えられた特徴を同時に励起・抑制する「最大時制画像」(MTI)について検討する。
本稿では,MTIを2つの新しい可視化手法,+/- 帰属インバージョンにより,単一画像を興奮成分と抑制成分に分割する,+/- 帰属アトラスと,画像を興奮・抑制する様々な方法のグローバルな可視化を提供する,属性アトラスについて述べる。
- 参考スコア(独自算出の注目度): 0.4999814847776098
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the functional role of 'feature inhibition' in vision models; that is, what are the mechanisms by which a neural network ensures images do not express a given feature? We observe that standard interpretability tools in the literature are not immediately suited to the inhibitory case, given the asymmetry introduced by the ReLU activation function. Given this, we propose inhibition be understood through a study of 'maximally tense images' (MTIs), i.e. those images that excite and inhibit a given feature simultaneously. We show how MTIs can be studied with two novel visualization techniques; +/- attribution inversions, which split single images into excitatory and inhibitory components, and the attribution atlas, which provides a global visualization of the various ways images can excite/inhibit a feature. Finally, we explore the difficulties introduced by superposition, as such interfering features induce the same attribution motif as MTIs.
- Abstract(参考訳): 視覚モデルにおける「機能的抑制」の機能的役割、すなわち、ニューラルネットワークが特定の特徴を表現していないことを確実にするメカニズムは何か。
ReLUアクティベーション関数によって導入された非対称性を考えると、文献における標準的な解釈可能性ツールは、直ちに阻害ケースに適合しない。
そこで本稿では,与えられた特徴を同時に励起・抑制する「最大緊張画像」(MTI)を用いて,抑制の理解を提案する。
本稿では,MTIを2つの新しい可視化手法,+/- 帰属インバージョンにより,単一画像を興奮成分と抑制成分に分割する,+/- 帰属アトラスと,画像を興奮・抑制する様々な方法のグローバルな可視化を提供する,属性アトラスについて述べる。
最後に,重ね合わせによってもたらされる困難を考察し,干渉特徴がMTIと同一の帰属モチーフを誘導することを示した。
関連論文リスト
- Unveiling and Mitigating Memorization in Text-to-image Diffusion Models through Cross Attention [62.671435607043875]
研究は、テキストから画像への拡散モデルがトレーニングデータから画像を複製し、著作権侵害やプライバシーのリスクに対する大きな懸念を引き起こすことを示唆している。
暗記中、クロスアテンションは特定のトークンの埋め込みに不均等に集中する傾向にあることが明らかとなった。
拡散モデルにおける記憶の検出と緩和のための革新的なアプローチを導入する。
論文 参考訳(メタデータ) (2024-03-17T01:27:00Z) - Neural Additive Image Model: Interpretation through Interpolation [0.0]
本稿では,ニューラル加算モデルと拡散オートエンコーダを用いた全体論的モデリング手法を提案する。
本手法は, アブレーション実験において, 複雑な画像効果を正確に同定できることを実証する。
提案モデルの実用性をさらに実証するため,ホスト画像内の特徴的特徴と属性がAirbnbレンタルの価格にどのように影響するかをケーススタディで検討した。
論文 参考訳(メタデータ) (2024-03-06T16:46:07Z) - Feature Accentuation: Revealing 'What' Features Respond to in Natural Images [4.4273123155989715]
本稿では,任意の入力画像のどの位置と何にあるかが特徴の応答を誘導するかを伝達できる,解釈可能性ツールキット「Feature accentuation」に新たな手法を導入する。
パラメータ化,拡張,正規化の特別な組み合わせは,シード画像とターゲット特徴を同時に類似した自然な視覚化をもたらす。
我々は,Lucentの拡張であるFaccentライブラリとして,機能アクセントの正確な実装をコミュニティに提供する。
論文 参考訳(メタデータ) (2024-02-15T16:01:59Z) - Controllable Mind Visual Diffusion Model [58.83896307930354]
脳信号の可視化は、人間の視覚システムとコンピュータビジョンモデルの間の重要なインターフェースとして機能する活発な研究領域として登場した。
我々は、制御可能なマインドビジュアルモデル拡散(CMVDM)と呼ばれる新しいアプローチを提案する。
CMVDMは属性アライメントとアシスタントネットワークを用いてfMRIデータから意味情報とシルエット情報を抽出する。
そして、制御モデルを利用して抽出した情報を画像合成に活用し、セマンティクスやシルエットの観点から視覚刺激によく似た画像を生成する。
論文 参考訳(メタデータ) (2023-05-17T11:36:40Z) - CoCoNet: Coupled Contrastive Learning Network with Multi-level Feature
Ensemble for Multi-modality Image Fusion [72.8898811120795]
我々は、赤外線と可視画像の融合を実現するために、CoCoNetと呼ばれるコントラスト学習ネットワークを提案する。
本手法は,主観的評価と客観的評価の両面において,最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-11-20T12:02:07Z) - Interactive Feature Embedding for Infrared and Visible Image Fusion [94.77188069479155]
赤外線と可視画像の融合のための一般的なディープラーニングに基づく手法は、情報保持のための教師なしのメカニズムに依存している。
赤外線および可視画像融合のための自己教師付き学習フレームワークに,インタラクティブな新たな特徴埋め込みを提案する。
論文 参考訳(メタデータ) (2022-11-09T13:34:42Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Predicting Eye Fixations Under Distortion Using Bayesian Observers [2.132096006921048]
本稿では,ベイズ視覚探索モデルを用いて,画像の歪みが人間の視覚的注意を損なう可能性について検討する。
JPEG圧縮画像上でのMAPおよびEMMモデルの改良実験を行った。
論文 参考訳(メタデータ) (2021-02-06T21:57:08Z) - Proactive Pseudo-Intervention: Causally Informed Contrastive Learning
For Interpretable Vision Models [103.64435911083432]
PPI(Proactive Pseudo-Intervention)と呼ばれる新しい対照的な学習戦略を提案する。
PPIは、因果関係のない画像の特徴を保護するために積極的に介入する。
また,重要な画像画素を識別するための,因果的に通知された新たなサリエンスマッピングモジュールを考案し,モデル解釈の容易性を示す。
論文 参考訳(メタデータ) (2020-12-06T20:30:26Z) - Unsupervised Discovery, Control, and Disentanglement of Semantic
Attributes with Applications to Anomaly Detection [15.817227809141116]
画像の意味的属性を制御する潜在因子を検出する教師なし生成表現に着目する。
a)マルチスケール生成モデルと相互情報(MI)を組み合わせたネットワークアーキテクチャを提案する。
b) について、解析的結果(Lemma 1) を導出し、2つの関連する異なる概念に明瞭さをもたらす。
論文 参考訳(メタデータ) (2020-02-25T20:50:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。