論文の概要: Cartoon Explanations of Image Classifiers
- arxiv url: http://arxiv.org/abs/2110.03485v1
- Date: Thu, 7 Oct 2021 14:12:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 23:15:00.010058
- Title: Cartoon Explanations of Image Classifiers
- Title(参考訳): 画像分類器のマンガ説明
- Authors: Stefan Kolek, Duc Anh Nguyen, Ron Levie, Joan Bruna, Gitta Kutyniok
- Abstract要約: CartoonXは画像分類器に適したモデルに依存しない説明法である。
自然画像は、大まかに断片的に滑らかな信号(漫画画像とも呼ばれる)であり、ウェーブレット領域ではスパースである傾向がある。
実験により,CartoonXは断片的に滑らかな性質を持つだけでなく,特に誤分類の説明に適していることが実証された。
- 参考スコア(独自算出の注目度): 28.143624457141797
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present CartoonX (Cartoon Explanation), a novel model-agnostic explanation
method tailored towards image classifiers and based on the rate-distortion
explanation (RDE) framework. Natural images are roughly piece-wise smooth
signals -- also called cartoon images -- and tend to be sparse in the wavelet
domain. CartoonX is the first explanation method to exploit this by requiring
its explanations to be sparse in the wavelet domain, thus extracting the
\emph{relevant piece-wise smooth} part of an image instead of relevant
pixel-sparse regions. We demonstrate experimentally that CartoonX is not only
highly interpretable due to its piece-wise smooth nature but also particularly
apt at explaining misclassifications.
- Abstract(参考訳): 本稿では,画像分類器に適したモデルに依存しない新しい説明手法であるCartoonX(Cartoon Explanation)について述べる。
自然画像は、大まかに断片的に滑らかな信号(漫画画像とも呼ばれる)であり、ウェーブレット領域ではスパースである傾向がある。
CartoonXはウェーブレット領域における説明をスパースにする必要があり、ピクセルスパース領域ではなく画像の「emph{relevant piece-wise smooth}」部分を抽出することで、これを活用するための最初の説明法である。
実験により,CartoonXは断片的に滑らかな性質を持つだけでなく,特に誤分類の説明に適していることが実証された。
関連論文リスト
- Null-text Guidance in Diffusion Models is Secretly a Cartoon-style
Creator [20.329795810937206]
拡散モデルにおけるヌルテキストガイダンスは、秘かに漫画スタイルのクリエーターである。
本稿では,Null-text ガイダンスとテキストガイダンスの予測に使用されるノイズの多い画像間の不一致を構築するために,ロールバック障害 (Back-D) とイメージ障害 (Image-D) の2つの外乱手法を提案する。
Back-Dは、$x_t$を$x_t+Delta t$に置き換えることで、nullテキストノイズ画像のノイズレベルを変更することで、漫画化を実現する
論文 参考訳(メタデータ) (2023-05-11T10:36:52Z) - Sketch-Guided Text-to-Image Diffusion Models [57.12095262189362]
本稿では,事前訓練されたテキスト-画像拡散モデルを示す普遍的なアプローチを提案する。
本手法では,タスク専用のモデルや専用エンコーダをトレーニングする必要はない。
我々は、スケッチ・ツー・イメージの翻訳タスクに特に焦点をあて、画像を生成する堅牢で表現力のある方法を明らかにする。
論文 参考訳(メタデータ) (2022-11-24T18:45:32Z) - Explaining Image Classifiers with Multiscale Directional Image
Representation [4.29434097275489]
本稿では,シャーレット変換に基づく画像分類器のマスク説明手法であるShearletXを提案する。
本手法を支援するために,説明人工物に関する数学的定義と,マスク説明の質を評価するための情報理論スコアを提案する。
論文 参考訳(メタデータ) (2022-11-22T09:24:45Z) - Learning to Incorporate Texture Saliency Adaptive Attention to Image
Cartoonization [20.578335938736384]
マンガ・テクスチュア・サリエンシ・サンプラー (CTSS) モジュールを提案し, トレーニングデータからマンガ・テクスチュア・サリエントパッチを動的にサンプリングする。
大規模な実験により,画像のマンガ化を促進・強化する上で,テクスチャ・サリエンシー適応型学習が重要であることを示す。
論文 参考訳(メタデータ) (2022-08-02T16:45:55Z) - Cartoon-texture evolution for two-region image segmentation [0.0]
2領域イメージセグメンテーション(英: two-rea image segmentation)は、画像が2つの関心領域、すなわち前景と背景に分割される過程である。
Chan, Esedo=glu, Nikolova, SIAM Journal on Applied Mathematics 66(5), 1632-1648, 2006
論文 参考訳(メタデータ) (2022-03-07T16:50:01Z) - I M Avatar: Implicit Morphable Head Avatars from Videos [68.13409777995392]
モノクロビデオから暗黙の頭部アバターを学習するための新しい手法であるIMavatarを提案する。
従来の3DMMによるきめ細かい制御機構に着想を得て, 学習用ブレンドサップとスキンフィールドによる表現・ポーズ関連変形を表現した。
本手法は,最先端の手法と比較して,幾何性を改善し,より完全な表現空間をカバーできることを定量的かつ定性的に示す。
論文 参考訳(メタデータ) (2021-12-14T15:30:32Z) - SketchEdit: Mask-Free Local Image Manipulation with Partial Sketches [95.45728042499836]
マスクレス局所画像操作という,スケッチに基づく画像操作の新しいパラダイムを提案する。
本モデルでは,対象の修正領域を自動的に予測し,構造型ベクトルにエンコードする。
ジェネレータは、スタイルベクトルとスケッチに基づいて、新しいイメージコンテンツを合成する。
論文 参考訳(メタデータ) (2021-11-30T02:42:31Z) - Graph Jigsaw Learning for Cartoon Face Recognition [79.29656077338828]
畳み込みニューラルネットワーク(CNN)を用いたマンガ顔認識のための形状指向表現の学習は困難である
分類ネットワークの様々な段階においてジグソーパズルを構築し,グラフ畳み込みネットワーク(GCN)を段階的に解くグラフJigsawを提案する。
提案したグラフJigsawは、2つの人気のあるマンガの顔データセットにおいて、他の顔認識やジグソーベースの手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2021-07-14T08:01:06Z) - White-Box Cartoonization Using An Extended GAN Framework [0.0]
本稿では,既存のGANフレームワークを拡張するために,逆数プロセスによる生成モデルを推定するための新しいフレームワークを提案する。
実世界の写真やビデオから高品質な漫画画像や映像を生成できる、ホワイトボックス制御可能な画像漫画化を開発した。
論文 参考訳(メタデータ) (2021-07-09T17:09:19Z) - ReGO: Reference-Guided Outpainting for Scenery Image [82.21559299694555]
生成的敵対学習は、与えられた画像に対して意味的一貫したコンテンツを生成することによって、画像の画質を向上した。
本研究は, 近隣の画素を借用することにより, テクスチャに富んだ結果を合成する原理について検討する。
生成した部品のスタイルが参照画像の影響を受けないようにするために,ReGOを増強し,スタイル一貫性のある結果を合成するスタイルランキングの損失が提案されている。
論文 参考訳(メタデータ) (2021-06-20T02:34:55Z) - MarioNette: Self-Supervised Sprite Learning [67.51317291061115]
反復要素のグラフィカルな非絡み合い表現を得るための深層学習手法を提案する。
テクスチャパッチの辞書を共同で学習し,それらをキャンバスに配置するネットワークを訓練することにより,スプライトベースのコンテンツをスパースで一貫性があり,解釈可能な表現に効果的に分解する。
論文 参考訳(メタデータ) (2021-04-29T17:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。