論文の概要: Shape-Biased Domain Generalization via Shock Graph Embeddings
- arxiv url: http://arxiv.org/abs/2109.05671v1
- Date: Mon, 13 Sep 2021 02:10:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 16:00:17.929422
- Title: Shape-Biased Domain Generalization via Shock Graph Embeddings
- Title(参考訳): 衝撃グラフ埋め込みによる形状バイアス領域一般化
- Authors: Maruthi Narayanan, Vickram Rajendran, Benjamin Kimia
- Abstract要約: 本稿では,古典的コンピュータビジョンを用いた形状の明示的かつ完全な表現を提唱する。
結果として得られるグラフとその記述子は、輪郭内容の完全な表現であり、最近のグラフニューラルネットワーク(GNN)手法を用いて分類される。
- 参考スコア(独自算出の注目度): 2.578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is an emerging sense that the vulnerability of Image Convolutional
Neural Networks (CNN), i.e., sensitivity to image corruptions, perturbations,
and adversarial attacks, is connected with Texture Bias. This relative lack of
Shape Bias is also responsible for poor performance in Domain Generalization
(DG). The inclusion of a role of shape alleviates these vulnerabilities and
some approaches have achieved this by training on negative images, images
endowed with edge maps, or images with conflicting shape and texture
information. This paper advocates an explicit and complete representation of
shape using a classical computer vision approach, namely, representing the
shape content of an image with the shock graph of its contour map. The
resulting graph and its descriptor is a complete representation of contour
content and is classified using recent Graph Neural Network (GNN) methods. The
experimental results on three domain shift datasets, Colored MNIST, PACS, and
VLCS demonstrate that even without using appearance the shape-based approach
exceeds classical Image CNN based methods in domain generalization.
- Abstract(参考訳): 画像畳み込みニューラルネットワーク(CNN: Image Convolutional Neural Networks)の脆弱性、すなわち、画像の破損、摂動、敵攻撃に対する感受性は、Texture Biasと結びついている、という新たな感覚がある。
形状バイアスの相対的欠如はドメイン一般化(dg)における性能低下にも寄与する。
形状の役割の導入はこれらの脆弱性を緩和し、いくつかのアプローチは、否定的な画像、エッジマップが付与された画像、あるいは矛盾する形状やテクスチャ情報を持つ画像のトレーニングによって達成されている。
本稿では,古典的コンピュータビジョンによる形状の明示的かつ完全な表現,すなわち,その輪郭図の衝撃グラフを用いて画像の形状内容を表現することを提唱する。
得られたグラフとそのディスクリプタは輪郭内容の完全な表現であり、最近のgraph neural network (gnn) 法を用いて分類される。
色付きMNIST, PACS, VLCSの3つの領域シフトデータセットに対する実験結果から, 形状ベースアプローチを使用せずにも, 領域一般化における古典的画像CNN法を超越することを示した。
関連論文リスト
- HRGR: Enhancing Image Manipulation Detection via Hierarchical Region-aware Graph Reasoning [41.99592210429157]
階層型領域認識グラフ推論(HRGR)と呼ばれる新しい手法について述べる。
既存のグリッド方式とは違って,新しい特徴分割戦略によって生成される不規則な形状のコンテンツコヒーレンス特徴領域に基づく画像相関をモデル化する。
本手法は完全に差別化可能であり,監視を必要とせず,エンドツーエンドで主流ネットワークにシームレスに統合することが可能である。
論文 参考訳(メタデータ) (2024-10-29T08:51:30Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Deformation-Invariant Neural Network and Its Applications in Distorted
Image Restoration and Analysis [8.009077765403287]
幾何学的歪みによって劣化した画像は、画像や物体認識などのコンピュータビジョンタスクにおいて重要な課題となる。
ディープラーニングに基づく画像モデルは通常、幾何学的に歪んだ画像に対して正確な性能を与えることができない。
本稿では、幾何学的に歪んだ画像の撮像タスクに対処するフレームワークである変形不変ニューラルネットワーク(DINN)を提案する。
論文 参考訳(メタデータ) (2023-10-04T08:01:36Z) - Masked Contrastive Graph Representation Learning for Age Estimation [44.96502862249276]
本稿では,画像冗長性情報を扱う上で,グラフ表現学習の特性を利用する。
年齢推定のためのMasked Contrastive Graph Representation Learning (MCGRL)法を提案する。
実世界の顔画像データセットに対する実験結果から,提案手法が他の最先端の年齢推定手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-06-16T15:53:21Z) - RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline
Model and DoF-based Curriculum Learning [62.86400614141706]
我々はRecRecNet(Rectangling Rectification Network)という新しい学習モデルを提案する。
我々のモデルは、ソース構造をターゲット領域に柔軟にワープし、エンドツーエンドの非教師なし変形を実現する。
実験により, 定量評価と定性評価の両面において, 比較法よりも解法の方が優れていることが示された。
論文 参考訳(メタデータ) (2023-01-04T15:12:57Z) - Shap-CAM: Visual Explanations for Convolutional Neural Networks based on
Shapley Value [86.69600830581912]
クラスアクティベーションマッピングに基づくShap-CAMと呼ばれる新しい視覚的説明法を開発した。
我々は,Shap-CAMが意思決定プロセスの解釈において,より良い視覚的性能と公平性を実現することを実証した。
論文 参考訳(メタデータ) (2022-08-07T00:59:23Z) - Learning Hierarchical Graph Representation for Image Manipulation
Detection [50.04902159383709]
画像操作検出の目的は、画像内の操作された領域を特定し、特定することである。
最近のアプローチでは、画像に残っている改ざんするアーティファクトをキャプチャするために、洗練された畳み込みニューラルネットワーク(CNN)が採用されている。
本稿では2つの並列分岐からなる階層型グラフ畳み込みネットワーク(HGCN-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-15T01:54:25Z) - Processing of incomplete images by (graph) convolutional neural networks [7.778461949427663]
欠落した値を置き換えることなく、不完全な画像からニューラルネットワークを訓練する問題について検討する。
画像はまずグラフとして表現され、欠落したピクセルは完全に無視される。
グラフ画像表現は空間グラフ畳み込みネットワークを用いて処理される。
論文 参考訳(メタデータ) (2020-10-26T21:40:03Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - Superpixel Image Classification with Graph Attention Networks [4.714325419968082]
本稿では,グラフニューラルネットワーク(GNN)モデルを用いた画像分類手法を提案する。
入力画像を領域隣接グラフ (RAG) に変換する。
グラフ畳み込みと自己アテンション機構を組み合わせたグラフアテンションネットワーク(GAT)は、他のGNNモデルより優れていることを実験的に示唆している。
論文 参考訳(メタデータ) (2020-02-13T14:52:32Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。