論文の概要: Pitfalls of Conditional Batch Normalization for Contextual Multi-Modal
Learning
- arxiv url: http://arxiv.org/abs/2211.15071v1
- Date: Mon, 28 Nov 2022 05:15:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 18:39:06.909473
- Title: Pitfalls of Conditional Batch Normalization for Contextual Multi-Modal
Learning
- Title(参考訳): 条件付きバッチ正規化のマルチモーダル学習における落とし穴
- Authors: Ivaxi Sheth, Aamer Abdul Rahman, Mohammad Havaei, Samira Ebrahimi
Kahou
- Abstract要約: 条件付きバッチ正規化(CBN)は、深層学習タスクを支援するためにコンテキスト特徴を学習する一般的な方法である。
CBNによる補助データの導入によって得られた視覚的特徴が劣化することを明らかにする。
CBNは補助データとラベル間のショートカット学習を促進する。
- 参考スコア(独自算出の注目度): 8.571329113719973
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans have perfected the art of learning from multiple modalities through
sensory organs. Despite their impressive predictive performance on a single
modality, neural networks cannot reach human level accuracy with respect to
multiple modalities. This is a particularly challenging task due to variations
in the structure of respective modalities. Conditional Batch Normalization
(CBN) is a popular method that was proposed to learn contextual features to aid
deep learning tasks. This technique uses auxiliary data to improve
representational power by learning affine transformations for convolutional
neural networks. Despite the boost in performance observed by using CBN layers,
our work reveals that the visual features learned by introducing auxiliary data
via CBN deteriorates. We perform comprehensive experiments to evaluate the
brittleness of CBN networks to various datasets, suggesting that learning from
visual features alone could often be superior for generalization. We evaluate
CBN models on natural images for bird classification and histology images for
cancer type classification. We observe that the CBN network learns close to no
visual features on the bird classification dataset and partial visual features
on the histology dataset. Our extensive experiments reveal that CBN may
encourage shortcut learning between the auxiliary data and labels.
- Abstract(参考訳): 人間は感覚器官を通して複数のモダリティから学ぶ技術を完成させた。
単一のモダリティにおける驚くべき予測性能にもかかわらず、ニューラルネットワークは複数のモダリティに関して人間のレベルの精度に到達できない。
これは、それぞれの様相の構造が変化するため、特に難しい課題である。
条件付きバッチ正規化(CBN)は、文脈的特徴を学習して深層学習タスクを支援するために提案される一般的な手法である。
この技術は、畳み込みニューラルネットワークのアフィン変換を学習することにより、補助データを用いて表現力を向上させる。
CBN層を用いた性能向上にもかかわらず,我々はCBNによる補助データの導入によって得られた視覚的特徴が劣化していることを明らかにした。
我々は,様々なデータセットに対するCBNネットワークの脆さを評価するための総合的な実験を行い,視覚的特徴のみからの学習が一般化に優れていることを示唆した。
鳥類分類のための自然画像のcbnモデルと癌分類のための組織像を評価した。
我々は,CBNネットワークが鳥類分類データセットの視覚的特徴や組織学的データセットの視覚的特徴をほとんど学習していないことを観察した。
CBNは補助データとラベル間のショートカット学習を促進する可能性がある。
関連論文リスト
- Unified Batch Normalization: Identifying and Alleviating the Feature
Condensation in Batch Normalization and a Unified Framework [55.22949690864962]
バッチ正規化(BN)は、現代のニューラルネットワーク設計において欠かせない技術となっている。
UBN(Unified Batch Normalization)と呼ばれる2段階統合フレームワークを提案する。
UBNは異なる視覚バックボーンと異なる視覚タスクのパフォーマンスを大幅に向上させる。
論文 参考訳(メタデータ) (2023-11-27T16:41:31Z) - Unleashing the Power of Depth and Pose Estimation Neural Networks by
Designing Compatible Endoscopic Images [12.412060445862842]
内視鏡画像の特性を詳細に解析し、画像とニューラルネットワークの互換性を改善する。
まず,完全な画像情報の代わりに部分的な画像情報を入力するMask Image Modelling (MIM) モジュールを導入する。
第2に、画像とニューラルネットワークの互換性を明確に向上させるために、内視鏡画像を強化する軽量ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-14T02:19:38Z) - NCART: Neural Classification and Regression Tree for Tabular Data [0.5439020425819]
NCARTはResidual Networksの修正版で、完全に接続されたレイヤを複数の識別不能な決定木で置き換える。
ニューラルネットワークのエンドツーエンド能力の恩恵を受けながら、解釈可能性を維持している。
NCARTアーキテクチャの単純さは、さまざまなサイズのデータセットに適している。
論文 参考訳(メタデータ) (2023-07-23T01:27:26Z) - Graph Neural Networks Provably Benefit from Structural Information: A
Feature Learning Perspective [53.999128831324576]
グラフニューラルネットワーク(GNN)は、グラフ表現学習の先駆けとなった。
本研究では,特徴学習理論の文脈におけるグラフ畳み込みの役割について検討する。
論文 参考訳(メタデータ) (2023-06-24T10:21:11Z) - Joint Feature and Differentiable $ k $-NN Graph Learning using Dirichlet
Energy [103.74640329539389]
特徴選択と識別可能な$k $-NNグラフ学習を同時に行うディープFS法を提案する。
我々は、ニューラルネットワークで$ k $-NNグラフを学習する際の非微分可能性問題に対処するために、最適輸送理論を用いる。
本モデルの有効性を,合成データセットと実世界のデータセットの両方で広範な実験により検証する。
論文 参考訳(メタデータ) (2023-05-21T08:15:55Z) - Transfer Learning with Deep Tabular Models [66.67017691983182]
上流データにより、グラフニューラルネットワークはGBDTモデルよりも決定的な優位性を示す。
そこで本研究では,表在化学習のための現実的な診断ベンチマークを提案する。
上流と下流の特徴セットが異なる場合の擬似特徴法を提案する。
論文 参考訳(メタデータ) (2022-06-30T14:24:32Z) - Feature visualization for convolutional neural network models trained on
neuroimaging data [0.0]
畳み込みニューラルネットワーク(CNN)の機能可視化による最初の結果を示す。
我々は、MRIデータに基づく性分類や人為的病変分類など、さまざまなタスクのためにCNNを訓練した。
得られた画像は、その形状を含む人工的な病変の学習概念を明らかにするが、性分類タスクにおける抽象的な特徴を解釈することは困難である。
論文 参考訳(メタデータ) (2022-03-24T15:24:38Z) - Collaborative Method for Incremental Learning on Classification and
Generation [32.07222897378187]
本稿では,ニューラルネットワークを用いたインクリメンタルなクラス学習のための新しいアルゴリズム,Incrmental Class Learning with Attribute Sharing (ICLAS)を導入する。
そのコンポーネントの1つであるincGANは、トレーニングデータよりも多彩な画像を生成することができる。
データ不足の困難な環境下で、ICLASは段階的に分類と生成ネットワークを訓練する。
論文 参考訳(メタデータ) (2020-10-29T06:34:53Z) - AM-GCN: Adaptive Multi-channel Graph Convolutional Networks [85.0332394224503]
グラフ畳み込みネットワーク(GCN)は,豊富な情報を持つ複雑なグラフにおいて,ノードの特徴と位相構造を最適に統合できるかどうかを検討する。
半教師付き分類(AM-GCN)のための適応型マルチチャネルグラフ畳み込みネットワークを提案する。
実験の結果,AM-GCNはノードの特徴とトポロジ的構造の両方から最も相関性の高い情報を抽出することがわかった。
論文 参考訳(メタデータ) (2020-07-05T08:16:03Z) - GCC: Graph Contrastive Coding for Graph Neural Network Pre-Training [62.73470368851127]
グラフ表現学習は現実世界の問題に対処する強力な手法として登場した。
自己教師付きグラフニューラルネットワーク事前トレーニングフレームワークであるGraph Contrastive Codingを設計する。
3つのグラフ学習タスクと10のグラフデータセットについて実験を行った。
論文 参考訳(メタデータ) (2020-06-17T16:18:35Z) - Looking back to lower-level information in few-shot learning [4.873362301533825]
本稿では,隠れたニューラルネットワーク層の特徴埋め込みを低レベル支援情報として活用し,分類精度を向上させることを提案する。
筆者らは,MiniImageNet と tieredImageNet という2つの人気の数点学習データセットを用いた実験を行い,この手法がネットワークの低レベル情報を利用して最先端の分類性能を向上できることを示した。
論文 参考訳(メタデータ) (2020-05-27T20:32:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。