論文の概要: QADM-Net: Quality-adaptive Dynamic Network for Reliable Multimodal Classification
- arxiv url: http://arxiv.org/abs/2412.14489v1
- Date: Thu, 19 Dec 2024 03:26:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-20 13:31:30.036122
- Title: QADM-Net: Quality-adaptive Dynamic Network for Reliable Multimodal Classification
- Title(参考訳): QADM-Net:信頼性の高いマルチモーダル分類のための品質適応型動的ネットワーク
- Authors: Shu Shen, Tong Zhang, C. L. Philip Chen,
- Abstract要約: 本稿では,多様なサンプルから信頼性の高い結果を提供する上で,ネットワークダイナミクスと適応性の重要性に焦点をあてる。
品質適応型動的マルチモーダルネットワーク(QADM-Net)と呼ばれるマルチモーダルな分類のための新しいフレームワークを提案する。
4つのデータセットで行った実験により、QADM-Netは分類性能において最先端の手法を大幅に上回っていることが示された。
- 参考スコア(独自算出の注目度): 57.08108545219043
- License:
- Abstract: Integrating complementary information from different data modalities can yield representation with stronger expressive ability. However, data quality varies across multimodal samples, highlighting the need for learning reliable multimodal representations, especially in safety-critical applications. This paper focuses on an aspect that existing methods in this domain commonly overlook: the importance of network dynamics and adaptability in providing reliable results from diverse samples. Specifically, it highlights the model's ability to dynamically adjust its capacity and behaviour according to different samples, using the adjusted network for predicting each sample. To this end, we propose a novel framework for multimodal reliable classification termed Quality-adaptive Dynamic Multimodal Network (QADM-Net). QADM-Net first introduces a confidence-guided dynamic depths mechanism to achieve the appropriate network capacity. This mechanism adjusts the network depth according to the difficulty of each sample, which is determined by the quality of its modalities. Subsequently, we develop an informativeness-based dynamic parameters mechanism that enables QADM-Net to perform unique inference behaviour on each of the diverse samples with feature-level quality variation presented in their feature vectors. In this way, QADM-Net adequately adapts its capacity and behaviour on each sample by investigating the quality variation of samples at both modality and feature levels, thus enhancing the reliability of classification results. Experiments conducted on four datasets demonstrate that QADM-Net significantly outperforms state-of-the-art methods in classification performance and exhibits strong adaptability to data with diverse quality.
- Abstract(参考訳): 異なるデータモダリティから補完情報を統合すれば、表現力の強い表現が得られる。
しかし、データ品質はマルチモーダルのサンプルによって異なり、特に安全クリティカルなアプリケーションにおいて、信頼性の高いマルチモーダル表現を学習する必要性を強調している。
本稿では,この領域における既存の手法が一般的に見落としている側面に注目し,多様なサンプルから信頼性の高い結果を提供する上でのネットワークダイナミクスの重要性と適応性について述べる。
具体的には、各サンプルを予測するために調整されたネットワークを使用して、異なるサンプルに応じてキャパシティと振る舞いを動的に調整するモデルの能力を強調します。
そこで本研究では,QADM-Net(Quality-Adaptive Dynamic Multimodal Network)と呼ばれる,マルチモーダルな分類のための新しいフレームワークを提案する。
QADM-Netはまず、適切なネットワーク容量を達成するための信頼性誘導動的深度メカニズムを導入する。
このメカニズムは、各サンプルの難易度に応じてネットワーク深さを調整し、モダリティの品質によって決定される。
次に,QADM-Netが特徴ベクトルに現れる特徴レベルの品質変化を持つ多種多様なサンプルに対して,ユニークな推論動作を行うことができる情報量に基づく動的パラメータ機構を開発した。
このようにして、QADM-Netは、各サンプルのキャパシティと振る舞いを、モダリティと特徴レベルの両方におけるサンプルの品質変動を調査することで適切に適応し、分類結果の信頼性を高める。
4つのデータセットで実施された実験により、QADM-Netは分類性能において最先端の手法を著しく上回り、多様な品質を持つデータに強い適応性を示すことが示された。
関連論文リスト
- Context-Semantic Quality Awareness Network for Fine-Grained Visual Categorization [30.92656780805478]
細粒度視覚分類のための弱教師付き文脈意味品質認識ネットワーク(CSQA-Net)を提案する。
リッチな部分記述子とグローバルセマンティクスの空間的関係をモデル化するため,我々は新しい多部・多スケールクロスアテンション(MPMSCA)モジュールを開発した。
また、バックボーンネットワークの異なるレベルからの階層的セマンティクスを段階的に監視し、強化する汎用的マルチレベルセマンティクス評価モジュール(MLSQE)を提案する。
論文 参考訳(メタデータ) (2024-03-15T13:40:44Z) - Unleashing Network Potentials for Semantic Scene Completion [50.95486458217653]
本稿では,新しいSSCフレームワーク - Adrial Modality Modulation Network (AMMNet)を提案する。
AMMNetは、モダリティ間の勾配流の相互依存性を可能にするクロスモーダル変調と、動的勾配競争を利用するカスタマイズされた逆トレーニングスキームの2つのコアモジュールを導入している。
AMMNetは最先端のSSC法よりも大きなマージンで優れていた。
論文 参考訳(メタデータ) (2024-03-12T11:48:49Z) - Optimization Guarantees of Unfolded ISTA and ADMM Networks With Smooth
Soft-Thresholding [57.71603937699949]
我々は,学習エポックの数の増加とともに,ほぼゼロに近いトレーニング損失を達成するための最適化保証について検討した。
トレーニングサンプル数に対する閾値は,ネットワーク幅の増加とともに増加することを示す。
論文 参考訳(メタデータ) (2023-09-12T13:03:47Z) - Probabilistic MIMO U-Net: Efficient and Accurate Uncertainty Estimation
for Pixel-wise Regression [1.4528189330418977]
機械学習における不確実性推定は、予測モデルの信頼性と解釈可能性を高めるための最重要課題である。
画素ワイド回帰タスクに対するMIMO(Multiple-Input Multiple-Output)フレームワークの適応について述べる。
論文 参考訳(メタデータ) (2023-08-14T22:08:28Z) - Optimal Hyperparameters and Structure Setting of Multi-Objective Robust
CNN Systems via Generalized Taguchi Method and Objective Vector Norm [0.587414205988452]
機械学習、人工知能、畳み込みニューラルネットワーク(CNN)は幅広いアプリケーションで大きく進歩している。
これらのシステムには、多目的MLとAIパフォーマンスのニーズがある。
マルチオブジェクト・ロバストなCNNシステムの最適パラメータと構造を見つけるには重要な要件がある。
論文 参考訳(メタデータ) (2022-02-09T17:00:03Z) - Trusted Multi-View Classification [76.73585034192894]
本稿では,信頼された多視点分類と呼ばれる新しい多視点分類手法を提案する。
さまざまなビューをエビデンスレベルで動的に統合することで、マルチビュー学習のための新しいパラダイムを提供する。
提案アルゴリズムは,分類信頼性とロバスト性の両方を促進するために,複数のビューを併用する。
論文 参考訳(メタデータ) (2021-02-03T13:30:26Z) - Increasing the Confidence of Deep Neural Networks by Coverage Analysis [71.57324258813674]
本稿では、異なる安全でない入力に対してモデルを強化するために、カバレッジパラダイムに基づく軽量な監視アーキテクチャを提案する。
実験結果から,提案手法は強力な対向例とアウト・オブ・ディストリビューション・インプットの両方を検出するのに有効であることが示唆された。
論文 参考訳(メタデータ) (2021-01-28T16:38:26Z) - A Progressive Sub-Network Searching Framework for Dynamic Inference [33.93841415140311]
本稿では、トレーニング可能なノイズランキング、チャネルグループ、微調整しきい値設定、サブネット再選択など、いくつかの効果的な手法を組み込んだプログレッシブサブネット探索フレームワークを提案する。
提案手法は,従来普及していたUniversally-Slimmable-Networkの4.4%と平均2.3%と,モデルサイズが同じであるImageNetデータセットと比較して,より優れた動的推論精度を実現する。
論文 参考訳(メタデータ) (2020-09-11T22:56:02Z) - Deep Autoencoding Topic Model with Scalable Hybrid Bayesian Inference [55.35176938713946]
我々は、ガンマ分布の階層構造を用いて、その多確率層生成ネットワークを構築するディープ・オートエンコーディング・トピック・モデル(DATM)を開発した。
Weibull上向き変分エンコーダを提案する。このエンコーダは深層ニューラルネットワークを介して情報を上向きに伝播し,次いで下向き生成モデルを提案する。
大規模コーパス上での教師なしおよび教師なしの学習タスクにおいて,モデルの有効性とスケーラビリティを実証した。
論文 参考訳(メタデータ) (2020-06-15T22:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。