論文の概要: Adaptive Confidence Regularization for Multimodal Failure Detection
- arxiv url: http://arxiv.org/abs/2603.02200v1
- Date: Mon, 02 Mar 2026 18:56:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:57.044868
- Title: Adaptive Confidence Regularization for Multimodal Failure Detection
- Title(参考訳): 多モード故障検出のための適応信頼規則化
- Authors: Moru Liu, Hao Dong, Olga Fink, Mario Trapp,
- Abstract要約: 適応信頼規則化(Adaptive Confidence Regularization, ACR)は,マルチモーダル障害の検出に特化して設計されたフレームワークである。
ほとんどの障害の場合、マルチモーダル予測の信頼性は、少なくとも1つのユニモーダル分岐の信頼性よりも著しく低い。
さらに,困難かつ障害対応のトレーニング例を生成する新手法であるMultimodal Feature Swappingを提案する。
- 参考スコア(独自算出の注目度): 21.36399203050946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The deployment of multimodal models in high-stakes domains, such as self-driving vehicles and medical diagnostics, demands not only strong predictive performance but also reliable mechanisms for detecting failures. In this work, we address the largely unexplored problem of failure detection in multimodal contexts. We propose Adaptive Confidence Regularization (ACR), a novel framework specifically designed to detect multimodal failures. Our approach is driven by a key observation: in most failure cases, the confidence of the multimodal prediction is significantly lower than that of at least one unimodal branch, a phenomenon we term confidence degradation. To mitigate this, we introduce an Adaptive Confidence Loss that penalizes such degradations during training. In addition, we propose Multimodal Feature Swapping, a novel outlier synthesis technique that generates challenging, failure-aware training examples. By training with these synthetic failures, ACR learns to more effectively recognize and reject uncertain predictions, thereby improving overall reliability. Extensive experiments across four datasets, three modalities, and multiple evaluation settings demonstrate that ACR achieves consistent and robust gains. The source code will be available at https://github.com/mona4399/ACR.
- Abstract(参考訳): 自動運転車や医療診断などのハイテイク領域におけるマルチモーダルモデルの展開は、強い予測性能だけでなく、障害を検出するための信頼性の高いメカニズムも要求する。
本研究では,マルチモーダルコンテキストにおける障害検出の未解決問題に対処する。
適応信頼規則化(Adaptive Confidence Regularization, ACR)は,マルチモーダル障害の検出に特化して設計された新しいフレームワークである。
ほとんどの障害では、マルチモーダル予測の信頼性は少なくとも1つの単調分岐の信頼性よりも著しく低い。
これを軽減するために、トレーニング中にそのような劣化を罰する適応信頼喪失を導入する。
さらに,難易度の高い学習例を生成する新しい外乱合成手法であるMultimodal Feature Swappingを提案する。
これらの合成失敗をトレーニングすることで、ACRは不確実な予測をより効果的に認識し、拒否することを学び、全体的な信頼性を向上させる。
4つのデータセット、3つのモード、複数の評価設定にわたる大規模な実験は、ACRが一貫性と堅牢なゲインを達成することを示す。
ソースコードはhttps://github.com/mona4399/ACRで入手できる。
関連論文リスト
- Confidence Estimation for LLMs in Multi-turn Interactions [48.081802290688394]
この研究は、マルチターン相互作用における信頼度推定に関する最初の体系的研究である。
そこで我々は,2つの主要なデシラタに基礎を置く形式的評価枠組みを構築した。
我々の研究は、より信頼性が高く信頼性の高い会話エージェントを開発するための基礎的な方法論を提供する。
論文 参考訳(メタデータ) (2026-01-05T14:58:04Z) - Distributionally Robust Multimodal Machine Learning [1.8788768422083866]
本稿では,マルチモーダル機械学習の理論的および実践的知見の両方を研究することを目的とした,分散ロバスト最適化(DRO)フレームワークを提案する。
シミュレーション設定と実世界のデータセットの両方において,我々のアプローチが堅牢性を向上させることを実証的に実証した。
論文 参考訳(メタデータ) (2025-11-07T21:18:35Z) - TrustLoRA: Low-Rank Adaptation for Failure Detection under Out-of-distribution Data [62.22804234013273]
本稿では,共変量および意味的シフトの両条件下での拒絶による分類を統一し,促進する,単純な故障検出フレームワークを提案する。
キーとなる洞察は、障害固有の信頼性知識を低ランクアダプタで分離し、統合することにより、障害検出能力を効果的かつ柔軟に向上できるということです。
論文 参考訳(メタデータ) (2025-04-20T09:20:55Z) - Network Inversion for Generating Confidently Classified Counterfeits [11.599035626374409]
視覚分類において、自信のある予測をもたらす入力を生成することは、モデルの振る舞いと信頼性を理解するための鍵となる。
我々はネットワーク・インバージョン・テクニックを拡張してCCC(Confidently Classified Counterfeits)を生成する。
CCCは信頼性に関するモデル中心の視点を提供し、モデルが完全に合成されたアウト・オブ・ディストリビューション・インプットに高い信頼を割り当てることを明らかにする。
論文 参考訳(メタデータ) (2025-03-26T03:26:49Z) - Confidence-aware multi-modality learning for eye disease screening [58.861421804458395]
眼疾患スクリーニングのための新しい多モード顕在核融合パイプラインを提案する。
モダリティごとに信頼度を測り、マルチモダリティ情報をエレガントに統合する。
パブリックデータセットと内部データセットの両方の実験結果は、我々のモデルが堅牢性に優れていることを示している。
論文 参考訳(メタデータ) (2024-05-28T13:27:30Z) - Revisiting Confidence Estimation: Towards Reliable Failure Prediction [53.79160907725975]
多くの信頼度推定法は誤分類誤りを検出するのに有害である。
本稿では, 最先端の故障予測性能を示す平坦な最小値を求めることにより, 信頼性ギャップを拡大することを提案する。
論文 参考訳(メタデータ) (2024-03-05T11:44:14Z) - Multiclass Alignment of Confidence and Certainty for Network Calibration [10.15706847741555]
最近の研究では、ディープニューラルネットワーク(DNN)が過信的な予測を行う傾向があることが示されている。
予測平均信頼度と予測確実性(MACC)の多クラスアライメントとして知られる簡易なプラグアンドプレイ補助損失を特徴とする列車時キャリブレーション法を提案する。
本手法は,領域内および領域外両方のキャリブレーション性能を実現する。
論文 参考訳(メタデータ) (2023-09-06T00:56:24Z) - Calibrating Multimodal Learning [94.65232214643436]
本稿では,従来の手法の予測信頼性を校正するために,新たな正規化手法であるCML(Callibrating Multimodal Learning)正則化を提案する。
この技術は、既存のモデルによって柔軟に装備され、信頼性校正、分類精度、モデルロバスト性の観点から性能を向上させることができる。
論文 参考訳(メタデータ) (2023-06-02T04:29:57Z) - Enhancing Multiple Reliability Measures via Nuisance-extended
Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。
我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。
そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文 参考訳(メタデータ) (2023-03-24T16:03:21Z) - Trustworthy Multimodal Regression with Mixture of Normal-inverse Gamma
Distributions [91.63716984911278]
このアルゴリズムは、異なるモードの適応的統合の原理における不確かさを効率的に推定し、信頼できる回帰結果を生成する。
実世界のデータと実世界のデータの両方に対する実験結果から,多モード回帰タスクにおける本手法の有効性と信頼性が示された。
論文 参考訳(メタデータ) (2021-11-11T14:28:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。