論文の概要: Reusing Fusion-Time Spectral Reliability for Adaptive Fusion and Expert Routing in RGB-Infrared Object Detection
- arxiv url: http://arxiv.org/abs/2606.01173v1
- Date: Sun, 31 May 2026 11:28:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.362564
- Title: Reusing Fusion-Time Spectral Reliability for Adaptive Fusion and Expert Routing in RGB-Infrared Object Detection
- Title(参考訳): RGB赤外線物体検出における適応核融合とエキスパートルーティングのための核融合時間スペクトル信頼性の再利用
- Authors: Yefeng Wu,
- Abstract要約: パラメータフリーで7次元のスペクトル信頼性記述子を抽出する。
バンドエネルギー、振幅比、位相整合性、および相互モード相関を記述します。
本研究では, 拡散時間信頼性を明示的な信号として保存することは, 適応的融合と後核融合条件計算の両方に有効であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: RGB-infrared detectors typically discard the statistics generated during cross-modal fusion, leaving downstream modules unaware of whether the current interaction is reliable. We propose to extract a parameter-free, 7-dimensional spectral reliability descriptor -- summarizing band energy, amplitude ratio, phase consistency, and cross-modal correlation -- and to reuse it beyond the fusion stage. The descriptor drives both Spectral Reliability Fusion (SRF), which gates a spectral residual against a conservative spatial base, and Reliability-Conditioned Expert Routing (RCER), which combines the descriptor with pooled content to steer sparse post-fusion experts. Under matched ablations, descriptor-aware gating improves mAP50 over content-only adaptive gating; a $2{\times}2$ factorial analysis further shows that descriptor-conditioned routing provides the larger marginal gain over expert architecture alone at near-equal parameter count. Under six synthetic degradations on DroneVehicle, average retention rises to 95.0%, versus 92.0% for content-only MoE and 87.9% for concatenation, with the largest gain under modality drop; the same model also improves mAP50 by +5.2/+5.3 on the natural day/night split. These results suggest that preserving fusion-time reliability as an explicit signal benefits both adaptive fusion and post-fusion conditional computation.
- Abstract(参考訳): RGB赤外線検出器は、通常、異種融合時に発生した統計を破棄し、下流のモジュールは現在の相互作用が信頼できるかどうかを知らないままである。
本研究では,パラメータフリーで7次元のスペクトル信頼性記述子(バンドエネルギー,振幅比,位相整合性,相互相関)を抽出し,融合段階を超えて再利用することを提案する。
ディスクリプタは、保守的な空間ベースに対してスペクトル残留をゲートするスペクトル信頼性融合(SRF)と、このディスクリプタをプールされたコンテンツと組み合わせてスパース後専門家を操る信頼性基準エキスパートルーティング(RCER)の両方を駆動する。
2.2{\times}2$ factorial analysis さらに、記述子条件付きルーティングは、ほぼ等値なパラメータ数でのみ専門家アーキテクチャよりも大きな利得を提供することを示している。
DroneVehicleの6つの合成劣化の下では、平均保持率は95.0%に上昇し、コンテンツのみのMoEは92.0%、結合は87.9%に上昇し、モダリティの低下が最も大きい。
これらの結果から, 陽の信号として核融合時の信頼性を保つことは, 適応核融合と後核融合条件計算の両方に有効であることが示唆された。
関連論文リスト
- Frequency-Guided Fusion For RGB-Thermal Semantic Segmentation [0.6187780920448871]
本稿では,2つのConvNeXt V2バックボーン上に構築されたマルチモーダル核融合アーキテクチャを提案する。
MFNetとPST900の実験では、我々の最も軽い変種はそれぞれ61.73%、86.24% mIoUであり、35.43Mのパラメータしか得られていない。
論文 参考訳(メタデータ) (2026-05-25T18:57:22Z) - LER-YOLO: Reliability-Aware Expert Routing for Misaligned RGB-Infrared UAV Detection [6.816296803605649]
LER-YOLOは、RGB赤外線UAV検出のための、信頼性に配慮したスパース・オブ・エキスパート・フレームワークである。
YOLOv5s- familyプロトコルの下での公開MBUベンチマークの実験では、LER-YOLOは3つの独立種子に対して89.7 +/-0.2% AP50を達成し、89.9%の最高結果が得られた。
論文 参考訳(メタデータ) (2026-05-20T03:33:13Z) - RSGMamba: Reliability-Aware Self-Gated State Space Model for Multimodal Semantic Segmentation [41.11292233905035]
シーン理解を強化するための強力なパラダイムとして、クロスモーダルなセマンティックセマンティックセマンティクスが登場した。
本稿では、信頼性を考慮した自己ゲート状態空間モデル(RSGMamba)と呼ばれる新しいフレームワークを提案する。
本手法のコアとなるのは、信頼性を意識した自己ゲート型マンバブロック(RSGMB)であり、モダリティの信頼性を明示的にモデル化し、相互モーダル相互作用を動的に制御する。
論文 参考訳(メタデータ) (2026-04-14T05:51:15Z) - Alignment-Aware and Reliability-Gated Multimodal Fusion for Unmanned Aerial Vehicle Detection Across Heterogeneous Thermal-Visual Sensors [6.686898063543218]
本研究は,Registration-Aware Guided Image Fusion (RGIF)とReliability-Gated Modality-Attention Fusion (RGMAF)の2つの融合戦略を紹介する。
RGIFは拡張相関係数(ECC)ベースのアフィン登録とガイドフィルターを組み合わせて熱塩分濃度を維持しながら構造的詳細を増強する。
RGMAFは、アフィンと光フローの登録と、熱コントラストと視覚的シャープネスを適応的にバランスさせる信頼性の高い注意機構を統合する。
論文 参考訳(メタデータ) (2026-03-09T10:39:26Z) - Function-Space Decoupled Diffusion for Forward and Inverse Modeling in Carbon Capture and Storage [65.51149575007149]
本稿では,Fun-DDPSについて述べる。Fun-DDPSは,関数空間拡散モデルと微分可能なニューラル演算子サロゲートを結合した生成フレームワークである。
Fun-DDPSは、ジョイントステートベースラインで観察される高周波アーティファクトから、物理的に一貫した実現をもたらす。
論文 参考訳(メタデータ) (2026-02-12T18:58:12Z) - Spectral Gating Networks [65.9496901693099]
我々は、フィードフォワードネットワークに周波数リッチな表現性を導入するために、スペクトルゲーティングネットワーク(SGN)を導入する。
SGNは、標準活性化経路をコンパクトなスペクトル経路と学習可能なゲートで拡張し、安定したベース動作からモデルを開始することができる。
計算予算に匹敵する精度と効率のトレードオフを継続的に改善する。
論文 参考訳(メタデータ) (2026-02-07T20:00:49Z) - PAD: Phase-Amplitude Decoupling Fusion for Multi-Modal Land Cover Classification [49.37555541088792]
位相振幅デカップリング(PAD)は、位相(モダリティ共有)と振幅(モダリティ補完)を分離する周波数対応のフレームワークである。
この研究は、リモートセンシングにおける物理を意識したマルチモーダル融合の新しいパラダイムを確立する。
論文 参考訳(メタデータ) (2025-04-27T07:21:42Z) - Theoretical Insights in Model Inversion Robustness and Conditional Entropy Maximization for Collaborative Inference Systems [89.35169042718739]
協調推論により、クラウドサーバに機密データを公開することなく、エンドユーザは強力なディープラーニングモデルを活用することができる。
近年の研究では、これらの中間機能は、情報が漏洩し、生データをモデル反転攻撃(MIA)によって再構築できるため、プライバシーを十分に保持できないことが判明している。
この研究はまず、与えられた中間特徴の入力の条件エントロピーが、任意のMIAの下での再構成平均二乗誤差(MSE)の保証された下界を与えることを理論的に証明する。
そして、ガウス混合推定に基づいて、この条件付きエントロピーを有界化するための微分可能かつ可解な尺度を導出し、逆ロバスト性を高める条件付きエントロピーアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-03-01T07:15:21Z) - CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for
Multi-Modality Image Fusion [138.40422469153145]
本稿では,CDDFuse(Relationed-Driven Feature Decomposition Fusion)ネットワークを提案する。
近赤外可視画像融合や医用画像融合など,複数の融合タスクにおいてCDDFuseが有望な結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-11-26T02:40:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。