論文の概要: $\mathcal{B}^{3}$-Net: Controlled Posterior Bridge Learning for Multi-Task Dense Prediction
- arxiv url: http://arxiv.org/abs/2605.05722v1
- Date: Thu, 07 May 2026 06:11:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.554069
- Title: $\mathcal{B}^{3}$-Net: Controlled Posterior Bridge Learning for Multi-Task Dense Prediction
- Title(参考訳): $\mathcal{B}^{3}$-Net:Multi-Task Dense Predictionのための制御後橋学習
- Authors: Meihua Zhou, Li Yang,
- Abstract要約: マルチタスク密度予測は、統一モデルにおいて相補的なピクセルレベルのタスクを解く。
既存のデコーダ側のインタラクションでは、アテンション、プロンプト、ルーティング、拡散、Mamba、ブリッジ機能を使ってタスクエビデンスを交換する。
マルチタスク密度予測のための後部ブリッジ学習フレームワークであるmathcalB3$-Netを提案する。
- 参考スコア(独自算出の注目度): 5.2403331899624455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-task dense prediction solves complementary pixel-level tasks in a unified model, such as semantic segmentation, depth estimation, surface normal estimation, and edge detection. Existing decoder-side interactions use attention, prompts, routing, diffusion, Mamba, or bridge features to exchange task evidence, but most of them organize this evidence implicitly. They usually fuse task features by similarity or affinity, without explicitly modeling that evidence reliability varies across tasks and spatial locations. As a result, unreliable evidence may contaminate the shared representation and intensify negative transfer. We propose $\mathcal{B}^{3}$-Net, a controlled posterior bridge learning framework for multi-task dense prediction. Our method decomposes decoder-side interaction into reliability estimation, posterior bridge construction, and bounded redistribution. The Precision Field Estimator estimates patch-wise evidence precision from task-reference alignment and local variation. The Posterior Bridge Operator builds a precision-weighted posterior bridge through heteroscedastic evidence fusion, yielding a shared state more reliable than uniform or heuristic mixtures. The Contractive Dispatch Operator redistributes the bridge to each task branch through a bounded update, reducing uncontrolled feature injection. Experiments on NYUD-v2, PASCAL-Context, and Cityscapes show that $\mathcal{B}^{3}$-Net achieves competitive or superior trade-offs over representative CNN-, Transformer-, diffusion-, Mamba-, and bridge-feature-based methods. Backbone-matched comparisons and extensive analyses further verify that the gains arise from controlled posterior bridge learning rather than backbone capacity or decoder scale.
- Abstract(参考訳): マルチタスク高密度予測は、セマンティックセグメンテーション、深さ推定、表面正規推定、エッジ検出などの統一モデルにおいて、相補的なピクセルレベルのタスクを解く。
既存のデコーダ側のインタラクションでは、アテンション、プロンプト、ルーティング、拡散、マンバ、ブリッジ機能を使ってタスクのエビデンスを交換するが、ほとんどの場合、このエビデンスを暗黙的に整理する。
それらは通常、タスクの特徴を類似性や親和性によって融合させ、タスクや空間的な場所によって信頼性が変化する証拠を明示的にモデル化しない。
その結果、信頼できない証拠は共有表現を汚染し、負の移動を強化する可能性がある。
マルチタスク密度予測のための制御後橋学習フレームワークである$\mathcal{B}^{3}$-Netを提案する。
提案手法は,デコーダ側相互作用を信頼性推定,後部橋構造,有界再分配に分解する。
精度場推定器は、タスク参照アライメントと局所的変動からパッチワイドエビデンスを推定する。
Posterior Bridge Operatorは、ヘテロシダスティックなエビデンス融合を通じて精度の高い後部橋を構築し、均一またはヒューリスティックな混合よりも信頼性の高い共有状態を生成する。
Contractive Dispatch Operatorは、境界更新を通じて各タスクブランチへのブリッジを再分割し、制御されていない機能注入を減らす。
NYUD-v2、PASCAL-Context、Cityscapesの実験では、$\mathcal{B}^{3}$-Netは代表的CNN-、Transformer-、拡散-、Mamba-、ブリッジ機能ベースのメソッドよりも競合的または優れたトレードオフを実現する。
バックボーン整合比較と広範囲な解析により、バックボーン容量やデコーダスケールよりも制御された後部ブリッジ学習から得られる利得が検証される。
関連論文リスト
- Affordance Agent Harness: Verification-Gated Skill Orchestration [45.231685718099264]
Affordance groundingは、オープンワールドのシーンでエージェントがどこでどのように対話すべきかを特定する必要がある。
本稿では,エビデンスストアとコストコントロールを備えたクローズドループランタイムであるAffordance Agent Harnessを提案する。
論文 参考訳(メタデータ) (2026-05-01T13:45:16Z) - CrossCheck-Bench: Diagnosing Compositional Failures in Multimodal Conflict Resolution [20.823419395675412]
CrossCheck-Benchは、マルチモーダル入力における矛盾検出を評価するための診断ベンチマークである。
タスクが知覚的マッチングから論理的矛盾検出に移行するにつれて、13の最先端の視覚言語モデルを評価し、一貫した性能低下を観察する。
論文 参考訳(メタデータ) (2025-11-19T12:17:15Z) - Diffusion Bridge or Flow Matching? A Unifying Framework and Comparative Analysis [57.614436689939986]
拡散ブリッジとフローマッチングは、任意の分布間の変換において魅力的な経験的性能を示した。
我々は,これらのフレームワークを最適制御のレンズを通して再キャストし,拡散橋のコスト関数が低いことを証明した。
これらの理論的主張を裏付けるために,潜伏変圧器上に構築された拡散橋の新しい強力なアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-09-29T09:45:22Z) - DPBridge: Latent Diffusion Bridge for Dense Prediction [49.1574468325115]
DPBridgeは、密度予測タスクのための最初の潜伏拡散ブリッジフレームワークである。
提案手法は,異なるシナリオ下での有効性と能力の一般化を実証し,優れた性能を継続的に達成する。
論文 参考訳(メタデータ) (2024-12-29T15:50:34Z) - ComPtr: Towards Diverse Bi-source Dense Prediction Tasks via A Simple yet General Complementary Transformer [71.82644727907146]
多様な双方向の高密度予測タスクに対して,$underlineComP$lementary $underlinetr$ansformer, $textbfComPtr$を提案する。
ComPtrは異なる入力を等しく扱い、変換器上にシーケンス・ツー・シーケンスの形で効率的な密な相互作用モデルを構築する。
論文 参考訳(メタデータ) (2023-07-23T15:17:45Z) - Meta Learning Low Rank Covariance Factors for Energy-Based Deterministic
Uncertainty [58.144520501201995]
ニューラルネットワーク層のBi-Lipschitz正規化は、各レイヤの特徴空間におけるデータインスタンス間の相対距離を保存する。
注意セットエンコーダを用いて,タスク固有の共分散行列を効率的に構築するために,対角的,対角的,低ランクな要素のメタ学習を提案する。
また,最終的な予測分布を達成するために,スケールしたエネルギーを利用する推論手法を提案する。
論文 参考訳(メタデータ) (2021-10-12T22:04:19Z) - HierMUD: Hierarchical Multi-task Unsupervised Domain Adaptation between
Bridges for Drive-by Damage Diagnosis [9.261126434781744]
対象橋のラベルを使わずに,橋梁の損傷を診断するために,ある橋梁から学習したモデルを転送する新しい枠組みを提案する。
我々のフレームワークは、タスク共有とタスク固有の特徴を抽出するために、逆方向の方法で階層型ニューラルネットワークモデルを訓練する。
2つの橋と3台の車両から収集した実験データについて,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2021-07-23T19:39:32Z) - Knowledge transfer between bridges for drive-by monitoring using
adversarial and multi-task learning [6.462702225377603]
車両の振動による橋梁の健康状態のモニタリングには、低コストや直接設置や設備の現場メンテナンスの必要がないなど、様々な利点がある。
このようなアプローチの多くは、すべての橋からのラベル付きデータを必要としており、これは高価で、不可能ではないとしても、入手するのに時間を要する。
ドメイン・アドバイザリ・トレーニングとマルチタスク・ラーニングを用いたトランスファー・ラーニング・フレームワークを導入し,損傷の検出,局所化,定量化を行う。
論文 参考訳(メタデータ) (2020-06-05T19:18:45Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。