論文の概要: Lighting-aware Unified Model for Instance Segmentation
- arxiv url: http://arxiv.org/abs/2605.20436v1
- Date: Tue, 19 May 2026 19:35:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.347806
- Title: Lighting-aware Unified Model for Instance Segmentation
- Title(参考訳): インスタンスセグメンテーションのための照明対応統一モデル
- Authors: Qisai Liu, Alloy Das, Zhanhong Jiang, Joshua R. Waite, Aditya Balu, Adarsh Krishnamurthy, Soumik Sarkar,
- Abstract要約: 重いバックボーンを微調整することなくセグメンテーションロバスト性を高めるアダプタモジュールを開発した。
lcaは、コントラストマップと並行してRGB機能を処理するためにデュアルブランチアーキテクチャを採用し、物理的に動機付けされた構造変化に対する感度を可能にする。
本稿では、複雑な現実世界の照明条件を正確に再現するための新しいUnityベースの合成データセットを提案する。
- 参考スコア(独自算出の注目度): 12.511503644139369
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models like the Segment Anything Model (SAM) demonstrate impressive zero-shot generalization but frequently degrade under diverse real-world illumination, particularly for instance segmentation. In this work, we address this limitation by developing \textit{Lighting Convolutional-Attention (\lca{})}, an adapter module that enhances segmentation robustness without fine-tuning the heavy backbone. \lca{} employs a dual-branch architecture to process RGB features alongside contrast maps, enabling physically motivated sensitivity to structural changes rather than illumination artifacts. We optimize \lca{} through a pairwise training strategy, introducing a targeted loss term that explicitly penalizes discrepancies between clean images and their corresponding illumination variants. To evaluate and support this architecture, we conduct a comprehensive empirical study across multiple existing benchmarks and present a novel Unity-based synthetic dataset specifically designed to accurately replicate complex real-world lighting conditions. Extensive experimental results demonstrate that our approach successfully bridges the domain gap, delivering superior lighting-robust segmentation.
- Abstract(参考訳): Segment Anything Model (SAM) のような基礎モデルは、印象的なゼロショットの一般化を示すが、実世界の様々な照明の下でしばしば劣化する。
本研究では,重なバックボーンを微調整することなくセグメンテーションの堅牢性を高めるアダプタモジュールであるtextit{Lighting Convolutional-Attention (\lca{})} を開発することで,この制限に対処する。
\lca{}は、コントラストマップと並行してRGB機能を処理するためにデュアルブランチアーキテクチャを使用し、照明アーチファクトではなく、物理的に動機付けられた構造変化に対する感度を可能にする。
クリーンな画像とそれに対応する照明の変種との相違を明示する目的的損失項を導入し、ペアワイズトレーニング戦略により \lca{} を最適化する。
このアーキテクチャを評価・支援するために、複数の既存のベンチマークにまたがる包括的な実証研究を行い、複雑な現実世界の照明条件を正確に再現する新しいUnityベースの合成データセットを提案する。
大規模な実験結果から,本手法は領域ギャップを埋めることに成功し,照明・ローバストセグメンテーションに優れることを示した。
関連論文リスト
- UniBlendNet: Unified Global, Multi-Scale, and Region-Adaptive Modeling for Ambient Lighting Normalization [18.768161260032553]
環境照明正規化は、複雑な空間的に変化する照明条件によって劣化した画像を復元することを目的としている。
IFBlendのような既存の手法は、周波数領域の先行値を利用して照明のバリエーションをモデル化する。
環境光の正規化のための統一的なフレームワークUniBlendNetを提案する。
論文 参考訳(メタデータ) (2026-04-15T01:13:18Z) - Dual-Path Learning based on Frequency Structural Decoupling and Regional-Aware Fusion for Low-Light Image Super-Resolution [15.557346345104307]
低照度画像超解像(LLISR)は、照明条件が不十分な場合の視覚的細部と知覚的品質の回復に不可欠である。
本稿では、輝度とテクスチャを意味的に独立したコンポーネントに分離する新しい周波数認識フレームワークであるDecoupling then Perceive (DTP)を提案する。
最も広く使われているLLISRベンチマークの実験は、我々のDTPフレームワークの優位性を実証している。
論文 参考訳(メタデータ) (2026-03-28T15:15:08Z) - Zero-Reference Joint Low-Light Enhancement and Deblurring via Visual Autoregressive Modeling with VLM-Derived Modulation [18.67176370944511]
現実の暗黒画像は、視界とコントラストの低いだけでなく、複雑なノイズやぼやけも示しており、重要な修復上の課題を呈している。
視覚言語モデル(VLM)を用いた視覚自己回帰モデル(VAR)に基づく生成フレームワークを提案する。
我々のフレームワークは完全に教師なしであり、ベンチマークデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-11-23T19:08:45Z) - Towards Generalized Range-View LiDAR Segmentation in Adverse Weather [65.22588361803942]
我々は、厳しい天候下でのLiDARセグメンテーションの一般化に影響を及ぼす固有の課題を特定し、分析する。
既存のモデルのコアアーキテクチャを変更することなく、ロバスト性を高めるモジュール式で軽量なフレームワークを提案する。
提案手法は,推定オーバーヘッドを最小限に抑え,悪天候への一般化を著しく改善する。
論文 参考訳(メタデータ) (2025-06-10T16:48:27Z) - Manifold-aware Representation Learning for Degradation-agnostic Image Restoration [135.90908995927194]
画像復元(IR)は、ノイズ、ぼかし、迷路、雨、低照度といった様々な汚職に影響を受ける劣化した入力から高品質な画像を復元することを目的としている。
我々は、入力特徴空間を3つのセマンティックに整列した並列分岐に明示的に分解する1つのIRにおいて、すべてに統一されたフレームワークであるMIRAGEを提案する。
このモジュラ分解は、多種多様な分解の一般化と効率を大幅に改善する。
論文 参考訳(メタデータ) (2025-05-24T12:52:10Z) - Toward Fast, Flexible, and Robust Low-Light Image Enhancement [87.27326390675155]
我々は、現実の低照度シナリオにおいて、高速でフレキシブルで頑健な鮮明化のための新しい自己校正イルミネーション(SCI)学習フレームワークを開発した。
カスケードパターンの計算負担を考慮すると、各ステージの結果の収束を実現する自己校正モジュールを構築する。
我々は,SCI固有の特性について,操作不感適応性やモデル非関係の一般性を含む包括的探索を行う。
論文 参考訳(メタデータ) (2022-04-21T14:40:32Z) - Learning Deep Context-Sensitive Decomposition for Low-Light Image
Enhancement [58.72667941107544]
典型的なフレームワークは、照明と反射を同時に推定することであるが、特徴空間にカプセル化されたシーンレベルの文脈情報を無視する。
本研究では,空間スケールにおけるシーンレベルのコンテキスト依存を生かした,コンテキスト依存型分解ネットワークアーキテクチャを提案する。
チャネル数を減らして軽量なCSDNet(LiteCSDNet)を開発する。
論文 参考訳(メタデータ) (2021-12-09T06:25:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。