論文の概要: Delving into Cascaded Instability: A Lipschitz Continuity View on Image Restoration and Object Detection Synergy
- arxiv url: http://arxiv.org/abs/2510.24232v1
- Date: Tue, 28 Oct 2025 09:41:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-29 15:35:36.994771
- Title: Delving into Cascaded Instability: A Lipschitz Continuity View on Image Restoration and Object Detection Synergy
- Title(参考訳): カスケード不安定状態に陥る:画像復元と物体検出の相乗効果に関するリプシッツ連続性
- Authors: Qing Zhao, Weijian Deng, Pengxu Wei, ZiYi Dong, Hannan Lu, Xiangyang Ji, Liang Lin,
- Abstract要約: リプシッツ規則化物体検出(LROD)
本稿では,リプシッツ規則化YOLO(LR-YOLO)を提案する。
ヘイズと低照度ベンチマークの実験では、LR-YOLOは検出安定性、最適化のスムーズさ、全体的な精度を一貫して改善している。
- 参考スコア(独自算出の注目度): 95.93943805282868
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To improve detection robustness in adverse conditions (e.g., haze and low light), image restoration is commonly applied as a pre-processing step to enhance image quality for the detector. However, the functional mismatch between restoration and detection networks can introduce instability and hinder effective integration -- an issue that remains underexplored. We revisit this limitation through the lens of Lipschitz continuity, analyzing the functional differences between restoration and detection networks in both the input space and the parameter space. Our analysis shows that restoration networks perform smooth, continuous transformations, while object detectors operate with discontinuous decision boundaries, making them highly sensitive to minor perturbations. This mismatch introduces instability in traditional cascade frameworks, where even imperceptible noise from restoration is amplified during detection, disrupting gradient flow and hindering optimization. To address this, we propose Lipschitz-regularized object detection (LROD), a simple yet effective framework that integrates image restoration directly into the detector's feature learning, harmonizing the Lipschitz continuity of both tasks during training. We implement this framework as Lipschitz-regularized YOLO (LR-YOLO), extending seamlessly to existing YOLO detectors. Extensive experiments on haze and low-light benchmarks demonstrate that LR-YOLO consistently improves detection stability, optimization smoothness, and overall accuracy.
- Abstract(参考訳): 悪条件(例えば、ヘイズ、低光)における検出堅牢性を改善するため、画像復元を前処理ステップとして一般的に適用し、検出器の画質を向上させる。
しかし、復元ネットワークと検出ネットワークの間の機能的ミスマッチは不安定を招き、効果的な統合を妨げる可能性がある。
我々はこの制限をリプシッツ連続性のレンズを通して再検討し、入力空間とパラメータ空間の両方における復元ネットワークと検出ネットワークの機能的差異を解析する。
我々の分析では、復元ネットワークはスムーズで連続的な変換を行う一方、オブジェクト検出器は不連続な決定境界で動作し、小さな摂動に非常に敏感である。
このミスマッチは、従来のカスケードフレームワークの不安定性を導入し、検出中に修復から受容できないノイズが増幅され、勾配の流れが破壊され、最適化が妨げられる。
そこで本研究では,リプシッツ規則化オブジェクト検出(LROD)を提案する。このフレームワークは画像復元を直接検出器の特徴学習に統合し,トレーニング中の両方のタスクのリプシッツ連続性を調和させる。
このフレームワークをLipschitz-regularized YOLO(LR-YOLO)として実装し、既存のYOLO検出器にシームレスに拡張する。
ヘイズおよび低照度ベンチマークに関する大規模な実験により、LR-YOLOは検出安定性、最適化のスムーズさ、全体的な精度を一貫して改善することが示された。
関連論文リスト
- LEGNet: A Lightweight Edge-Gaussian Network for Low-Quality Remote Sensing Image Object Detection [17.561091968145536]
本稿では,新しいエッジ・ガウス・アグリゲーション(EGA)モジュールを備えた軽量バックボーンネットワークであるLEGNetを紹介する。
EGAモジュールは、(a)低コントラストやぼやけたオブジェクトでしばしば失われる重要なエッジの詳細を鋭くするために、方向対応のScharrフィルタと、(b)ノイズを抑え、あいまいな特徴応答を規則化するガウス的特徴改善を統合している。
5つのベンチマークの総合的な評価は、LEGNetが最先端のパフォーマンス、特に低品質なオブジェクトの検出を達成していることを示している。
論文 参考訳(メタデータ) (2025-03-18T08:20:24Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - A Neural-Network-Based Convex Regularizer for Inverse Problems [14.571246114579468]
画像再構成問題を解決するためのディープラーニング手法は、再構築品質を大幅に向上させた。
これらの新しい手法は信頼性と説明性に欠けることが多く、これらの欠点に対処する関心が高まっている。
本研究では,凸リッジ関数の和である正則化器を再検討することにより,この問題に対処する。
このような正規化器の勾配は、活性化関数が増加し学習可能な単一の隠蔽層を持つニューラルネットワークによってパラメータ化される。
論文 参考訳(メタデータ) (2022-11-22T18:19:10Z) - Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。
本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2022-07-13T13:59:59Z) - Illumination-Invariant Active Camera Relocalization for Fine-Grained
Change Detection in the Wild [12.104718944788141]
本稿では,照度不変の能動カメラ再位置推定法について検討し,相対的なポーズ推定とスケール推定の両方を改善する。
画像ワープ誤差を最小限に抑え,各ACRの絶対スケールを求める線形システムを構築した。
我々の研究は、実世界の文化的遺産のきめ細かい変化監視タスクの実現可能性を大幅に拡大します。
論文 参考訳(メタデータ) (2022-04-13T18:00:55Z) - Perception Consistency Ultrasound Image Super-resolution via
Self-supervised CycleGAN [63.49373689654419]
自己スーパービジョンとサイクル生成対向ネットワーク(CycleGAN)に基づく新しい知覚整合超音波画像超解像法を提案する。
まず,検査用超音波LR画像のHR父子とLR子を画像強調により生成する。
次に、LR-SR-LRとHR-LR-SRのサイクル損失と判別器の対角特性をフル活用して、より知覚的に一貫性のあるSR結果を生成する。
論文 参考訳(メタデータ) (2020-12-28T08:24:04Z) - What Matters in Unsupervised Optical Flow [51.45112526506455]
教師なし光流における鍵成分の集合を比較し解析する。
教師なしフローモデルに対する新しい改良点を多数構築する。
本稿では,従来の最先端技術よりもはるかに優れた非教師なしフロー技術を提案する。
論文 参考訳(メタデータ) (2020-06-08T19:36:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。