論文の概要: Generalizable Image Repair for Robust Visual Autonomous Racing
- arxiv url: http://arxiv.org/abs/2503.05911v1
- Date: Fri, 07 Mar 2025 20:16:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:46:22.795135
- Title: Generalizable Image Repair for Robust Visual Autonomous Racing
- Title(参考訳): ロバストな視覚自律レーシングのための一般化可能な画像修復
- Authors: Carson Sobolewski, Zhenjiang Mao, Kshitij Vejre, Ivan Ruchkin,
- Abstract要約: 視覚に基づく自律レースは、堅牢な制御のために正確な認識に依存している。
センサノイズ、悪天候、動的照明による画像の分布変化は知覚を低下させ、最適下制御の決定につながる。
制御器が使用する前に劣化した画像を復元するリアルタイム画像修復モジュールを提案する。
- 参考スコア(独自算出の注目度): 0.12499537119440243
- License:
- Abstract: Vision-based autonomous racing relies on accurate perception for robust control. However, image distribution changes caused by sensor noise, adverse weather, and dynamic lighting can degrade perception, leading to suboptimal control decisions. Existing approaches, including domain adaptation and adversarial training, improve robustness but struggle to generalize to unseen corruptions while introducing computational overhead. To address this challenge, we propose a real-time image repair module that restores corrupted images before they are used by the controller. Our method leverages generative adversarial models, specifically CycleGAN and pix2pix, for image repair. CycleGAN enables unpaired image-to-image translation to adapt to novel corruptions, while pix2pix exploits paired image data when available to improve the quality. To ensure alignment with control performance, we introduce a control-focused loss function that prioritizes perceptual consistency in repaired images. We evaluated our method in a simulated autonomous racing environment with various visual corruptions. The results show that our approach significantly improves performance compared to baselines, mitigating distribution shift and enhancing controller reliability.
- Abstract(参考訳): 視覚に基づく自律レースは、堅牢な制御のために正確な認識に依存している。
しかし、センサノイズ、悪天候、動的照明による画像分布の変化は知覚を低下させ、最適下制御の決定につながる。
ドメイン適応や敵の訓練を含む既存のアプローチは堅牢性を改善するが、計算オーバーヘッドを導入しながら、目に見えない汚職に一般化するのに苦労する。
この課題に対処するために、制御器が使用する前に、劣化した画像を復元するリアルタイム画像修復モジュールを提案する。
本手法は, 画像修復において, 生成逆数モデル, 特にCycleGAN と pix2pix を有効活用する。
CycleGANは、未ペア画像から画像への変換を新しい汚職に適応させるのに対して、ピクセル2ピクセルは、ペア画像データを利用して品質を向上させる。
制御性能の整合性を確保するため,修復画像の知覚的一貫性を優先する制御中心の損失関数を導入する。
様々な視覚的腐敗を伴うシミュレーションされた自律走行環境において,本手法の評価を行った。
その結果,本手法はベースラインに比べて性能を著しく向上し,分散シフトを緩和し,コントローラの信頼性を向上することがわかった。
関連論文リスト
- Perceptual-Distortion Balanced Image Super-Resolution is a Multi-Objective Optimization Problem [23.833099288826045]
画素ベースの回帰損失を用いた単一画像超解法(SISR)モデルのトレーニングは、高い歪みメトリクススコアを得ることができる。
しかし、高周波の詳細の回復が不十分なため、しばしばぼやけた画像が生じる。
本稿では,Multi-Objective Optimization(MOO)をSISRモデルのトレーニングプロセスに組み込んで,知覚品質と歪みのバランスをとる手法を提案する。
論文 参考訳(メタデータ) (2024-09-05T02:14:04Z) - Efficient Camera Exposure Control for Visual Odometry via Deep Reinforcement Learning [10.886819238167286]
本研究は、露光制御のためのエージェントの訓練に深層強化学習フレームワークを用いる。
トレーニングプロセスを容易にするために,軽量なイメージシミュレータを開発した。
VOシステムを強化するために異なるレベルの報酬関数が作成される。
論文 参考訳(メタデータ) (2024-08-30T04:37:52Z) - CODE: Confident Ordinary Differential Editing [62.83365660727034]
CODE(Confident Ordinary Differential Editing)は、OoD(Out-of-Distribution)ガイダンスイメージを効果的に処理する画像合成のための新しいアプローチである。
CODEは、確率フロー正規微分方程式(ODE)軌道に沿ったスコアベースの更新によって画像を強化する。
本手法は完全に盲目的に動作し,事前学習した生成モデルにのみ依存する。
論文 参考訳(メタデータ) (2024-08-22T14:12:20Z) - Diffusion Model Driven Test-Time Image Adaptation for Robust Skin Lesion Classification [24.08402880603475]
テストデータ上でのモデルの精度を高めるためのテスト時間画像適応手法を提案する。
拡散モデルを用いて、対象の試験画像をソース領域に投影して修正する。
私たちの手法は、さまざまな汚職、アーキテクチャ、データレシエーションにおいて、堅牢性をより堅牢にします。
論文 参考訳(メタデータ) (2024-05-18T13:28:51Z) - Unexplored Faces of Robustness and Out-of-Distribution: Covariate Shifts in Environment and Sensor Domains [2.4572304328659595]
本稿では,新しい分散シフトデータセットであるImageNet-ESを紹介する。
分布外検出(OOD)とモデルロバスト性の評価を行った。
以上の結果から,カメラセンサ制御による効果的なシフト緩和は,モデルサイズを増大させることなく性能を著しく向上させる可能性が示唆された。
論文 参考訳(メタデータ) (2024-04-24T13:59:19Z) - Towards Robust Image Stitching: An Adaptive Resistance Learning against
Compatible Attacks [66.98297584796391]
画像縫合は、様々な視点から捉えた画像をシームレスに単一の視野画像に統合する。
一対の撮像画像が与えられたとき、人間の視覚システムに気づかない微妙な摂動と歪みは、対応の一致を攻撃しがちである。
本稿では,敵対的攻撃に対する画像縫合の堅牢性向上に向けた最初の試みについて述べる。
論文 参考訳(メタデータ) (2024-02-25T02:36:33Z) - DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior [70.46245698746874]
DiffBIRは、視覚の異なる画像復元タスクを処理できる一般的な修復パイプラインである。
DiffBIRは, ブラインド画像復元問題を, 1) 劣化除去: 画像に依存しない内容の除去; 2) 情報再生: 失われた画像内容の生成の2段階に分離する。
第1段階では, 修復モジュールを用いて劣化を除去し, 高忠実度復元結果を得る。
第2段階では、潜伏拡散モデルの生成能力を活用して現実的な詳細を生成するIRControlNetを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:11:52Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z) - AdaViT: Adaptive Vision Transformers for Efficient Image Recognition [78.07924262215181]
AdaViTは、パッチ、セルフアテンションヘッド、およびトランスフォーマーブロックを使用するための利用ポリシーを導出する適応フレームワークである。
本手法は,0.8%の精度で,最先端のビジョントランスに比べて2倍以上の効率向上を実現している。
論文 参考訳(メタデータ) (2021-11-30T18:57:02Z) - Improving robustness against common corruptions with frequency biased
models [112.65717928060195]
目に見えない画像の腐敗は 驚くほど大きなパフォーマンス低下を引き起こします
画像の破損タイプは周波数スペクトルで異なる特性を持ち、ターゲットタイプのデータ拡張の恩恵を受けます。
畳み込み特徴マップの総変動(TV)を最小限に抑え、高周波堅牢性を高める新しい正規化方式を提案する。
論文 参考訳(メタデータ) (2021-03-30T10:44:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。