論文の概要: Physically-admissible polarimetric data augmentation for road-scene
analysis
- arxiv url: http://arxiv.org/abs/2206.07431v1
- Date: Wed, 15 Jun 2022 10:04:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-17 01:14:14.689801
- Title: Physically-admissible polarimetric data augmentation for road-scene
analysis
- Title(参考訳): 道路シーン解析のための物理的に許容できる偏光データ拡張
- Authors: Cyprien Ruffino, Rachel Blin, Samia Ainouz, Gilles Gasso, Romain
H\'erault, Fabrice Meriaudeau, St\'ephane Canu
- Abstract要約: 本研究では,大規模ラベル付き道路シーンデータセットを偏光領域に転送するCycleGANを提案する。
結果として制約されたCycleGANは公開され、誰でも独自の偏光画像を生成することができる。
- 参考スコア(独自算出の注目度): 4.972086627584208
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Polarimetric imaging, along with deep learning, has shown improved
performances on different tasks including scene analysis. However, its
robustness may be questioned because of the small size of the training
datasets. Though the issue could be solved by data augmentation, polarization
modalities are subject to physical feasibility constraints unaddressed by
classical data augmentation techniques. To address this issue, we propose to
use CycleGAN, an image translation technique based on deep generative models
that solely relies on unpaired data, to transfer large labeled road scene
datasets to the polarimetric domain. We design several auxiliary loss terms
that, alongside the CycleGAN losses, deal with the physical constraints of
polarimetric images. The efficiency of this solution is demonstrated on road
scene object detection tasks where generated realistic polarimetric images
allow to improve performances on cars and pedestrian detection up to 9%. The
resulting constrained CycleGAN is publicly released, allowing anyone to
generate their own polarimetric images.
- Abstract(参考訳): ポラリメトリックイメージングは、深層学習とともに、シーン分析を含む様々なタスクのパフォーマンスを改善している。
しかし、トレーニングデータセットが小さいため、その堅牢性には疑問があるかもしれない。
データ拡張によってこの問題は解決できるが、偏光モードは古典的なデータ拡張技術では解決できない物理的実現可能性制約の対象となる。
そこで本研究では,未ペアデータのみに依存する深層生成モデルに基づく画像翻訳技術であるCycleGANを用いて,大規模ラベル付き道路シーンデータセットを偏光領域に転送する手法を提案する。
我々は,周期的損失に加えて,ポラリメトリック画像の物理的制約を扱う補助的損失項をいくつか設計する。
このソリューションの効率性は、実際のポラリメトリック画像を生成する道路シーンオブジェクト検出タスクで実証され、車の性能向上と歩行者検出が最大9%向上する。
結果として制約されたCycleGANは公開され、誰でも独自の偏光画像を生成することができる。
関連論文リスト
- Robust Depth Enhancement via Polarization Prompt Fusion Tuning [112.88371907047396]
様々な深度センサによる不正確な深度測定を改善するために偏光イメージングを利用するフレームワークを提案する。
まず、偏光データとセンサ深度マップから高密度で完全な深度マップを推定するために、ニューラルネットワークを訓練した学習ベースの戦略を採用する。
大規模データセット上で事前学習したRGBモデルを有効に活用するためのPPFT(Polarization Prompt Fusion Tuning)戦略を提案する。
論文 参考訳(メタデータ) (2024-04-05T17:55:33Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - NeISF: Neural Incident Stokes Field for Geometry and Material Estimation [50.588983686271284]
多視点逆レンダリングは、異なる視点で撮影された一連の画像から形状、材料、照明などのシーンパラメータを推定する問題である。
本稿では,偏光手がかりを用いた曖昧さを低減する多視点逆フレームワークNeISFを提案する。
論文 参考訳(メタデータ) (2023-11-22T06:28:30Z) - Polarimetric Information for Multi-Modal 6D Pose Estimation of
Photometrically Challenging Objects with Limited Data [51.95347650131366]
6Dポーズ推定パイプラインは、RGBのみまたはRGB-Dデータに依存する。
このような制限を克服するために,補完分極情報を利用した教師付き学習ベース手法を提案する。
論文 参考訳(メタデータ) (2023-08-21T10:56:00Z) - MS-PS: A Multi-Scale Network for Photometric Stereo With a New
Comprehensive Training Dataset [0.0]
光度ステレオ(PS)問題は、物体の3次元表面を再構成することである。
そこで我々は,PSのマルチスケールアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-11-25T14:01:54Z) - Polarized Color Image Denoising using Pocoformer [42.171036556122644]
偏光カラー写真は、視覚的なテクスチャと1枚のスナップショットで対象のサージカル情報の両方を提供する。
指向性偏光フィルタアレイを用いることで、従来のカラー画像に比べて光子数とSNRが極めて低い。
クリーンな信号と正確な分極情報を同時に復元する学習に基づく手法を提案する。
論文 参考訳(メタデータ) (2022-07-01T05:52:14Z) - Unsupervised Restoration of Weather-affected Images using Deep Gaussian
Process-based CycleGAN [92.15895515035795]
本稿では,CycleGANに基づくディープネットワークの監視手法について述べる。
我々は,より効果的なトレーニングにつながるCycleGANのトレーニングに新たな損失を導入し,高品質な再構築を実現した。
提案手法は, 脱落, 脱落, 脱落といった様々な修復作業に効果的に適用できることを実証する。
論文 参考訳(メタデータ) (2022-04-23T01:30:47Z) - Efficient and Differentiable Shadow Computation for Inverse Problems [64.70468076488419]
微分可能幾何計算は画像に基づく逆問題に対する関心が高まっている。
微分可能な可視性とソフトシャドウ計算のための効率的かつ効率的なアプローチを提案する。
定式化は微分可能であるため, テクスチャ, 照明, 剛体ポーズ, 画像からの変形回復などの逆問題を解くために使用できる。
論文 参考訳(メタデータ) (2021-04-01T09:29:05Z) - Polarimetric image augmentation [0.7559720049837457]
反射鏡は都市環境における 自律的なナビゲーションを阻害します
本稿では,偏光データに適用した正規化拡張手法により,ディープラーニングモデルを強化することを提案する。
実世界データにおける非強化トレーニングと正規化トレーニングの間には,平均18.1%のIoU改善が観察されている。
論文 参考訳(メタデータ) (2020-05-22T08:00:12Z) - Deep Lighting Environment Map Estimation from Spherical Panoramas [0.0]
本稿では,単一のLDR単分子球状パノラマからHDR照明環境マップを推定するデータ駆動モデルを提案する。
データジェネレータと監視機構として画像ベースのリライティングを活用するために,表面形状の可用性を活用する。
論文 参考訳(メタデータ) (2020-05-16T14:23:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。