論文の概要: Self-supervised Multi-task Learning Framework for Safety and
Health-Oriented Connected Driving Environment Perception using Onboard Camera
- arxiv url: http://arxiv.org/abs/2306.11822v1
- Date: Tue, 20 Jun 2023 18:31:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 16:17:59.343386
- Title: Self-supervised Multi-task Learning Framework for Safety and
Health-Oriented Connected Driving Environment Perception using Onboard Camera
- Title(参考訳): 車載カメラを用いた安全・健康志向型運転環境認識のためのマルチタスク自動学習フレームワーク
- Authors: Shaocheng Jia, Wei Yao
- Abstract要約: 画像合成と分解の双方向プロセス(BPISD)を提案する。
同時に深度マップ、大気の可視性、大気光、PM2.5濃度を推定する。
提案するシステムのトレーニングとテストのフェーズはどちらも,入力としてひとつのイメージのみを必要とする。
- 参考スコア(独自算出の注目度): 0.981441019058895
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Cutting-edge connected vehicle (CV) technologies have drawn much attention in
recent years. The real-time traffic data captured by a CV can be shared with
other CVs and data centers so as to open new possibilities for solving diverse
transportation problems. However, imagery captured by onboard cameras in a
connected environment, are not sufficiently investigated, especially for safety
and health-oriented visual perception. In this paper, a bidirectional process
of image synthesis and decomposition (BPISD) approach is proposed, and thus a
novel self-supervised multi-task learning framework, to simultaneously estimate
depth map, atmospheric visibility, airlight, and PM2.5 mass concentration, in
which depth map and visibility are considered highly associated with traffic
safety, while airlight and PM2.5 mass concentration are directly correlated
with human health. Both the training and testing phases of the proposed system
solely require a single image as input. Due to the innovative training
pipeline, the depth estimation network can manage various levels of visibility
conditions and overcome inherent problems in current image-synthesis-based
depth estimation, thereby generating high-quality depth maps even in
low-visibility situations and further benefiting accurate estimations of
visibility, airlight, and PM2.5 mass concentration. Extensive experiments on
the synthesized data from the KITTI and real-world data collected in Beijing
demonstrate that the proposed method can (1) achieve performance competitive in
depth estimation as compared with state-of-the-art methods when taking clear
images as input; (2) predict vivid depth map for images contaminated by various
levels of haze; and (3) accurately estimate visibility, airlight, and PM2.5
mass concentrations. Beneficial applications can be developed based on the
presented work to improve traffic safety, air quality, and public health.
- Abstract(参考訳): 近年,最先端のコネクテッドカー(CV)技術が注目されている。
cvが取得したリアルタイム交通データは、他のcvsやデータセンターと共有することができ、多様な交通問題を解決する新しい可能性を開くことができる。
しかし、接続された環境でカメラで撮影された画像は、特に安全性と健康志向の視覚知覚に関して十分に研究されていない。
本稿では,画像合成分解(bpisd)の双方向的手法を提案し,深度マップ,大気可視性,大気光,pm2.5質量濃度を同時に推定し,その深さマップと視認性が交通安全に強く関連し,空気灯とpm2.5質量集中は人間の健康と直接相関する,新しい自己教師ありマルチタスク学習フレームワークを提案する。
提案するシステムのトレーニングとテストのフェーズは、入力として単一のイメージのみを必要とする。
この革新的なトレーニングパイプラインにより、深度推定ネットワークは、様々なレベルの視界条件を管理し、現在の画像合成に基づく深度推定における固有の問題を克服し、低視認性状況においても高品質な深度マップを生成し、さらに視界、照度、PM2.5質量濃度の正確な推定を行うことができる。
北京で収集されたキティおよび実世界のデータを用いた広範囲な実験により,(1)鮮明な画像を入力として取る場合の精度の高い深度推定,(2)様々なレベルのハズで汚染された画像の鮮明な深度マップの予測,(3)可視性,風光量,およびpm2.5質量濃度を正確に推定できることが示されている。
交通安全, 空気質, 公衆衛生を改善するために, 提案した成果に基づき, 有効利用が可能である。
関連論文リスト
- Automatic UAV-based Airport Pavement Inspection Using Mixed Real and
Virtual Scenarios [3.0874677990361246]
本稿では,UAVが捉えた画像を用いて,舗装の苦悩を自動的に識別する視覚的アプローチを提案する。
提案手法は,画像の欠陥を分割する深層学習(DL)に基づいている。
合成および実訓練画像からなる混合データセットを使用することで、実アプリケーションシナリオでトレーニングモデルをテストする場合、より良い結果が得られることを示す。
論文 参考訳(メタデータ) (2024-01-11T16:30:07Z) - Federated Self-Supervised Learning of Monocular Depth Estimators for
Autonomous Vehicles [0.0]
FedSCDepthは、単眼深度推定器の学習を可能にするために、フェデレーション学習とディープセルフスーパービジョンを組み合わせた新しい手法である。
提案手法は, 試験損失が0.13未満で, 平均1.5kのトレーニングステップしか必要とせず, ほぼ最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-10-07T14:54:02Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - Deep Learning Approaches in Pavement Distress Identification: A Review [0.39373541926236766]
本稿では,舗装災害検出・分類のための画像処理技術と深層学習技術の最近の進歩を概観する。
これらのアルゴリズムがパターンを識別し、広範囲なデータセットに基づいて予測する能力は、舗装災害識別の領域に革命をもたらした。
高解像度画像をキャプチャすることで、UAVは深層学習アルゴリズムを用いて処理できる貴重なデータを提供し、様々な舗装の苦痛を効果的に検出し分類する。
論文 参考訳(メタデータ) (2023-08-01T20:30:11Z) - Active Gaze Control for Foveal Scene Exploration [124.11737060344052]
本研究では,葉型カメラを用いた人間とロボットが現場を探索する方法をエミュレートする手法を提案する。
提案手法は,同数の視線シフトに対してF1スコアを2~3ポイント増加させる。
論文 参考訳(メタデータ) (2022-08-24T14:59:28Z) - DMRVisNet: Deep Multi-head Regression Network for Pixel-wise Visibility
Estimation Under Foggy Weather [0.0]
霧は、一般的な気象の一種として、特に山岳地帯において、現実世界に頻繁に現れる。
現在の方法では、道路上の固定位置に配置されたプロの楽器を使用して視界測定を行う。
可視性を推定するために、革新的なエンドツーエンドの畳み込みニューラルネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-08T13:31:07Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Detect and Locate: A Face Anti-Manipulation Approach with Semantic and
Noise-level Supervision [67.73180660609844]
本稿では,画像中の偽造顔を効率的に検出する,概念的にシンプルだが効果的な方法を提案する。
提案手法は,画像に関する意味の高い意味情報を提供するセグメンテーションマップに依存する。
提案モデルでは,最先端検出精度と顕著なローカライゼーション性能を実現する。
論文 参考訳(メタデータ) (2021-07-13T02:59:31Z) - Progressive Depth Learning for Single Image Dehazing [56.71963910162241]
既存の脱湿法は、しばしば深度を無視し、より重いヘイズが視界を乱す遠くの地域で失敗する。
画像深度と伝送マップを反復的に推定するディープエンドツーエンドモデルを提案する。
私たちのアプローチは、画像深度と伝送マップの内部関係を明示的にモデリングすることから利益を得ます。
論文 参考訳(メタデータ) (2021-02-21T05:24:18Z) - HVAQ: A High-Resolution Vision-Based Air Quality Dataset [3.9523800511973017]
PM2.5, PM10, 温度, 湿度データからなる高時間・空間分解能空気質データセットを提案する。
我々は,センサの密度と画像によって予測精度が向上することを示すために,いくつかの視覚に基づくPM濃度予測アルゴリズムをデータセット上で評価した。
論文 参考訳(メタデータ) (2021-02-18T13:42:34Z) - DPANet: Depth Potentiality-Aware Gated Attention Network for RGB-D
Salient Object Detection [107.96418568008644]
そこで我々は,DPANetという新しいネットワークを提案し,深度マップの可能性を明確にモデル化し,モーダル間の相補性を効果的に統合する。
深度ポテンシャル知覚を導入することにより、ネットワークは深度情報のポテンシャルを学習ベースで知覚することができる。
論文 参考訳(メタデータ) (2020-03-19T07:27:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。