論文の概要: Autoencoder Based Inter-Vehicle Generalization for In-Cabin Occupant
Classification
- arxiv url: http://arxiv.org/abs/2105.03164v1
- Date: Fri, 7 May 2021 11:15:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-10 12:16:16.867746
- Title: Autoencoder Based Inter-Vehicle Generalization for In-Cabin Occupant
Classification
- Title(参考訳): オートエンコーダを用いた車内作業分類のための車間一般化
- Authors: Steve Dias Da Cruz and Bertram Taetz and Oliver Wasenm\"uller and
Thomas Stifter and Didier Stricker
- Abstract要約: 機械学習モデルの転送性を改善するためのオートエンコーダに基づく手法を提案する。
autoencoderは、スクラッチからトレーニングされた場合、一般的に使用される分類モデルと同等であり、大量のデータで事前トレーニングされたモデルを上回る場合もあります。
- 参考スコア(独自算出の注目度): 14.358218289101007
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Common domain shift problem formulations consider the integration of multiple
source domains, or the target domain during training. Regarding the
generalization of machine learning models between different car interiors, we
formulate the criterion of training in a single vehicle: without access to the
target distribution of the vehicle the model would be deployed to, neither with
access to multiple vehicles during training. We performed an investigation on
the SVIRO dataset for occupant classification on the rear bench and propose an
autoencoder based approach to improve the transferability. The autoencoder is
on par with commonly used classification models when trained from scratch and
sometimes out-performs models pre-trained on a large amount of data. Moreover,
the autoencoder can transform images from unknown vehicles into the vehicle it
was trained on. These results are corroborated by an evaluation on real
infrared images from two vehicle interiors.
- Abstract(参考訳): 一般的なドメインシフト問題定式化では、トレーニング中に複数のソースドメイン、あるいはターゲットドメインの統合を検討する。
異なる車室内間での機械学習モデルの一般化に関して、我々は、1台の車両におけるトレーニングの基準を定式化し、モデルが配置される車両の目標分布にアクセスせずに、訓練中に複数の車両にアクセスできないようにした。
後部ベンチにおける乗員分類のためのSVIROデータセットの調査を行い,転送性向上のためのオートエンコーダに基づくアプローチを提案する。
autoencoderは、スクラッチからトレーニングされた場合、一般的に使用される分類モデルと同等であり、大量のデータで事前トレーニングされたモデルを上回る場合もあります。
さらに、オートエンコーダは未知の車両から訓練した車両に画像を変換することができる。
これらの結果は、2つの車内からの実際の赤外線画像の評価によって裏付けられる。
関連論文リスト
- Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文 参考訳(メタデータ) (2024-09-25T06:48:25Z) - Structural Information Guided Multimodal Pre-training for
Vehicle-centric Perception [36.92036421490819]
そこで我々は,VagerMAEと呼ばれる新しい車両中心の事前学習フレームワークを提案する。
車両のスケッチラインを空間構造の形式として明示的に抽出し,車両の再建を誘導する。
大規模なデータセットは、約100万の車両画像と12693のテキスト情報を含むAutobot1Mと呼ばれるモデルを事前訓練するために構築されている。
論文 参考訳(メタデータ) (2023-12-15T14:10:21Z) - Self-Supervised Steering Angle Prediction for Vehicle Control Using
Visual Odometry [55.11913183006984]
視覚オドメトリー法を用いて推定したカメラポーズを用いて,車両の軌道制御をモデルに訓練する方法を示す。
車両の前方にカメラを設置することにより,複数の異なる走行経路からの軌跡情報を活用するスケーラブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-20T16:29:01Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z) - Shared Cross-Modal Trajectory Prediction for Autonomous Driving [24.07872495811019]
本稿では,複数入力モダリティの利用のメリットを活かしたクロスモーダルな埋め込みフレームワークを提案する。
2つのベンチマーク駆動データセットを用いて,提案手法の有効性を示すため,広範囲な評価を行った。
論文 参考訳(メタデータ) (2020-11-15T07:18:50Z) - Data Augmentation and Clustering for Vehicle Make/Model Classification [0.0]
我々は、異なる年にリリースされ、異なる視点で捕獲された車両のトレーニングデータセットを利用する方法を提案する。
また, クラスタリングによる製造・モデル分類の強化効果を示す。
ResNetアーキテクチャに基づくより深い畳み込みニューラルネットワークは、車両製造/モデル分類のトレーニングのために設計されている。
論文 参考訳(メタデータ) (2020-09-14T18:24:31Z) - Explicit Domain Adaptation with Loosely Coupled Samples [85.9511585604837]
本稿では,ドメイン間の明示的なマッピングを学習するトランスファーラーニングフレームワークを提案する。
その解釈可能性のために、これは自律運転のような安全クリティカルなアプリケーションにとって有益である。
論文 参考訳(メタデータ) (2020-04-24T21:23:45Z) - VehicleNet: Learning Robust Visual Representation for Vehicle
Re-identification [116.1587709521173]
我々は,4つのパブリックな車両データセットを活用することで,大規模車両データセット(VabyNet)を構築することを提案する。
VehicleNetからより堅牢な視覚表現を学習するための、シンプルで効果的な2段階プログレッシブアプローチを設計する。
AICity Challengeのプライベートテストセットにおいて,最先端の精度86.07%mAPを実現した。
論文 参考訳(メタデータ) (2020-04-14T05:06:38Z) - Understanding Self-Training for Gradual Domain Adaptation [107.37869221297687]
段階的なドメイン適応は、対象領域へ徐々にシフトするラベルのないデータのみを与えられたソースドメインで訓練された初期分類器を適応させることが目的である。
目標領域への直接適応が非有界誤差をもたらすような設定下において、段階的なシフトを伴う自己学習の誤差に対する最初の非無空上界を証明した。
この理論解析はアルゴリズムの洞察を導き、無限のデータを持つ場合でも正規化とラベルのシャープ化が不可欠であることを強調し、より小さなワッサーシュタイン無限距離のシフトに対して自己学習が特にうまく働くことを示唆している。
論文 参考訳(メタデータ) (2020-02-26T08:59:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。