論文の概要: The AI Mechanic: Acoustic Vehicle Characterization Neural Networks
- arxiv url: http://arxiv.org/abs/2205.09667v1
- Date: Thu, 19 May 2022 16:29:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-20 14:16:20.318209
- Title: The AI Mechanic: Acoustic Vehicle Characterization Neural Networks
- Title(参考訳): aiメカニック:音響車両によるニューラルネットワークのキャラクタリゼーション
- Authors: Adam M. Terwilliger, Joshua E. Siegel
- Abstract要約: 我々は,モバイルデバイスから取得した音声を用いて,音響車両の特徴的深層学習システムであるAIメカニックを紹介する。
我々は、故障検出を強化するために車両特性を予測し、カスケードする畳み込みニューラルネットワークを構築している。
我々のカスケーディングアーキテクチャは、さらに93.6%の検証と86.8%のテストセットの正確さを達成し、16.4%/7.8%と4.2%/1.5%のマージンを示した。
- 参考スコア(独自算出の注目度): 1.8275108630751837
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In a world increasingly dependent on road-based transportation, it is
essential to understand vehicles. We introduce the AI mechanic, an acoustic
vehicle characterization deep learning system, as an integrated approach using
sound captured from mobile devices to enhance transparency and understanding of
vehicles and their condition for non-expert users. We develop and implement
novel cascading architectures for vehicle understanding, which we define as
sequential, conditional, multi-level networks that process raw audio to extract
highly-granular insights. To showcase the viability of cascading architectures,
we build a multi-task convolutional neural network that predicts and cascades
vehicle attributes to enhance fault detection. We train and test these models
on a synthesized dataset reflecting more than 40 hours of augmented audio and
achieve >92% validation set accuracy on attributes (fuel type, engine
configuration, cylinder count and aspiration type). Our cascading architecture
additionally achieved 93.6% validation and 86.8% test set accuracy on misfire
fault prediction, demonstrating margins of 16.4% / 7.8% and 4.2% / 1.5%
improvement over na\"ive and parallel baselines. We explore experimental
studies focused on acoustic features, data augmentation, feature fusion, and
data reliability. Finally, we conclude with a discussion of broader
implications, future directions, and application areas for this work.
- Abstract(参考訳): 道路交通にますます依存する世界では、車両を理解することが不可欠である。
我々は,自動車の透明性と理解を高めるため,モバイルデバイスから取得した音声と,非専門家ユーザに対するその状況の統合アプローチとして,音響車両の特徴的深層学習システムであるAIメカニックを紹介した。
車両理解のための新しいカスケードアーキテクチャを開発し,実装し,高粒度のインサイトを抽出するために生音声を処理するシーケンシャルで条件付きマルチレベルネットワークと定義する。
カスケードアーキテクチャの実現可能性を示すために,車両特性を予測・カスケードするマルチタスク畳み込みニューラルネットワークを構築し,故障検出を強化する。
これらのモデルを40時間以上の拡張オーディオを反映した合成データセットでトレーニングおよびテストし,属性(燃料タイプ,エンジン構成,シリンダー数,吸引型)の検証精度を92%以上達成した。
我々のカスケーディングアーキテクチャは、さらに93.6%の検証と86.8%のテストセットの正確さを達成し、16.4%/7.8%と4.2%/1.5%のマージンを示した。
本研究では,音響的特徴,データ拡張,特徴融合,データの信頼性に着目した実験研究を行う。
最後に、この作業の幅広い意味、将来の方向性、アプリケーション領域について議論を締めくくります。
関連論文リスト
- FollowGen: A Scaled Noise Conditional Diffusion Model for Car-Following Trajectory Prediction [9.2729178775419]
本研究では,自動車追従軌道予測のためのスケールドノイズ条件拡散モデルを提案する。
車両間の詳細な相互作用と自動車追従ダイナミクスを生成フレームワークに統合し、予測された軌跡の精度と妥当性を向上させる。
種々の実世界の運転シナリオに関する実験結果は,提案手法の最先端性能と堅牢性を示すものである。
論文 参考訳(メタデータ) (2024-11-23T23:13:45Z) - Transforming In-Vehicle Network Intrusion Detection: VAE-based Knowledge Distillation Meets Explainable AI [0.0]
本稿では,変分オートエンコーダ(VAE)に基づく知識蒸留手法を用いて,KD-XVAEと呼ばれる高度な侵入検知システムを提案する。
本モデルでは,1669個のパラメータで処理し,バッチ毎に0.3msの推論時間を実現することにより,複雑性を大幅に低減する。
論文 参考訳(メタデータ) (2024-10-11T17:57:16Z) - Advancements in Road Lane Mapping: Comparative Fine-Tuning Analysis of Deep Learning-based Semantic Segmentation Methods Using Aerial Imagery [16.522544814241495]
本研究は、自動運転車(AV)のHDマップの必要性に対処するものである。
地球観測データは地図作成に有用な資源を提供するが、道路線抽出のための特別なモデルはまだリモートセンシングでは未開発である。
本研究では,高精細リモートセンシング画像から道路路面マーキング抽出のための基礎的深層学習に基づくセマンティックセマンティックセマンティクスモデルを比較した。
論文 参考訳(メタデータ) (2024-10-08T06:24:15Z) - Optimizing LaneSegNet for Real-Time Lane Topology Prediction in Autonomous Vehicles [0.41942958779358663]
LaneSegNetは、トポロジ情報とレーンラインデータを統合する、レーントポロジ予測の新しいアプローチである。
本研究では,特徴抽出器とトランスフォーマーエンコーダ-デコーダスタック修正によるLaneSegNetアーキテクチャの最適化について検討する。
我々の実装は1つのNVIDIA Tesla A100 GPUでトレーニングされ、2:4比でトレーニング時間を22.3%削減し、平均精度は7.1%低下した。
4:8比はトレーニング時間をわずか11.1%増加させたが、平均精度は23.7%向上した。
論文 参考訳(メタデータ) (2024-06-22T21:49:12Z) - Exploring Contextual Representation and Multi-Modality for End-to-End
Autonomous Driving [58.879758550901364]
最近の知覚システムは、センサー融合による空間理解を高めるが、しばしば完全な環境コンテキストを欠いている。
我々は,3台のカメラを統合し,人間の視野をエミュレートするフレームワークを導入し,トップダウンのバードアイビューセマンティックデータと組み合わせて文脈表現を強化する。
提案手法は, オープンループ設定において0.67mの変位誤差を達成し, nuScenesデータセットでは6.9%の精度で現在の手法を上回っている。
論文 参考訳(メタデータ) (2022-10-13T05:56:20Z) - Fully Automated End-to-End Fake Audio Detection [57.78459588263812]
本稿では,完全自動エンドツーエンド音声検出手法を提案する。
まず、wav2vec事前学習モデルを用いて、音声の高レベル表現を得る。
ネットワーク構造には, Light-DARTS という異種アーキテクチャサーチ (DARTS) の修正版を用いる。
論文 参考訳(メタデータ) (2022-08-20T06:46:55Z) - Attention-based Neural Network for Driving Environment Complexity
Perception [123.93460670568554]
本稿では,周囲の運転環境の複雑さを予測するための,注目に基づく新しいニューラルネットワークモデルを提案する。
Yolo-v3オブジェクト検出アルゴリズム、ヒートマップ生成アルゴリズム、CNNベースの特徴抽出器、注目ベースの特徴抽出器で構成される。
提案するアテンションベースネットワークは,周囲環境の複雑さを分類する平均分類精度91.22%を達成している。
論文 参考訳(メタデータ) (2021-06-21T17:27:11Z) - Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data
Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。
私達のアプローチは人間の相互作用なしで完全に自動です。
VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T03:03:38Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z) - Scene-Graph Augmented Data-Driven Risk Assessment of Autonomous Vehicle
Decisions [1.4086978333609153]
本研究では,シーングラフを中間表現として利用する新しいデータ駆動手法を提案する。
我々のアプローチには、マルチリレーショングラフ畳み込みネットワーク、ロングショート長期記憶ネットワーク、そして運転操作の主観的リスクをモデル化するための注意層が含まれる。
提案手法は,大型(96.4%対91.2%)および小型(91.8%対71.2%)の最先端アプローチよりも高い分類精度が得られることを示す。
また、実世界のデータセットでテストすると、合成データセットでトレーニングされたモデルの平均精度が87.8%に達することを示す。
論文 参考訳(メタデータ) (2020-08-31T07:41:27Z) - Towards Automated Neural Interaction Discovery for Click-Through Rate
Prediction [64.03526633651218]
CTR(Click-Through Rate)予測は、レコメンダシステムにおいて最も重要な機械学習タスクの1つである。
本稿では,AutoCTR と呼ばれる CTR 予測のための自動インタラクションアーキテクチャ探索フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-29T04:33:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。