論文の概要: Latent Uncertainty Representations for Video-based Driver Action and Intention Recognition
- arxiv url: http://arxiv.org/abs/2510.05006v1
- Date: Mon, 06 Oct 2025 16:50:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.992239
- Title: Latent Uncertainty Representations for Video-based Driver Action and Intention Recognition
- Title(参考訳): 映像に基づくドライバ動作と意図認識のための潜在不確かさ表現
- Authors: Koen Vellenga, H. Joe Steinhauer, Jonas Andersson, Anders Sjögren,
- Abstract要約: 本稿では,最終層確率的深層学習(LL-PDL)手法の代替として,アウト・オブ・ディストリビューション(OOD)インスタンスを検出する方法を提案する。
我々は,潜伏不確実性表現(LUR)とリパルストレーニングされたLUR(RLUR)アプローチを,ビデオベースドライバアクションと意図認識データセットの8つのPDL手法に対して評価した。
以上の結果から,LURとRLURは,他のLL-PDL手法と同等の分布内分類性能を達成できた。
- 参考スコア(独自算出の注目度): 1.6132735908824205
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep neural networks (DNNs) are increasingly applied to safety-critical tasks in resource-constrained environments, such as video-based driver action and intention recognition. While last layer probabilistic deep learning (LL-PDL) methods can detect out-of-distribution (OOD) instances, their performance varies. As an alternative to last layer approaches, we propose extending pre-trained DNNs with transformation layers to produce multiple latent representations to estimate the uncertainty. We evaluate our latent uncertainty representation (LUR) and repulsively trained LUR (RLUR) approaches against eight PDL methods across four video-based driver action and intention recognition datasets, comparing classification performance, calibration, and uncertainty-based OOD detection. We also contribute 28,000 frame-level action labels and 1,194 video-level intention labels for the NuScenes dataset. Our results show that LUR and RLUR achieve comparable in-distribution classification performance to other LL-PDL approaches. For uncertainty-based OOD detection, LUR matches top-performing PDL methods while being more efficient to train and easier to tune than approaches that require Markov-Chain Monte Carlo sampling or repulsive training procedures.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)は、ビデオベースのドライバアクションや意図認識といったリソース制約のある環境において、安全クリティカルなタスクにますます適用されている。
最終層確率的深層学習(LL-PDL)法は、アウト・オブ・ディストリビューション(OOD)インスタンスを検出できるが、その性能は様々である。
最終層アプローチの代替として,複数の潜在表現を生成するために,事前学習したDNNを変換層で拡張し,不確実性を推定する。
我々は、映像に基づく運転行動と意図認識データセットの8つのPDL手法に対して、潜在不確実性表現(LUR)と反発訓練されたLUR(RLUR)アプローチを評価し、分類性能、校正、不確実性に基づくOOD検出を比較した。
また,NuScenesデータセットに対して,28,000のフレームレベルアクションラベルと1,194の動画レベル意図ラベルをコントリビュートする。
以上の結果から,LURとRLURは,他のLL-PDL手法と同等の分布内分類性能を達成できた。
不確実性に基づくOOD検出では、LURはMarkov-Chain Monte Carloサンプリングや反発的トレーニング手順を必要とするアプローチよりも、トレーニングが効率的でチューニングが容易で、トップパフォーマンスのPDL手法にマッチする。
関連論文リスト
- Polysemantic Dropout: Conformal OOD Detection for Specialized LLMs [35.326974180503065]
特殊大言語モデル(LLM)のための新しい推定時間外ドメイン検出アルゴリズムを提案する。
LLMの多意味性と冗長性に関する最近の知見により、ドメイン内入力はOOD入力よりも高いドロップアウト耐性を示すと仮定した。
有効なアンサンブルアプローチにより,複数の層にまたがるドロップアウト耐性を集約し,ICADの理論的誤報境界を維持しつつ検出を改善した。
論文 参考訳(メタデータ) (2025-09-04T20:50:51Z) - Efficient Test-time Adaptive Object Detection via Sensitivity-Guided Pruning [73.40364018029673]
連続的なテスト時間適応オブジェクト検出(CTTA-OD)は、源となる事前訓練された検出器を常に変化する環境にオンライン適応させることを目的としている。
私たちのモチベーションは、学習したすべての特徴が有益であるとは限らないという観察に起因しています。
FLOPの計算オーバヘッドを12%削減し,優れた適応性を実現する。
論文 参考訳(メタデータ) (2025-06-03T05:27:56Z) - R-Sparse: Rank-Aware Activation Sparsity for Efficient LLM Inference [77.47238561728459]
R-スパース(R-Sparse)は、高度なLCMにおいて高い疎度を達成できる訓練不要なアクティベーション・スパシティ・アプローチである。
10種類のタスクにわたるLlama-2/3およびMistralモデルの実験は、R-Sparseが50%のモデルレベルの間隔で同等のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-04-28T03:30:32Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Uncertainty-based Meta-Reinforcement Learning for Robust Radar Tracking [3.012203489670942]
本稿では,不確実性に基づくメタ強化学習(Meta-RL)手法を提案する。
その複雑さに関する情報を用いて、提案アルゴリズムはトラッキングの信頼性を指摘することができる。
そこで本研究では,メタRL手法がピーク時の追跡シナリオを16%,ベースラインを35%上回ることを示す。
論文 参考訳(メタデータ) (2022-10-26T07:48:56Z) - Data Augmentation through Expert-guided Symmetry Detection to Improve
Performance in Offline Reinforcement Learning [0.0]
マルコフ決定過程(MDP)の動的モデルのオフライン推定は非自明な作業である。
近年の研究では、密度推定法に依存する専門家誘導パイプラインが、決定論的環境において、この構造を効果的に検出できることが示されている。
学習したMDPを解き、実際の環境に最適化されたポリシーを適用すると、前者の結果が性能改善につながることを示す。
論文 参考訳(メタデータ) (2021-12-18T14:32:32Z) - Learning to Perform Downlink Channel Estimation in Massive MIMO Systems [72.76968022465469]
大規模マルチインプット・マルチアウトプット(MIMO)システムにおけるダウンリンク(DL)チャネル推定について検討する。
一般的なアプローチは、チャネル硬化によって動機付けられた推定値として平均値を使用することである。
本稿では2つの新しい推定法を提案する。
論文 参考訳(メタデータ) (2021-09-06T13:42:32Z) - On the Practicality of Deterministic Epistemic Uncertainty [106.06571981780591]
決定論的不確実性法(DUM)は,分布外データの検出において高い性能を達成する。
DUMが十分に校正されており、現実のアプリケーションにシームレスにスケールできるかどうかは不明だ。
論文 参考訳(メタデータ) (2021-07-01T17:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。