論文の概要: Data Leakage in Automotive Perception: Practitioners' Insights
- arxiv url: http://arxiv.org/abs/2604.06899v1
- Date: Wed, 08 Apr 2026 09:56:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.46777
- Title: Data Leakage in Automotive Perception: Practitioners' Insights
- Title(参考訳): 自動車の知覚におけるデータ漏洩:実践者の視点
- Authors: Md Abu Ahammed Babu, Sushant Kumar Pandey, Darko Durisic, Andras Balint, Miroslaw Staron,
- Abstract要約: データ漏洩は、自動車知覚のような安全クリティカルなシステムにおける機械学習モデルの信頼性にリスクをもたらす。
本研究では,データ漏洩に関する知識,経験,緩和戦略について,システム設計,開発,検証技術者との10回の半構造化インタビューを通じて検討する。
- 参考スコア(独自算出の注目度): 1.9036575220162446
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Data leakage is the inadvertent transfer of information between training and evaluation datasets that poses a subtle, yet critical, risk to the reliability of machine learning (ML) models in safety-critical systems such as automotive perception. While leakage is widely recognized in research, little is known about how industrial practitioners actually perceive and manage it in practice. This study investigates practitioners' knowledge, experiences, and mitigation strategies around data leakage through ten semi-structured interviews with system design, development, and verification engineers working on automotive perception functions development. Using reflexive thematic analysis, we identify that knowledge of data leakage is widespread and fragmented along role boundaries: ML engineers conceptualize it as a data-splitting or validation issue, whereas design and verification roles interpret it in terms of representativeness and scenario coverage. Detection commonly arises through generic considerations and observed performance anomalies rather than implying specific tools. However, data leakage prevention is more commonly practiced, which depends mostly on experience and knowledge sharing. These findings suggest that leakage control is a socio-technical coordination problem distributed across roles and workflows. We discuss implications for ML reliability engineering, highlighting the need for shared definitions, traceable data practices, and continuous cross-role communication to institutionalize data leakage awareness within automotive ML development.
- Abstract(参考訳): データ漏洩は、トレーニングと評価データセットの間の情報の不注意な伝達であり、自動車知覚のような安全クリティカルなシステムにおける機械学習(ML)モデルの信頼性に微妙に、しかし重要なリスクをもたらす。
漏洩は研究で広く認識されているが、実際にどのように産業従事者がそれを認識し管理しているかについては、ほとんど分かっていない。
本研究では,自動車の知覚機能開発に取り組んでいるシステム設計,開発,検証技術者10名を対象に,データ漏洩に関する実践者の知識,経験,緩和戦略について検討した。
MLエンジニアは、それをデータ分割や検証の問題として概念化し、一方、設計と検証の役割は、代表性とシナリオカバレッジの観点から解釈する。
検出は一般的に、特定のツールを暗示するのではなく、一般的な考慮と観察されたパフォーマンス異常によって行われる。
しかし、データ漏洩防止は一般的に行われており、主に経験と知識の共有に依存している。
これらの結果から, 漏出制御は役割やワークフローに分散した社会技術調整問題であることが示唆された。
自動車ML開発におけるデータ漏洩認識を制度化するための共有定義、トレーサブルなデータプラクティス、継続的なクロスロール通信の必要性を強調し、ML信頼性工学の意義について論じる。
関連論文リスト
- SDVDiag: Using Context-Aware Causality Mining for the Diagnosis of Connected Vehicle Functions [0.35232085374661287]
本稿では,人間のフィードバックとシステム固有の情報を因果解析プロセスに統合するマルチモーダルアプローチを提案する。
その結果, 因果縁検出の精度は14%から100%に向上した。
論文 参考訳(メタデータ) (2026-04-03T18:50:25Z) - Auditing Language Model Unlearning via Information Decomposition [68.48660428111593]
部分的情報分解(PID)を用いたアンラーニング監査のための解釈可能な情報理論フレームワークを提案する。
非学習前後のモデル表現を比較することにより、相互情報と忘れられたデータとを別個の構成要素に分解し、未学習および残留知識の概念を定式化する。
我々の研究は、言語モデルのより安全なデプロイのための理論的洞察と実行可能なツールを提供する、アンラーニングのための原則付き表現レベル監査を導入している。
論文 参考訳(メタデータ) (2026-01-21T15:51:19Z) - AssistedDS: Benchmarking How External Domain Knowledge Assists LLMs in Automated Data Science [31.08682306627942]
AssistedDSは、大規模言語モデルがドメイン知識をどのように扱うかを評価するために設計されたベンチマークである。
我々は、最先端のLLMを、有害なドメイン知識を識別し、有効に適用する能力に基づいて評価する。
我々の結果は、専門家の知識を批判的に評価し活用する現在のモデルの能力に、かなりのギャップがあることを示します。
論文 参考訳(メタデータ) (2025-05-25T05:50:21Z) - Mind the Interference: Retaining Pre-trained Knowledge in Parameter Efficient Continual Learning of Vision-Language Models [79.28821338925947]
ドメインクラスのインクリメンタル学習は現実的だが、継続的な学習シナリオである。
これらの多様なタスクに対処するために、事前訓練されたビジョンランゲージモデル(VLM)を導入し、その強力な一般化性を実現する。
事前訓練されたVLMにエンコードされた知識は、新しいタスクに適応する際に妨げられ、固有のゼロショット能力を損なう。
既存の手法では、膨大なオーバーヘッドを必要とする余分なデータセットに知識蒸留でVLMをチューニングすることで、この問題に対処している。
我々は、事前学習した知識を保持できるDIKI(Distributed-Aware Interference-free Knowledge Integration)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-07T12:19:37Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - Don't Push the Button! Exploring Data Leakage Risks in Machine Learning and Transfer Learning [0.0]
本稿では、意図しない情報がトレーニングデータを汚染し、モデルの性能評価に影響を与える機械学習(ML)における重要な問題に対処する。
新たなデータに対する評価と実際のパフォーマンスの相違は大きな懸念事項である。
データ漏洩と対処中の特定のタスクとの関係を調査し、Transfer Learningにおけるその発生を調査し、標準的なインダクティブMLとトランスダクティブMLフレームワークを比較します。
論文 参考訳(メタデータ) (2024-01-24T20:30:52Z) - Machine Learning for QoS Prediction in Vehicular Communication:
Challenges and Solution Approaches [46.52224306624461]
最大スループット予測の強化,例えばストリーミングや高精細マッピングアプリケーションについて検討する。
収集したデータの基盤となる特性をよりよく理解することで、マシンラーニング技術上に信頼性を構築することができるかを強調します。
我々は、説明可能なAIを使用して、機械学習が明示的にプログラムされることなく、無線ネットワークの基本原理を学習できることを示す。
論文 参考訳(メタデータ) (2023-02-23T12:29:20Z) - Towards Unbiased Visual Emotion Recognition via Causal Intervention [63.74095927462]
本稿では,データセットバイアスによる負の効果を軽減するために,新しい感情認識ネットワーク(IERN)を提案する。
IERNの有効性を検証する一連の設計されたテストと、3つの感情ベンチマークの実験は、IERNが他の最先端のアプローチよりも優れていることを示した。
論文 参考訳(メタデータ) (2021-07-26T10:40:59Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。