論文の概要: Algorithmic Data Minimization for Machine Learning over Internet-of-Things Data Streams
- arxiv url: http://arxiv.org/abs/2503.05675v1
- Date: Fri, 07 Mar 2025 18:35:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 12:20:21.063890
- Title: Algorithmic Data Minimization for Machine Learning over Internet-of-Things Data Streams
- Title(参考訳): Internet-of-Thingsデータストリームを用いた機械学習のためのアルゴリズムデータ最小化
- Authors: Ted Shaowang, Shinan Liu, Jonatas Marques, Nick Feamster, Sanjay Krishnan,
- Abstract要約: 機械学習は、IoTデバイスが生成する膨大なデータを分析してパターンを特定し、予測し、リアルタイムな意思決定を可能にする。
IoTシステムは、しばしば家庭やオフィスなどの機密性の高い環境にデプロイされ、不注意に識別可能な情報を公開することができる。
本稿では,センサストリームの文脈におけるデータ最小化の技術的解釈を提供し,実践的な実装方法を探究し,課題に対処する。
- 参考スコア(独自算出の注目度): 10.61303879393919
- License:
- Abstract: Machine learning can analyze vast amounts of data generated by IoT devices to identify patterns, make predictions, and enable real-time decision-making. By processing sensor data, machine learning models can optimize processes, improve efficiency, and enhance personalized user experiences in smart systems. However, IoT systems are often deployed in sensitive environments such as households and offices, where they may inadvertently expose identifiable information, including location, habits, and personal identifiers. This raises significant privacy concerns, necessitating the application of data minimization -- a foundational principle in emerging data regulations, which mandates that service providers only collect data that is directly relevant and necessary for a specified purpose. Despite its importance, data minimization lacks a precise technical definition in the context of sensor data, where collections of weak signals make it challenging to apply a binary "relevant and necessary" rule. This paper provides a technical interpretation of data minimization in the context of sensor streams, explores practical methods for implementation, and addresses the challenges involved. Through our approach, we demonstrate that our framework can reduce user identifiability by up to 16.7% while maintaining accuracy loss below 1%, offering a viable path toward privacy-preserving IoT data processing.
- Abstract(参考訳): 機械学習は、IoTデバイスが生成する膨大なデータを分析してパターンを特定し、予測し、リアルタイムな意思決定を可能にする。
センサデータを処理することによって、機械学習モデルはプロセスを最適化し、効率を改善し、スマートシステムにおけるパーソナライズされたユーザーエクスペリエンスを向上させることができる。
しかし、IoTシステムは、しばしば家やオフィスなどの機密性の高い環境にデプロイされる。
これは、データ最小化の応用 -- 新興データ規制の基本原則 -- を必要としており、サービスプロバイダは、特定の目的に直接関連し、必要なデータのみを収集することを義務付けている。
その重要性にもかかわらず、センサーデータのコンテキストにおいて、データの最小化は正確な技術的定義を欠いている。
本稿では,センサストリームの文脈におけるデータ最小化の技術的解釈を提供し,実践的な実装方法を探究し,課題に対処する。
このアプローチを通じて、当社のフレームワークは、1%未満の精度の損失を維持しながら、最大16.7%のユーザ識別性を低減し、プライバシ保護のIoTデータ処理に向けた実行可能なパスを提供する。
関連論文リスト
- Pareto Data Framework: Steps Towards Resource-Efficient Decision Making Using Minimum Viable Data (MVD) [0.0]
戦略的データ削減は、帯域幅、エネルギ、計算、ストレージコストを大幅に削減しつつ、高いパフォーマンスを維持することができることを示す。
このフレームワークは、最小生存データ(MVD)を特定し、パフォーマンスを犠牲にすることなく、リソース制約のある環境をまたいだ効率を最適化する。
論文 参考訳(メタデータ) (2024-09-18T16:31:19Z) - Silver Linings in the Shadows: Harnessing Membership Inference for Machine Unlearning [7.557226714828334]
ニューラルネットワークから特定のデータサンプルの影響を除去する新しい学習機構を提案する。
この目的を達成するために、我々は、ターゲットモデルの重みやアクティベーション値からプライバシーに敏感な情報を排除するための、新しい損失関数を構築した。
本研究の結果は,未学習の有効性とレイテンシ,および主課題の忠実度の観点から,我々のアプローチの優れた性能を示すものである。
論文 参考訳(メタデータ) (2024-07-01T00:20:26Z) - Speech Emotion Recognition under Resource Constraints with Data Distillation [64.36799373890916]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす。
モノのインターネットにおけるエッジデバイスの出現は、複雑なディープラーニングモデルを構築する上での課題を示している。
本研究では,IoTアプリケーションにおけるSERモデルの効率的な開発を容易にするためのデータ蒸留フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-21T13:10:46Z) - The Data Minimization Principle in Machine Learning [61.17813282782266]
データ最小化は、収集、処理、保持されるデータの量を減らすことを目的としている。
様々な国際データ保護規制によって支持されている。
しかし、厳密な定式化が欠如しているため、その実践的な実装は依然として課題である。
論文 参考訳(メタデータ) (2024-05-29T19:40:27Z) - Filling the Missing: Exploring Generative AI for Enhanced Federated
Learning over Heterogeneous Mobile Edge Devices [72.61177465035031]
ローカルデータのFIMI(FIlling the MIssing)部分を活用することにより,これらの課題に対処する,AIを活用した創発的なフェデレーション学習を提案する。
実験の結果,FIMIはデバイス側エネルギーの最大50%を節約し,目標とするグローバルテスト精度を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-21T12:07:04Z) - Deep Reinforcement Learning Assisted Federated Learning Algorithm for
Data Management of IIoT [82.33080550378068]
産業用IoT(Industrial Internet of Things)の継続的な拡大により、IIoT機器は毎回大量のユーザデータを生成する。
IIoTの分野で、これらの時系列データを効率的かつ安全な方法で管理する方法は、依然として未解決の問題である。
本稿では,無線ネットワーク環境におけるIIoT機器データ管理におけるFL技術の適用について検討する。
論文 参考訳(メタデータ) (2022-02-03T07:12:36Z) - Learning to Limit Data Collection via Scaling Laws: Data Minimization
Compliance in Practice [62.44110411199835]
我々は機械学習法における文献に基づいて、データとシステム性能を結びつけるデータ解釈に基づく収集を制限するフレームワークを提案する。
我々は、性能曲線微分に基づくデータ最小化基準を定式化し、有効かつ解釈可能な分数法法技術を提供する。
論文 参考訳(メタデータ) (2021-07-16T19:59:01Z) - Data Minimization for GDPR Compliance in Machine Learning Models [0.0]
EUの一般データ保護規則は、収集される特定の目的を満たすために必要なデータのみを要求する。
予測を行うのに必要な個人データの量を削減するための第一種手法を提案する。
本手法では,モデルの精度にはほとんど影響を与えない一般化を実現するために,モデル内に符号化された知識を利用する。
論文 参考訳(メタデータ) (2020-08-06T08:21:15Z) - Privacy Enhancing Machine Learning via Removal of Unwanted Dependencies [21.97951347784442]
本稿では,特定のアプリケーションに送信される前に,データ中のセンシティブな情報を除去する,教師付き・敵対型学習手法の新たな変種について検討する。
提案手法は,エンド・ツー・エンド方式で特徴マッピングと予測モデルを同時に保存するプライバシー保護を最適化する。
モバイルセンシングと顔データを用いた実験結果から,予測モデルの実用性能の維持に成功し,予測性能の低下を招いた。
論文 参考訳(メタデータ) (2020-07-30T19:55:10Z) - On the Use of Interpretable Machine Learning for the Management of Data
Quality [13.075880857448059]
我々は、解釈可能な機械学習を用いて、あらゆるデータ処理アクティビティをベースとした重要な機能を提供する。
私たちの目標は、少なくとも、収集されたデータセットで重要なものとして検出される機能に対して、データ品質を確保することです。
論文 参考訳(メタデータ) (2020-07-29T08:49:32Z) - Operationalizing the Legal Principle of Data Minimization for
Personalization [64.0027026050706]
データ最小化原理の同質な解釈が欠如していることを認識し、パーソナライゼーションの文脈に適用可能な2つの運用定義を探索する。
データ最小化によるパフォーマンス低下はそれほど大きくないかもしれないが、異なるユーザに影響を与える可能性がある。
論文 参考訳(メタデータ) (2020-05-28T00:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。