Fugu-MT 論文翻訳(概要): Adaptive PII Mitigation Framework for Large Language Models

論文の概要: Adaptive PII Mitigation Framework for Large Language Models

arxiv url: http://arxiv.org/abs/2501.12465v1
Date: Tue, 21 Jan 2025 19:22:45 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-23 18:44:13.861206
Title: Adaptive PII Mitigation Framework for Large Language Models
Title（参考訳）: 大規模言語モデルのための適応型PII緩和フレームワーク
Authors: Shubhi Asthana, Ruchi Mahindru, Bing Zhang, Jorge Sanz,
Abstract要約: 本稿では,PII(Personally Identible Information)とSPI(Sensitive Personal Information)のリスク軽減のための適応システムを提案する。このシステムは、高度なNLP技術、文脈認識分析、およびポリシー駆動マスキングを使用して、規制コンプライアンスを保証する。ベンチマークではシステムの有効性が強調され、パスポート番号のF1スコアは0.95である。
参考スコア（独自算出の注目度）: 2.694044579874688
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Artificial Intelligence (AI) faces growing challenges from evolving data protection laws and enforcement practices worldwide. Regulations like GDPR and CCPA impose strict compliance requirements on Machine Learning (ML) models, especially concerning personal data use. These laws grant individuals rights such as data correction and deletion, complicating the training and deployment of Large Language Models (LLMs) that rely on extensive datasets. Public data availability does not guarantee its lawful use for ML, amplifying these challenges. This paper introduces an adaptive system for mitigating risk of Personally Identifiable Information (PII) and Sensitive Personal Information (SPI) in LLMs. It dynamically aligns with diverse regulatory frameworks and integrates seamlessly into Governance, Risk, and Compliance (GRC) systems. The system uses advanced NLP techniques, context-aware analysis, and policy-driven masking to ensure regulatory compliance. Benchmarks highlight the system's effectiveness, with an F1 score of 0.95 for Passport Numbers, outperforming tools like Microsoft Presidio (0.33) and Amazon Comprehend (0.54). In human evaluations, the system achieved an average user trust score of 4.6/5, with participants acknowledging its accuracy and transparency. Observations demonstrate stricter anonymization under GDPR compared to CCPA, which permits pseudonymization and user opt-outs. These results validate the system as a scalable and robust solution for enterprise privacy compliance.
Abstract（参考訳）: 人工知能(AI)は、世界中のデータ保護法と執行慣行の進化による課題に直面している。 GDPRやCCPAといった規制は、特に個人データの使用に関して、機械学習(ML)モデルに厳格なコンプライアンス要件を課している。これらの法律は、広範囲なデータセットに依存する大規模言語モデル(LLM)の訓練と展開を複雑にし、データの修正や削除のような個人の権利を付与する。公開データの可用性は、MLの合法的な使用を保証せず、これらの課題を増幅する。本稿では,LLMにおけるPII(Personally Identible Information)とSPI(Sensitive Personal Information)のリスク軽減のための適応システムを提案する。さまざまな規制フレームワークと動的に連携し、ガバナンス、リスク、コンプライアンス(GRC)システムにシームレスに統合します。このシステムは、高度なNLP技術、文脈認識分析、およびポリシー駆動マスキングを使用して、規制コンプライアンスを保証する。 F1スコアはパスポート番号の0.95で、Microsoft Presidio (0.33) や Amazon Comprehend (0.54) などのツールよりも優れている。人間の評価では、システムは平均的ユーザ信頼スコア4.6/5を達成し、参加者はその正確さと透明性を認めた。 GDPR下での匿名化はCCPAに比べて厳格であり、偽名化やユーザオプトアウトが可能である。これらの結果は、エンタープライズプライバシコンプライアンスのためのスケーラブルで堅牢なソリューションとしてシステムを検証する。

関連論文リスト

Privacy-Preserving Federated Embedding Learning for Localized Retrieval-Augmented Generation [60.81109086640437]
我々はFedE4RAG(Federated Retrieval-Augmented Generation)と呼ばれる新しいフレームワークを提案する。 FedE4RAGはクライアント側RAG検索モデルの協調トレーニングを容易にする。モデルパラメータの保護にフェデレート学習の準同型暗号化を適用する。
論文参考訳（メタデータ） (2025-04-27T04:26:02Z)
AILuminate: Introducing v1.0 of the AI Risk and Reliability Benchmark from MLCommons [62.374792825813394]
本稿ではAI製品リスクと信頼性を評価するための業界標準ベンチマークとして,AIluminate v1.0を紹介する。このベンチマークは、危険、違法、または望ましくない行動を12の危険カテゴリーで引き起こすように設計されたプロンプトに対するAIシステムの抵抗を評価する。
論文参考訳（メタデータ） (2025-02-19T05:58:52Z)
The Dual-use Dilemma in LLMs: Do Empowering Ethical Capacities Make a Degraded Utility? [54.18519360412294]
大きな言語モデル(LLM)は、安全のための有害な要求を拒否することと、ユーティリティのための正当な要求を収容することのバランスをとる必要がある。本稿では,DPO(Direct Preference Optimization)に基づくアライメントフレームワークを提案する。我々は,DeepSeek-R1をベンチマークでテストした結果を解析し,この高い評価を得たモデルがもたらす批判的倫理的懸念を明らかにする。
論文参考訳（メタデータ） (2025-01-20T06:35:01Z)
Powering LLM Regulation through Data: Bridging the Gap from Compute Thresholds to Customer Experiences [0.0]
本稿では,計算レベルのしきい値と一般化モデル評価に着目した現在の規制手法は,特定のLCMベースのユーザエクスペリエンスの安全性と有効性を保証するには不十分である,と論じる。本稿では,ユーザによる実際の体験と評価のための高品質データセットのキュレーションを中心とした認定プロセスへの移行を提案する。
論文参考訳（メタデータ） (2025-01-12T16:20:40Z)
Privacy-Preserving Customer Support: A Framework for Secure and Scalable Interactions [0.0]
本稿では,大規模言語モデル(LLM)をゼロショット学習モードで活用する新しいアプローチとして,プライバシー保護ゼロショット学習(PP-ZSL)フレームワークを提案する。従来の機械学習手法とは異なり、PP-ZSLは、事前学習されたLLMを使用して直接応答を生成することで、機密データに対する局所的なトレーニングを不要にしている。このフレームワークには、リアルタイムデータ匿名化による機密情報の修正やマスク、ドメイン固有のクエリ解決のための検索強化生成(RAG)、規制基準の遵守を保証するための堅牢な後処理が含まれている。
論文参考訳（メタデータ） (2024-12-10T17:20:47Z)
Trustworthy AI: Securing Sensitive Data in Large Language Models [0.0]
大規模言語モデル(LLM)は、堅牢なテキスト生成と理解を可能にすることで自然言語処理(NLP)を変革した。本稿では, 機密情報の開示を動的に制御するために, 信頼機構をLCMに組み込むための包括的枠組みを提案する。
論文参考訳（メタデータ） (2024-09-26T19:02:33Z)
LegiLM: A Fine-Tuned Legal Language Model for Data Compliance [5.256747140296861]
LegiLMは、データや情報コンプライアンスに関するコンサルティングに特化した、新しい法的言語モデルである。特定のアクションやイベントがデータセキュリティとプライバシ規則に違反しているかどうかを自動的に評価するように調整されている。 LegiLMは、データ規制違反の検出、健全な法的正当性の提供、必要なコンプライアンス修正の推奨に優れています。
論文参考訳（メタデータ） (2024-09-09T02:06:52Z)
Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文参考訳（メタデータ） (2023-04-21T09:03:18Z)
Distributed Machine Learning and the Semblance of Trust [66.1227776348216]
フェデレートラーニング(FL)により、データ所有者はデータを共有することなく、データガバナンスを維持し、モデルトレーニングをローカルで行うことができる。 FLと関連する技術は、しばしばプライバシー保護と表現される。この用語が適切でない理由を説明し、プライバシの形式的定義を念頭に設計されていないプロトコルに対する過度な信頼に関連するリスクを概説する。
論文参考訳（メタデータ） (2021-12-21T08:44:05Z)
Privacy Preservation in Federated Learning: An insightful survey from the GDPR Perspective [10.901568085406753]
この記事は、フェデレーテッドラーニングに使用できる最先端のプライバシー技術に関する調査に特化している。近年の研究では、FLにおけるデータの保持と計算は、プライバシ保証者にとって不十分であることが示されている。これは、FLシステム内のパーティ間で交換されるMLモデルパラメータが、いくつかのプライバシ攻撃で悪用されるためである。
論文参考訳（メタデータ） (2020-11-10T21:41:25Z)
Trustworthy AI [75.99046162669997]
入力データの小さな敵対的変化への脆さ、決定の説明能力、トレーニングデータのバイアスに対処する能力は、最も顕著な制限である。我々は,AIシステムに対するユーザおよび公的な信頼を高める上での6つの重要な問題に対処するために,信頼に値するAIに関するチュートリアルを提案する。
論文参考訳（メタデータ） (2020-11-02T20:04:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。