論文の概要: How Much User Context Do We Need? Privacy by Design in Mental Health NLP
Application
- arxiv url: http://arxiv.org/abs/2209.02022v1
- Date: Mon, 5 Sep 2022 15:41:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 14:24:32.029419
- Title: How Much User Context Do We Need? Privacy by Design in Mental Health NLP
Application
- Title(参考訳): ユーザコンテキストはどれくらい必要か?
メンタルヘルスNLPアプリケーションにおける設計によるプライバシ
- Authors: Ramit Sawhney and Atula Tejaswi Neerkaje and Ivan Habernal and Lucie
Flek
- Abstract要約: テキストからのメンタルヘルスアセスメントなどの臨床的タスクは、社会的制約を考慮に入れなければならない。
本稿では,ユーザ履歴長と差分プライバシー予算を並べた最初の分析を行い,ユーザコンテキストのモデリングによってユーティリティの保存を実現する方法について詳しく述べる。
- 参考スコア(独自算出の注目度): 33.3172788815152
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Clinical NLP tasks such as mental health assessment from text, must take
social constraints into account - the performance maximization must be
constrained by the utmost importance of guaranteeing privacy of user data.
Consumer protection regulations, such as GDPR, generally handle privacy by
restricting data availability, such as requiring to limit user data to 'what is
necessary' for a given purpose. In this work, we reason that providing stricter
formal privacy guarantees, while increasing the volume of user data in the
model, in most cases increases benefit for all parties involved, especially for
the user. We demonstrate our arguments on two existing suicide risk assessment
datasets of Twitter and Reddit posts. We present the first analysis juxtaposing
user history length and differential privacy budgets and elaborate how modeling
additional user context enables utility preservation while maintaining
acceptable user privacy guarantees.
- Abstract(参考訳): テキストからのメンタルヘルスアセスメントのようなNLPの臨床的タスクは、社会的制約を考慮に入れなければならない。
gdprのような消費者保護規則は、通常、特定の目的のためにユーザーデータを「必要なもの」に制限することなど、データ可用性を制限することでプライバシーを処理する。
本研究では,厳格な形式的プライバシ保証の提供が,モデル内のユーザデータの量を増やす一方で,ほとんどの場合,関係者,特にユーザに対する利益を増大させるのが理由である。
我々は,twitter と reddit の投稿について,既存の自殺リスクアセスメントデータセットについて議論する。
本稿では,ユーザ履歴と差分プライバシ予算を並べた最初の分析を行い,ユーザコンテキストのモデリングによってユーザプライバシ保証を許容しつつ,実用性を維持する方法について詳しく述べる。
関連論文リスト
- PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.11479432110771]
PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文 参考訳(メタデータ) (2024-08-29T17:58:38Z) - Collection, usage and privacy of mobility data in the enterprise and public administrations [55.2480439325792]
個人のプライバシーを守るためには、匿名化などのセキュリティ対策が必要である。
本研究では,現場における実践の洞察を得るために,専門家によるインタビューを行った。
我々は、一般的には最先端の差分プライバシー基準に準拠しない、使用中のプライバシー強化手法を調査した。
論文 参考訳(メタデータ) (2024-07-04T08:29:27Z) - Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning [62.224804688233]
差分プライバシ(DP)は、モデルが特定のプライバシユニットで「ほとんど区別できない」ことを保証することで、有望なソリューションを提供する。
ユーザ間でのプライバシー保護の確保に必要なアプリケーションによって動機づけられたユーザレベルのDPについて検討する。
論文 参考訳(メタデータ) (2024-06-20T13:54:32Z) - Mean Estimation Under Heterogeneous Privacy Demands [5.755004576310333]
本研究は,各ユーザが自身のプライバシレベルを設定できる平均推定の問題について考察する。
提案するアルゴリズムは,ミニマックス最適であり,ほぼ直線的な実行時間を有することを示す。
プライバシー要件が低いが異なるユーザは、すべて同じ金額で、必要以上のプライバシーを与えられる。
論文 参考訳(メタデータ) (2023-10-19T20:29:19Z) - Privacy Preserving Large Language Models: ChatGPT Case Study Based Vision and Framework [6.828884629694705]
本稿では,LLMのプライバシ生成モデルであるPrivChatGPTという概念モデルを提案する。
PrivChatGPTは、データキュレーション/前処理中にユーザのプライバシを保護し、プライベートコンテキストの保存と大規模データのプライベートトレーニングプロセスという2つの主要コンポーネントから構成される。
論文 参考訳(メタデータ) (2023-10-19T06:55:13Z) - Mean Estimation Under Heterogeneous Privacy: Some Privacy Can Be Free [13.198689566654103]
本研究は,異種差分プライバシー制約に基づく平均推定の問題について考察する。
提案するアルゴリズムは,プライバシレベルが異なる2つのユーザグループが存在する場合に,ミニマックス最適であることが示されている。
論文 参考訳(メタデータ) (2023-04-27T05:23:06Z) - Privacy Explanations - A Means to End-User Trust [64.7066037969487]
この問題に対処するために、説明可能性がどのように役立つかを検討しました。
私たちはプライバシーの説明を作成し、エンドユーザの理由と特定のデータが必要な理由を明らかにするのに役立ちました。
我々の発見は、プライバシーの説明がソフトウェアシステムの信頼性を高めるための重要なステップであることを示している。
論文 参考訳(メタデータ) (2022-10-18T09:30:37Z) - Leveraging Privacy Profiles to Empower Users in the Digital Society [7.350403786094707]
市民のプライバシーと倫理は、ますますデジタル化されつつある社会によってもたらされる懸念の中核にある。
我々は、フィットネス領域から収集された既存のデータセットに関する実証的研究を通じて、プライバシの次元に注目し、上記の方向のステップに貢献する。
その結果、セマンティック駆動型質問のコンパクトなセットは、複雑なドメイン依存質問よりもユーザを識別するのに役立つことがわかった。
論文 参考訳(メタデータ) (2022-04-01T15:31:50Z) - PCAL: A Privacy-preserving Intelligent Credit Risk Modeling Framework
Based on Adversarial Learning [111.19576084222345]
本稿では,PCAL(Adversarial Learning)に基づくプライバシ保護型信用リスクモデリングの枠組みを提案する。
PCALは、ターゲット予測タスクのパフォーマンスの重要なユーティリティ情報を維持しながら、元のデータセット内のプライベート情報を隠蔽することを目的としている。
結果は,PCALがユーザデータから効果的なプライバシフリー表現を学習し,信用リスク分析のためのプライバシ保存機械学習の基盤となることを示唆している。
論文 参考訳(メタデータ) (2020-10-06T07:04:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。