Fugu-MT 論文翻訳(概要): Reducing Privacy Risks in Online Self-Disclosures with Language Models

論文の概要: Reducing Privacy Risks in Online Self-Disclosures with Language Models

arxiv url: http://arxiv.org/abs/2311.09538v1
Date: Thu, 16 Nov 2023 03:28:43 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-17 16:52:57.348148
Title: Reducing Privacy Risks in Online Self-Disclosures with Language Models
Title（参考訳）: 言語モデルを用いたオンライン自己開示におけるプライバシーリスクの低減
Authors: Yao Dou, Isadora Krsek, Tarek Naous, Anubha Kabra, Sauvik Das, Alan Ritter, Wei Xu
Abstract要約: 我々は、識別と抽象化を通じて、オンラインの自己開示に関連するユーザ側のプライバシを保護するためのイニシアティブを取ります。我々は19の自己開示カテゴリの分類を開発し,4.8Kの注釈付き開示スパンからなる大きなコーパスをキュレートした。ユーザからのフィードバックに触発され、自己開示抽象化の課題を導入する。
参考スコア（独自算出の注目度）: 27.590704005745874
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Self-disclosure, while being common and rewarding in social media interaction, also poses privacy risks. In this paper, we take the initiative to protect the user-side privacy associated with online self-disclosure through identification and abstraction. We develop a taxonomy of 19 self-disclosure categories, and curate a large corpus consisting of 4.8K annotated disclosure spans. We then fine-tune a language model for identification, achieving over 75% in Token F$_1$. We further conduct a HCI user study, with 82\% of participants viewing the model positively, highlighting its real world applicability. Motivated by the user feedback, we introduce the task of self-disclosure abstraction. We experiment with both one-span abstraction and three-span abstraction settings, and explore multiple fine-tuning strategies. Our best model can generate diverse abstractions that moderately reduce privacy risks while maintaining high utility according to human evaluation.
Abstract（参考訳）: 自己開示は一般的であり、ソーシャルメディアのやりとりに報いる一方で、プライバシーのリスクも生じている。本稿では,オンラインの自己開示に関連するユーザ側のプライバシーを,識別と抽象化を通じて保護する。自己開示カテゴリー19の分類法を開発し、4.8kの注釈付き開示スパンからなる大きなコーパスをキュレーションする。次に、識別のための言語モデルを微調整し、トークンf$_1$で75%以上を達成する。さらに,参加者の82-%が肯定的にモデルを見て,実世界への適用性を強調したhciユーザ調査を行った。ユーザからのフィードバックを受けて、自己開示抽象化のタスクを導入する。我々は,1スパンの抽象化と3スパンの抽象化の両方を実験し,複数の微調整戦略を検討する。我々の最良のモデルは、人間の評価に従って高いユーティリティを維持しながら、プライバシーリスクを適度に低減する多様な抽象化を生成することができる。

関連論文リスト

Self-Refining Language Model Anonymizers via Adversarial Distillation [49.17383264812234]
大きな言語モデル(LLM)は、個人情報を推測する能力がプライバシーのリスクを生じさせるセンシティブなドメインで、ますます使われています。本稿では,SLM(Small Language Model)を訓練し,効率的な匿名化を実現するための新しい蒸留フレームワークであるSEAL(Self-refining Anonymization with Language Model)を紹介する。
論文参考訳（メタデータ） (2025-06-02T08:21:27Z)
Membership Inference Attacks fueled by Few-Short Learning to detect privacy leakage tackling data integrity [7.8973037023478785]
ディープラーニングモデルは、トレーニングデータの一部を記憶し、プライバシリークを生成する。本稿では、深層学習モデルのプライバシー侵害の評価を容易にするFeS-MIAモデルとして考案されたFew-Shot学習に基づくMIAを提案する。また,Log-MIA尺度と呼ばれる,解釈可能な量的・質的なプライバシ尺度を提案する。
論文参考訳（メタデータ） (2025-03-12T13:09:43Z)
Protecting Users From Themselves: Safeguarding Contextual Privacy in Interactions with Conversational Agents [33.26308626066122]
会話エージェント(LCA)とのユーザインタラクションにおけるコンテキストプライバシの概念を特徴付ける。これは、ユーザーが意図した目標を達成するのに必要な情報のみを(ベンダー)が開示することを保証することで、プライバシー上のリスクを最小限にすることを目的としている。本稿では,ユーザとLCA間のローカルデプロイ可能なフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-22T09:05:39Z)
Measuring, Modeling, and Helping People Account for Privacy Risks in Online Self-Disclosures with AI [25.188347404539925]
Redditのような匿名のオンラインフォーラムでは、自己開示の利点はしばしばユーザーに明らかだが、プライバシーリスクはより抽象的だ。これまでの研究は、ユーザーがテキスト中の潜在的に危険な自己開示を特定するのに役立つ自然言語処理ツールの開発に取り組んできた。保護したいユーザーのためにデザインされたり評価されたりした人はいません。
論文参考訳（メタデータ） (2024-12-19T16:53:40Z)
How Private are Language Models in Abstractive Summarization? [36.801842863853715]
医療や法律などの機密ドメインでは、機密情報を保護することが重要である。これは、医療報告や訴訟要約などの貴重なデータを共有する上での課題である。プライベートでないソース文書から、どの程度プライバシ保護の要約を提供できるのか、まだ明らかな疑問である。
論文参考訳（メタデータ） (2024-12-16T18:08:22Z)
PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.11479432110771]
PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。 GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文参考訳（メタデータ） (2024-08-29T17:58:38Z)
DePrompt: Desensitization and Evaluation of Personal Identifiable Information in Large Language Model Prompts [11.883785681042593]
DePromptは、プロンプトのための脱感作保護および有効性評価フレームワークである。我々は、コンテキスト属性を統合し、プライバシタイプを定義し、高精度なPIIエンティティ識別を実現する。私たちのフレームワークはプロンプトに適応可能で、テキストのユーザビリティに依存したシナリオに拡張できます。
論文参考訳（メタデータ） (2024-08-16T02:38:25Z)
NAP^2: A Benchmark for Naturalness and Privacy-Preserving Text Rewriting by Learning from Human [56.46355425175232]
我々は,人間によって使用される2つの共通戦略を用いて,機密テキストの衛生化を提案する。我々は,クラウドソーシングと大規模言語モデルの利用を通じて,NAP2という最初のコーパスをキュレートする。匿名化に関する以前の研究と比較すると、人間に触発されたアプローチはより自然な書き直しをもたらす。
論文参考訳（メタデータ） (2024-06-06T05:07:44Z)
Privacy Backdoors: Enhancing Membership Inference through Poisoning Pre-trained Models [112.48136829374741]
本稿では、プライバシーバックドア攻撃という新たな脆弱性を明らかにします。被害者がバックドアモデルに微調整を行った場合、トレーニングデータは通常のモデルに微調整された場合よりも大幅に高い速度でリークされる。我々の発見は、機械学習コミュニティにおける重要なプライバシー上の懸念を浮き彫りにし、オープンソースの事前訓練モデルの使用における安全性プロトコルの再評価を求めている。
論文参考訳（メタデータ） (2024-04-01T16:50:54Z)
Can LLMs Keep a Secret? Testing Privacy Implications of Language Models via Contextual Integrity Theory [82.7042006247124]
私たちは、最も有能なAIモデルでさえ、人間がそれぞれ39%と57%の確率で、プライベートな情報を公開していることを示しています。我々の研究は、推論と心の理論に基づいて、新しい推論時プライバシー保護アプローチを即時に探求する必要性を浮き彫りにしている。
論文参考訳（メタデータ） (2023-10-27T04:15:30Z)
Locally Differentially Private Document Generation Using Zero Shot Prompting [61.20953109732442]
本稿では,DP-Prompt と呼ばれる局所的に異なるプライベートなメカニズムを提案し,作者の匿名化攻撃に対処する。 DP-PromptをChatGPT(gpt-3.5)のような強力な言語モデルで使用すると、匿名化攻撃の成功率の顕著な低下が観察される。
論文参考訳（メタデータ） (2023-10-24T18:25:13Z)
PrivacyMind: Large Language Models Can Be Contextual Privacy Protection Learners [81.571305826793]
コンテキストプライバシ保護言語モデル(PrivacyMind)を紹介する。我々の研究はモデル設計に関する理論的分析を提供し、様々な手法をベンチマークする。特に、肯定的な例と否定的な例の両方による命令チューニングは、有望な方法である。
論文参考訳（メタデータ） (2023-10-03T22:37:01Z)
TeD-SPAD: Temporal Distinctiveness for Self-supervised Privacy-preservation for video Anomaly Detection [59.04634695294402]
人間の監視のないビデオ異常検出(VAD)は複雑なコンピュータビジョンタスクである。 VADのプライバシー漏洩により、モデルは人々の個人情報に関連する不必要なバイアスを拾い上げ、増幅することができる。本稿では,視覚的プライベート情報を自己管理的に破壊する,プライバシーに配慮したビデオ異常検出フレームワークTeD-SPADを提案する。
論文参考訳（メタデータ） (2023-08-21T22:42:55Z)
SeePrivacy: Automated Contextual Privacy Policy Generation for Mobile Applications [21.186902172367173]
SeePrivacyは、モバイルアプリのコンテキストプライバシポリシを自動的に生成するように設計されている。本手法は,モバイルGUI理解とプライバシポリシ文書解析を相乗的に組み合わせた手法である。検索されたポリシーセグメントの96%は、そのコンテキストと正しく一致させることができる。
論文参考訳（メタデータ） (2023-07-04T12:52:45Z)
Can Foundation Models Help Us Achieve Perfect Secrecy? [11.073539163281524]
機械学習の鍵となる約束は、ユーザーをパーソナルなタスクで支援する能力である。金の標準プライバシー保護システムは、完全な機密性を満たすだろう。しかし、プライバシーと品質は、個人業務のために既存のシステムでは緊張しているようだ。
論文参考訳（メタデータ） (2022-05-27T02:32:26Z)
Why Should I Trust a Model is Private? Using Shifts in Model Explanation for Evaluating Privacy-Preserving Emotion Recognition Model [35.016050900061]
本稿では,モデルの有効性を評価するために解釈可能な手法を用いることに焦点をあてる。プライバシーを守るための一般的な方法が、プライバシー保護の人間の認識とどのように一致しないかを示します。評価者の傾きを評価し、特定のタスクのモデルを選択するためのクラウドソーシング実験を行います。
論文参考訳（メタデータ） (2021-04-18T09:56:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。