論文の概要: Inferential Privacy Leakage in Anonymized Conversational AI Logs
- arxiv url: http://arxiv.org/abs/2605.23820v1
- Date: Fri, 22 May 2026 16:22:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.427342
- Title: Inferential Privacy Leakage in Anonymized Conversational AI Logs
- Title(参考訳): 匿名会話型AIログにおける推論プライバシ漏洩
- Authors: S M Mehedi Zaman, Kiran Garimella,
- Abstract要約: グローバル・サウス4カ国1000人以上のコーパス上で、ChatGPT会話のプライバシー関連の特徴を2つ測定した。
34.5%のユーザーメッセージは、20の分類にまたがる個人情報を含み、中央のユーザーは会話履歴の最初の14%でコンテンツを識別する。
オフシェルフ大言語モデルは、各ユーザの年齢、性別、国をそれぞれ0.84、0.90、0.88の重み付きF1で復元し、会話履歴の最初の5%から中央値のユーザが識別する。
- 参考スコア(独自算出の注目度): 3.075317043745676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hundreds of millions of users now hold detailed, multi-turn conversations with ChatGPT and similar LLM assistants. We measure two privacy-relevant features of these conversations on a corpus of complete ChatGPT histories donated by over 1,000 users in four Global South countries (Brazil, India, Nigeria, Pakistan). First, on explicit disclosure: 34.5% of user messages contain personal information across a twenty-category taxonomy, with the median user first revealing identifying content within the first 14% of their conversation history. Second, on inference beyond explicit disclosure: we restrict to a cohort whose conversations contain no messages flagged by an LLM-based filter for explicit demographic self-identification (a separate NER pass marks PII for the disclosure audit but does not drive cohort exclusion). On this filtered cohort, an off the shelf large language model still recovers each user's age, gender, and country at weighted F1 of 0.84, 0.90, and 0.88, respectively, with the median user identified from the first 5% of their conversation history. Reading the model's natural-language reasoning traces, we identify four recurring stereotype patterns that drive both successful inference and an asymmetric error distribution concentrating on women in technical fields, older users with contemporary skills, and Global South tech professionals. We also compare ChatGPT against the same users' Google Search and YouTube histories as inference surfaces, and find it competitive with these older substrates that have driven behavioral advertising for two decades. Message-level PII removal is insufficient on its own as a privacy intervention for conversational AI data.
- Abstract(参考訳): 数十万人のユーザーがChatGPTや同様のLLMアシスタントとの詳細なマルチターン会話を行っている。
これらの会話のプライバシーに関する2つの特徴を、世界4カ国(ブラジル、インド、ナイジェリア、パキスタン)で1000人以上のユーザーが寄付した完全なChatGPT履歴のコーパスで測定する。
ユーザーメッセージの34.5%は、20の分類にまたがる個人情報を含み、中央のユーザーは会話履歴の最初の14%でコンテンツを識別する。
第2に、明示的な開示以上の推論において、私たちは、明示的な自己識別のためのLLMベースのフィルタによってマークされたメッセージを含む会話を含まないコホートに制限する(開示監査のために別個のNERパスマークPIIを付与するが、コホート排除を推進しない)。
このフィルター付きコホートでは、オフリーフ大言語モデルは、各ユーザの年齢、性別、国をそれぞれ0.84、0.90、0.88の重み付きF1で復元し、会話履歴の最初の5%から中央値のユーザが識別する。
モデルの自然言語推論トレースを読めば、技術分野の女性、現代技術を持つ高齢者、グローバルサウスのテックプロフェッショナルに焦点を絞った推論と非対称なエラー分布の両方を駆動する4つの繰り返しステレオタイプパターンを識別する。
また、ChatGPTをGoogle検索とYouTubeの履歴を推論サーフェスとして比較したところ、20年間にわたって行動広告を推進してきた古い基板と競合することがわかった。
メッセージレベルのPII削除は、会話型AIデータのプライバシー介入として、それ自体では不十分である。
関連論文リスト
- SocialMemBench: Are AI Memory Systems Ready for Social Group Settings? [0.0]
AIアシスタントのメモリシステムは、シングルユーザー対話用に構築され、マルチパーティのソーシャルグループ設定に適用した場合、特徴的にフェールする。
既存のメモリベンチマークでは、ダイアディックや職場での対話が評価されている。
人工ソーシャルグループネットワークのベンチマークであるSocialMemBenchを紹介する。
論文 参考訳(メタデータ) (2026-05-18T03:11:48Z) - Personality over Precision: Exploring the Influence of Human-Likeness on ChatGPT Use for Search [8.544772506500188]
そこで我々は,ChatGPT と Google 間の信頼,人間的類似性(擬人化),および設計上の嗜好に関するユーザ認知について検討した。
分析では、ChatGPTとGoogle Daily(DUB)と、主にGoogle(DUG)に頼っている2つの異なるユーザーグループを特定した。
DUBグループはChatGPTに対する高い信頼を示し、より人間らしく認識し、パーソナライゼーションと会話の流れを強化するために事実的正確性を取引する意志を示した。
論文 参考訳(メタデータ) (2025-11-09T16:28:55Z) - Understanding Privacy Norms Around LLM-Based Chatbots: A Contextual Integrity Perspective [14.179623604712065]
我々は,300人のChatGPTユーザを対象に,ChatGPTデータの共有に関するプライバシー規範の出現を理解するための調査実験を行った。
以上の結果から,ユーザの関心事と行動との間には大きな隔たりがあることが判明した。
参加者は、200ドル相当のプレミアム機能と引き換えに、改善されたサービスのための個人情報の共有を一斉に拒否した。
論文 参考訳(メタデータ) (2025-08-09T00:22:46Z) - Mind the Gap! Static and Interactive Evaluations of Large Audio Models [55.87220295533817]
大型オーディオモデル(LAM)は、音声ネイティブな体験をパワーアップするために設計されている。
本研究は,484名の参加者から,LAMを評価し,7,500名のLAMインタラクションを収集する対話的アプローチを提案する。
論文 参考訳(メタデータ) (2025-02-21T20:29:02Z) - First-Person Fairness in Chatbots [13.787745105316043]
第一対人公正性」を評価するためのスケーラブルな対実的アプローチを導入する。
このアプローチを適用して、数百万のインタラクションにまたがる6つの言語モデルのバイアスを評価する。
本研究は,実世界のチャットデータに基づく,初めての大規模公正度評価である。
論文 参考訳(メタデータ) (2024-10-16T17:59:47Z) - X-TURING: Towards an Enhanced and Efficient Turing Test for Long-Term Dialogue Agents [56.64615470513102]
チューリングテストは、自然言語の会話においてAIが人間のような振る舞いを示すかどうかを調べる。
従来の設定では、各参加者は一度に1つのメッセージに制限される。
本稿では,textitburstダイアログパターンを用いて,元のテストを強化するtextbftextscX-Turingを提案する。
論文 参考訳(メタデータ) (2024-08-19T09:57:28Z) - WildChat: 1M ChatGPT Interaction Logs in the Wild [88.05964311416717]
WildChatは100万件のユーザー・チャットGPT会話のコーパスで、250万回以上のインタラクション・ターンで構成されている。
タイムスタンプによるチャットの書き起こしに加えて、州、国、ハッシュIPアドレスを含む人口統計データでデータセットを豊かにします。
論文 参考訳(メタデータ) (2024-05-02T17:00:02Z) - A Multitask, Multilingual, Multimodal Evaluation of ChatGPT on
Reasoning, Hallucination, and Interactivity [79.12003701981092]
8種類の共通NLPアプリケーションタスクをカバーする23のデータセットを用いてChatGPTの広範な技術的評価を行う。
これらのデータセットと、新たに設計されたマルチモーダルデータセットに基づいて、ChatGPTのマルチタスク、マルチリンガル、マルチモーダルの側面を評価する。
ChatGPTの精度は平均63.41%で、論理的推論、非テキスト的推論、コモンセンス推論の10の異なる推論カテゴリで正確である。
論文 参考訳(メタデータ) (2023-02-08T12:35:34Z) - Knowledge-Grounded Conversational Data Augmentation with Generative
Conversational Networks [76.11480953550013]
生成会話ネットワークを用いて会話データを自動的に生成する。
我々は、Topical Chatデータセット上で、知識のない会話に対するアプローチを評価した。
論文 参考訳(メタデータ) (2022-07-22T22:37:14Z) - Training Conversational Agents with Generative Conversational Networks [74.9941330874663]
我々は、生成会話ネットワークを使用して、自動的にデータを生成し、社会的会話エージェントを訓練する。
自動メトリクスと人的評価器を用いてTopicalChatのアプローチを評価し、10%のシードデータで100%のデータを使用するベースラインに近いパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-10-15T21:46:39Z) - Privacy Concerns in Chatbot Interactions: When to Trust and When to
Worry [3.867363075280544]
英国市民491名を対象に調査を行った。
以上の結果から,ユーザの関心は個人情報の削除とデータの不適切な使用に対する懸念に焦点が当てられていることがわかった。
また、会話エージェントと会話した後、個人がデータのコントロールを失うことを懸念していることも確認した。
論文 参考訳(メタデータ) (2021-07-08T16:31:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。