論文の概要: Recipient Profiling: Predicting Characteristics from Messages
- arxiv url: http://arxiv.org/abs/2412.12954v1
- Date: Tue, 17 Dec 2024 14:35:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 13:59:26.494720
- Title: Recipient Profiling: Predicting Characteristics from Messages
- Title(参考訳): レシピプロファイリング:メッセージの特徴を予測する
- Authors: Martin Borquez, Mikaela Keller, Michael Perrot, Damien Sileo,
- Abstract要約: これらのテキストが実際に個人間でメッセージ交換されている場合、これは物語の終わりではない、と我々は主張する。
そこで本研究では,プライバシリークが影響する可能性について検討し,レシピ・プロファイリング(Recipient Profiling)の問題に対処する。
このようなタスクが複数の公開データセット上で実現可能であることを示す実証的な証拠を提供する。
- 参考スコア(独自算出の注目度): 0.544500016510438
- License:
- Abstract: It has been shown in the field of Author Profiling that texts may inadvertently reveal sensitive information about their authors, such as gender or age. This raises important privacy concerns that have been extensively addressed in the literature, in particular with the development of methods to hide such information. We argue that, when these texts are in fact messages exchanged between individuals, this is not the end of the story. Indeed, in this case, a second party, the intended recipient, is also involved and should be considered. In this work, we investigate the potential privacy leaks affecting them, that is we propose and address the problem of Recipient Profiling. We provide empirical evidence that such a task is feasible on several publicly accessible datasets (https://huggingface.co/datasets/sileod/recipient_profiling). Furthermore, we show that the learned models can be transferred to other datasets, albeit with a loss in accuracy.
- Abstract(参考訳): 著者プロファイリングの分野において、テキストは、性別や年齢などの著者に関する機密情報を不注意に明らかにする可能性があることが示されている。
このことは、特にそのような情報を隠蔽する手法の開発において、文献で広く取り上げられてきた重要なプライバシー上の懸念を提起する。
これらのテキストが実際に個人間でメッセージ交換されている場合、これは物語の終わりではない、と我々は主張する。
実際、この場合、第2の当事者である意図された受信者も関与しており、考慮すべきである。
そこで本研究では,プライバシリークが影響する可能性について検討し,レシピ・プロファイリング(Recipient Profiling)の問題に対処する。
このようなタスクが一般に公開されているデータセット(https://huggingface.co/datasets/sileod/recipient_profiling)で実現可能であることを示す実証的な証拠を提供する。
さらに,学習したモデルを,精度の低下にもかかわらず,他のデータセットに転送可能であることを示す。
関連論文リスト
- Enforcing Demographic Coherence: A Harms Aware Framework for Reasoning about Private Data Release [14.939460540040459]
データプライバシに必要であると主張するプライバシ攻撃にインスパイアされた、人口統計コヒーレンスを導入します。
我々のフレームワークは信頼性評価予測に重点を置いており、ほぼすべてのデータインフォームドプロセスから蒸留することができる。
差分的にプライベートなデータリリースはすべて、人口統計学的にコヒーレントであること、および、差分的にプライベートではない人口統計学的にコヒーレントなアルゴリズムがあることを実証する。
論文 参考訳(メタデータ) (2025-02-04T20:42:30Z) - PrivacyLens: Evaluating Privacy Norm Awareness of Language Models in Action [54.11479432110771]
PrivacyLensは、プライバシに敏感な種子を表現的なヴィグネットに拡張し、さらにエージェントの軌跡に拡張するために設計された新しいフレームワークである。
プライバシの文献とクラウドソーシングされたシードに基づいて、プライバシの規範のコレクションをインスタンス化する。
GPT-4やLlama-3-70Bのような最先端のLMは、プライバシー強化の指示が出されたとしても、機密情報を25.68%、38.69%のケースでリークしている。
論文 参考訳(メタデータ) (2024-08-29T17:58:38Z) - Protecting Privacy in Classifiers by Token Manipulation [3.5033860596797965]
テキスト分類モデルに焦点をあて、様々なトークンマッピングとコンテキスト化された操作機能について検討する。
いくつかのトークンマッピング関数の実装は簡単で簡単ですが、ダウンストリームタスクのパフォーマンスに大きな影響を与えます。
比較すると、文脈化された操作はパフォーマンスを改善する。
論文 参考訳(メタデータ) (2024-07-01T14:41:59Z) - Anonymizing Test Data in Android: Does It Hurt? [5.601042583221172]
フィールドから収集されたフェールデータは、フェールを再現し分析する必要があるディベロッパにとって、貴重な情報ソースである。
残念ながら、フィールドデータには機密情報が含まれており、したがって無差別に収集することはできない。
プライバシー保護技術は、データの匿名化と個人情報開示のリスク軽減に対処することができる。
論文 参考訳(メタデータ) (2024-02-12T07:42:11Z) - On mission Twitter Profiles: A Study of Selective Toxic Behavior [5.0157204307764625]
本研究は「オンミッションプロファイル」と呼ばれる影響操作に使用される可能性のあるプロファイルを特徴付けることを目的とする。
128万件のTwitterやX、プロフィール、293万件のツイートの時系列データは、テーマの多様性に基づいたプロファイリングを可能にする。
論文 参考訳(メタデータ) (2024-01-25T15:42:36Z) - Membership Inference Attacks against Synthetic Data through Overfitting
Detection [84.02632160692995]
我々は、攻撃者が基礎となるデータ分布についてある程度の知識を持っていると仮定する現実的なMIA設定について論じる。
生成モデルの局所的なオーバーフィッティングをターゲットとして,メンバシップを推論することを目的とした密度ベースMIAモデルであるDOMIASを提案する。
論文 参考訳(メタデータ) (2023-02-24T11:27:39Z) - How Do Input Attributes Impact the Privacy Loss in Differential Privacy? [55.492422758737575]
DPニューラルネットワークにおけるオブジェクトごとの規範と個人のプライバシ損失との関係について検討する。
プライバシ・ロス・インプット・サセプティビリティ(PLIS)と呼ばれる新しい指標を導入し、被験者のプライバシ・ロスを入力属性に適応させることを可能にした。
論文 参考訳(メタデータ) (2022-11-18T11:39:03Z) - PART: Pre-trained Authorship Representation Transformer [64.78260098263489]
文書を書く著者は、語彙、レジストリ、句読点、ミススペル、絵文字の使用など、テキスト内での識別情報をインプリントする。
以前の作品では、手作りのフィーチャや分類タスクを使用して著者モデルをトレーニングし、ドメイン外の著者に対するパフォーマンスの低下につながった。
セマンティクスの代わりにtextbfauthorship の埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - "Am I Private and If So, how Many?" -- Using Risk Communication Formats
for Making Differential Privacy Understandable [0.0]
我々は、差別化プライバシのプライバシリスクモデルと合わせて、リスクコミュニケーションフォーマットを適応する。
我々はこれらの新しいプライバシーコミュニケーションフォーマットをクラウドソーシング研究で評価する。
論文 参考訳(メタデータ) (2022-04-08T13:30:07Z) - TIPRDC: Task-Independent Privacy-Respecting Data Crowdsourcing Framework
for Deep Learning with Anonymized Intermediate Representations [49.20701800683092]
本稿では,匿名化中間表現を用いたタスク非依存型プライバシ参照データクラウドソーシングフレームワークTIPRDCを提案する。
このフレームワークの目的は、中間表現からプライバシー情報を隠蔽できる機能抽出器を学習することであり、データコレクターの生データに埋め込まれた元の情報を最大限に保持し、未知の学習タスクを達成することである。
論文 参考訳(メタデータ) (2020-05-23T06:21:26Z) - InfoScrub: Towards Attribute Privacy by Targeted Obfuscation [77.49428268918703]
視覚データに流出した個人情報を個人が制限できる技術について検討する。
我々はこの問題を新しい画像難読化フレームワークで解決する。
提案手法では,元の入力画像に忠実な難読化画像を生成するとともに,非難読化画像に対して6.2$times$(または0.85bits)の不確実性を増大させる。
論文 参考訳(メタデータ) (2020-05-20T19:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。