論文の概要: Hijacking Text Heritage: Hiding the Human Signature through Homoglyphic Substitution
- arxiv url: http://arxiv.org/abs/2604.10271v1
- Date: Sat, 11 Apr 2026 16:27:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.93046
- Title: Hijacking Text Heritage: Hiding the Human Signature through Homoglyphic Substitution
- Title(参考訳): ヒジャック・テキスト・ヘリテージ:ホモグリフの代用による人間の署名の隠蔽
- Authors: Robert Dilworth,
- Abstract要約: 政府発行のIDを含むデータ漏洩は、非記述のソーシャルメディアプラットフォーム上でのランダムな自発的開示と競合する可能性がある。
IDが侵入されるのを防止する。
本稿では,文字を視覚的に類似した代替品に置き換えるホモグリフ置換をいかに行うかを検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In what way could a data breach involving government-issued IDs such as passports, driver's licenses, etc., rival a random voluntary disclosure on a nondescript social-media platform? At first glance, the former appears more significant, and that is a valid assessment. The disclosed data could contain an individual's date of birth and address; for all intents and purposes, a leak of that data would be disastrous. Given the threat, the latter scenario involving an innocuous online post seems comparatively harmless--or does it? From that post and others like it, a forensic linguist could stylometrically uncover equivalent pieces of information, estimating an age range for the author (adolescent or adult) and narrowing down their geographical location (specific country). While not an exact science--the determinations are statistical--stylometry can reveal comparable, though noticeably diluted, information about an individual. To prevent an ID from being breached, simply sharing it as little as possible suffices. Preventing the leakage of personal information from written text requires a more complex solution: adversarial stylometry. In this paper, we explore how performing homoglyph substitution--the replacement of characters with visually similar alternatives (e.g., "h" $\texttt{[U+0068]}$ $\rightarrow$ "h" $\texttt{[U+04BB]}$)--on text can degrade stylometric systems.
- Abstract(参考訳): パスポートや運転免許証などの政府発行のIDを含むデータ漏洩は、ソーシャルメディアプラットフォーム上のランダムな自発的開示とどのように競合するのか?
一見したところ、前者はより重要で、これは妥当な評価だ。
開示されたデータには、個人の生年月日と住所が含まれており、あらゆる意図と目的のために、そのデータの漏洩は悲惨なものになるだろう。
この脅威を考えると、無害なオンライン投稿を含む後者のシナリオは、比較的無害に思える。その投稿などから、法医学の言語学者は、同等の情報をスタイリスティックに発見し、著者(青少年または大人)の年齢範囲を推定し、地理的な場所(特定の国)を狭めることができる。正確には科学ではないが、決定は統計的に統計的にスティロメトリである。個人に関する情報は著しく希薄である。IDが侵入されることを防ぎ、できるだけ簡単に共有する。テキストからの個人情報の漏洩を防ぐには、より複雑な解決が必要である。
関連論文リスト
- StegoStylo: Squelching Stylometric Scrutiny through Steganographic Stitching [0.0]
スティロメトリーは、著作権と盗作に関する調査を支援し、有害なコンテンツの検出を支援し、文学作品の歴史的文脈を提供する。
スティロメトリは著者認証のツールとして使われ、主張された著者から本質的なテキストが生まれるかどうかを確認する。
本稿では, ステガノグラフィーと対角的スタイメトリーを併用することにより, テガノグラフィーと対角的スタイメトリー分析を両立させる方法について検討する。
論文 参考訳(メタデータ) (2026-01-14T00:49:20Z) - A False Sense of Privacy: Evaluating Textual Data Sanitization Beyond Surface-level Privacy Leakage [77.83757117924995]
我々は、データリリース時の個人のプライバシーリスクを定量化するために、再識別攻撃を評価する新しいフレームワークを提案する。
本手法は, 衛生データから年齢や物質使用履歴などのセンシティブな属性を推測するために, 一見無害な補助情報を利用できることを示す。
論文 参考訳(メタデータ) (2025-04-28T01:16:27Z) - IDT: Dual-Task Adversarial Attacks for Privacy Protection [8.312362092693377]
プライバシを保護するには、センシティブな属性を検出できないモデル内の表現を使用する必要がある。
補助的および解釈可能なモデルによる予測を分析し,どのトークンが変更に重要かを識別する手法であるIDTを提案する。
我々は、異なるタスクに適したNLPのための異なるデータセットを評価する。
論文 参考訳(メタデータ) (2024-06-28T04:14:35Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Exploit the Leak: Understanding Risks in Biometric Matchers [0.0]
生体認証または識別システムにおいて、マッチング者は、格納されたテンプレートと新しいテンプレートを比較して、マッチがあるかどうかを判断する。
プライバシー法の遵守性を高めるために、マーカはプライバシー保護距離の上に構築することができる。
本稿では,距離評価における情報漏洩の解析を行う。
論文 参考訳(メタデータ) (2023-07-25T17:29:32Z) - Unsupervised Text Deidentification [101.2219634341714]
個人識別情報を漏洩する単語を隠蔽する教師なしの識別手法を提案する。
K匿名性に基づくプライバシによって動機づけられた私たちは、最小の再識別ランクを保証するリアクションを生成します。
論文 参考訳(メタデータ) (2022-10-20T18:54:39Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - RealGait: Gait Recognition for Person Re-Identification [79.67088297584762]
我々は,既存の映像人物の再識別課題からシルエットを抽出し,制約のない方法で歩く1,404人からなる新たな歩行データセットを構築した。
以上の結果から、実際の監視シナリオにおける歩行による認識は実現可能であり、その基盤となる歩行パターンが、実際にビデオの人物認識が機能する真の理由である可能性が示唆された。
論文 参考訳(メタデータ) (2022-01-13T06:30:56Z) - PhishGAN: Data Augmentation and Identification of Homoglpyh Attacks [0.0]
ホモグリフ攻撃(Homoglyph attack)は、ハッカーがフィッシングを行うのに使われる一般的なテクニックである。実際のフィッシングと視覚的に類似したドメイン名やリンクは、攻撃を難読化するためにペニーコードによって生成される。
本稿では,ヒエログリフの画像を生成するために,条件付き生成適応ネットワーク(GAN)であるPhishGANを用いる方法を示す。
論文 参考訳(メタデータ) (2020-06-24T13:59:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。