論文の概要: StegoStylo: Squelching Stylometric Scrutiny through Steganographic Stitching
- arxiv url: http://arxiv.org/abs/2601.09056v2
- Date: Mon, 19 Jan 2026 13:34:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 18:45:13.522336
- Title: StegoStylo: Squelching Stylometric Scrutiny through Steganographic Stitching
- Title(参考訳): StegoStylo:Squelching Stylometric Scrutiny through Steganography Stitching
- Authors: Robert Dilworth,
- Abstract要約: スティロメトリーは、著作権と盗作に関する調査を支援し、有害なコンテンツの検出を支援し、文学作品の歴史的文脈を提供する。
スティロメトリは著者認証のツールとして使われ、主張された著者から本質的なテキストが生まれるかどうかを確認する。
本稿では, ステガノグラフィーと対角的スタイメトリーを併用することにより, テガノグラフィーと対角的スタイメトリー分析を両立させる方法について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stylometry--the identification of an author through analysis of a text's style (i.e., authorship attribution)--serves many constructive purposes: it supports copyright and plagiarism investigations, aids detection of harmful content, offers exploratory cues for certain medical conditions (e.g., early signs of dementia or depression), provides historical context for literary works, and helps uncover misinformation and disinformation. In contrast, when stylometry is employed as a tool for authorship verification--confirming whether a text truly originates from a claimed author--it can also be weaponized for malicious purposes. Techniques such as de-anonymization, re-identification, tracking, profiling, and downstream effects like censorship illustrate the privacy threats that stylometric analysis can enable. Building on these concerns, this paper further explores how adversarial stylometry combined with steganography can counteract stylometric analysis. We first present enhancements to our adversarial attack, $\textit{TraceTarnish}$, providing stronger evidence of its capacity to confound stylometric systems and reduce their attribution and verification accuracy. Next, we examine how steganographic embedding can be fine-tuned to mask an author's stylistic fingerprint, quantifying the level of authorship obfuscation achievable as a function of the proportion of words altered with zero-width Unicode characters. Based on our findings, steganographic coverage of 33% or higher seemingly ensures authorship obfuscation. Finally, we reflect on the ways stylometry can be used to undermine privacy and argue for the necessity of defensive tools like $\textit{TraceTarnish}$.
- Abstract(参考訳): スティロメトリ(Stylometry) - 著者のスタイルの分析(すなわち、著者の帰属)を通じて著者を識別する - 著作権や盗作の捜査を支援し、有害な内容の検出を支援し、特定の医学的状態(例えば、認知症やうつ病の初期の兆候)に対する探索的手がかりを提供し、文学作品の歴史的文脈を提供し、誤情報や偽情報を明らかにする。
対照的に、著者認証のツールとしてスタイメトグラフィーを用いる場合、主張する著者から本質的なテキストが生まれるかどうかを確認し、悪意のある目的のために武器化することもできる。
匿名化、再識別、追跡、プロファイリング、検閲のような下流効果といったテクニックは、スタイル分析が実現可能なプライバシー上の脅威を示しています。
これらの懸念を踏まえて, ステガノグラフィーと対角的スタイメトリーの併用が, テガノグラフィーにどう対応できるかを考察した。
最初に、敵攻撃の強化である $\textit{TraceTarnish}$ を提示し、その利点と精度の低下を図った。
次に,著者のスタイリスティックな指紋を隠蔽するためにステガノグラフの埋め込みを微調整し,ゼロ幅のUnicode文字で変化した単語の割合の関数として達成可能な著者の難読度を定量化する方法について検討する。
以上の結果から,33%以上のステガノグラフィーが著明な難読化を保証していると考えられた。
最後に、我々は、プライバシーを損なうためにスタイロメトリを使用する方法について考察し、$\textit{TraceTarnish}$のような防御ツールの必要性を主張します。
関連論文リスト
- Tuning for TraceTarnish: Techniques, Trends, and Testing Tangible Traits [0.0]
攻撃スクリプト $textitTraceTarnish$ は、テキストベースのメッセージのオーサリングを匿名化するために、敵対的なスタイロメトリの原則を使用する。
Stylistometric cues--function-word frequency, Content-word distributions, and the Type-Token Ratio--は妥協の信頼できる指標として機能する。
論文 参考訳(メタデータ) (2025-12-03T05:39:40Z) - When Personalization Tricks Detectors: The Feature-Inversion Trap in Machine-Generated Text Detection [64.23509202768945]
パーソナライズされた設定における検出ロバスト性を評価するための最初のベンチマークであるデータセットを紹介する。
実験により, 個別設定における検出器間の性能差が大きいことが示された。
パーソナライズされた設定における検出性能変化を簡易かつ信頼性の高い予測方法を提案する。
論文 参考訳(メタデータ) (2025-10-14T13:10:23Z) - Semantic Visual Anomaly Detection and Reasoning in AI-Generated Images [96.43608872116347]
AnomReasonは4倍のtextbfAnomAgentのような構造化アノテーションを備えた大規模ベンチマーク
AnomReasonとAnomAgentは、AI生成画像の意味的妥当性の測定と改善の基盤となっている。
論文 参考訳(メタデータ) (2025-10-11T14:09:24Z) - Privacy-Preserving Biometric Verification with Handwritten Random Digit String [49.77172854374479]
手書き認証は、何十年もの間、安定したアイデンティティ認証方法として存在してきた。
しかし、この技術は、署名などの手書きバイオメトリックスに個人情報が組み込まれているため、潜在的なプライバシー侵害のリスクがある。
プライバシ保護による手書き文字の検証にRandom Digit String (RDS) を用いることを提案する。
論文 参考訳(メタデータ) (2025-03-17T03:47:25Z) - Mitigating Paraphrase Attacks on Machine-Text Detectors via Paraphrase Inversion [4.148732457277201]
高品質なパラフレーズは命令調整言語モデルを使って容易に生成できる。
x2013$$は、マシンテキスト検出器の性能を著しく低下させることで知られている。
本稿では,パラフレーズ付きテキストから元のテキストへのパラフレーズとして,この問題をフレーム化する手法を提案する。
論文 参考訳(メタデータ) (2024-10-29T00:46:24Z) - Neural Text Sanitization with Privacy Risk Indicators: An Empirical
Analysis [2.9311414545087366]
テキスト・サニタイズのための2段階のアプローチを検討し、その経験的性能を詳細に分析する。
テキストサニタイズプロセスは、プライバシー指向のエンティティ認識器から始まり、識別可能な個人情報を表すテキストを識別する。
本稿では,言語モデルの確率,テキストスパン分類,シーケンスラベリング,摂動,Web検索に基づく再識別リスクの指標を5つ提示する。
論文 参考訳(メタデータ) (2023-10-22T14:17:27Z) - Can Authorship Representation Learning Capture Stylistic Features? [5.812943049068866]
本研究では,サロゲートオーサシップ予測タスクで学習した表現が,実際に書体に敏感であることを示す。
結果として、著者の表現は、時間とともに話題が漂うような、ある種のデータシフトに対して堅牢であることが期待できる。
我々の発見は、スタイル転送のようなスタイル表現を必要とする下流アプリケーションへの扉を開くかもしれない。
論文 参考訳(メタデータ) (2023-08-22T15:10:45Z) - Can AI-Generated Text be Reliably Detected? [50.95804851595018]
大規模言語モデル(LLM)は、様々なアプリケーションで非常によく機能します。
盗作、偽ニュースの発生、スパムなどの活動においてこれらのモデルが誤用される可能性があることは、彼らの責任ある使用に対する懸念を引き起こしている。
我々は、攻撃者の存在下で、これらのAIテキスト検出装置の堅牢性を強調テストする。
論文 参考訳(メタデータ) (2023-03-17T17:53:19Z) - Verifying the Robustness of Automatic Credibility Assessment [50.55687778699995]
入力テキストにおける意味保存的変化がモデルを誤解させる可能性があることを示す。
また、誤情報検出タスクにおける被害者モデルと攻撃方法の両方をテストするベンチマークであるBODEGAについても紹介する。
我々の実験結果によると、現代の大規模言語モデルは、以前のより小さなソリューションよりも攻撃に対して脆弱であることが多い。
論文 参考訳(メタデータ) (2023-03-14T16:11:47Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Adversarial Stylometry in the Wild: Transferable Lexical Substitution
Attacks on Author Profiling [13.722693312120462]
敵対的スタイメトグラフィーは、著者のテキストを書き換えることでそのようなモデルを攻撃しようとする。
本研究は、これらの敵対的攻撃を野生に展開するためのいくつかのコンポーネントを提案する。
論文 参考訳(メタデータ) (2021-01-27T10:42:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。