論文の概要: Tuning for TraceTarnish: Techniques, Trends, and Testing Tangible Traits
- arxiv url: http://arxiv.org/abs/2512.03465v1
- Date: Wed, 03 Dec 2025 05:39:40 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:11:22.077288
- Title: Tuning for TraceTarnish: Techniques, Trends, and Testing Tangible Traits
- Title(参考訳): TraceTarnishのチューニング - テクニック,トレンド,テスト
- Authors: Robert Dilworth,
- Abstract要約: 攻撃スクリプト $textitTraceTarnish$ は、テキストベースのメッセージのオーサリングを匿名化するために、敵対的なスタイロメトリの原則を使用する。
Stylistometric cues--function-word frequency, Content-word distributions, and the Type-Token Ratio--は妥協の信頼できる指標として機能する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In this study, we more rigorously evaluated our attack script $\textit{TraceTarnish}$, which leverages adversarial stylometry principles to anonymize the authorship of text-based messages. To ensure the efficacy and utility of our attack, we sourced, processed, and analyzed Reddit comments--comments that were later alchemized into $\textit{TraceTarnish}$ data--to gain valuable insights. The transformed $\textit{TraceTarnish}$ data was then further augmented by $\textit{StyloMetrix}$ to manufacture stylometric features--features that were culled using the Information Gain criterion, leaving only the most informative, predictive, and discriminative ones. Our results found that function words and function word types ($L\_FUNC\_A$ $\&$ $L\_FUNC\_T$); content words and content word types ($L\_CONT\_A$ $\&$ $L\_CONT\_T$); and the Type-Token Ratio ($ST\_TYPE\_TOKEN\_RATIO\_LEMMAS$) yielded significant Information-Gain readings. The identified stylometric cues--function-word frequencies, content-word distributions, and the Type-Token Ratio--serve as reliable indicators of compromise (IoCs), revealing when a text has been deliberately altered to mask its true author. Similarly, these features could function as forensic beacons, alerting defenders to the presence of an adversarial stylometry attack; granted, in the absence of the original message, this signal may go largely unnoticed, as it appears to depend on a pre- and post-transformation comparison. "In trying to erase a trace, you often imprint a larger one." Armed with this understanding, we framed $\textit{TraceTarnish}$'s operations and outputs around these five isolated features, using them to conceptualize and implement enhancements that further strengthen the attack.
- Abstract(参考訳): 本研究では,テキストベースのメッセージのオーサリングを匿名化するために,文体論の原則を活用する攻撃スクリプト $\textit{TraceTarnish}$ をより厳格に評価する。
攻撃の有効性と有用性を確保するため、Redditのコメントをソースし、処理し、分析した。
変換された$\textit{TraceTarnish}$データは、次に$\textit{StyloMetrix}$によってさらに強化され、インフォメーション・ゲイン・クリーテリオン(Information Gain criterion)を使用して作成され、最も情報的で予測的で差別的な機能だけを残した。
その結果,関数語と関数語は$L\_FUNC\_A$ $\&$$L\_FUNC\_T$,コンテンツ語とコンテンツ語は$L\_CONT\_T$,Type-Token Ratio$ST\_TYPE\_TOKEN\_RATIO\_LEMMAS$であった。
テキストが故意に修正され、その真の著者を隠蔽するかどうかを明らかにするための、テクスチャ的キュー-関数-ワード頻度、コンテント-ワード分布、タイプ-トークン比が、妥協の信頼できる指標(IoCs)として機能する。
同様に、これらの機能は法医学的なビーコンとして機能し、敵のスタイメトリー攻撃の存在をディフェンダーに警告する。
「跡を消そうとすると、しばしば大きなものを刻む。」
この理解に則り、$\textit{TraceTarnish}$の操作とこれら5つの独立した機能に関する出力をフレーム化し、攻撃をさらに強化する拡張を概念化し実装しました。
関連論文リスト
- Feedback Descent: Open-Ended Text Optimization via Pairwise Comparison [48.89195616081196]
Feedback Descentは、構造化されたテキストフィードバックを通じてテキストアーティファクト(プロンプト、コード、分子)を最適化するフレームワークである。
テキスト内学習は、構造化されたフィードバックを勾配のような方向情報に変換し、ターゲットとなる編集を可能にする。
DOCKSTRINGの分子探索ベンチマークにおいて、Feedback Descentは6つのタンパク質標的に対して260,000ドル以上の化合物を持つデータベースの99.9ドルのパーセンタイルを超える新規な薬物様分子を同定した。
論文 参考訳(メタデータ) (2025-11-11T07:14:13Z) - When Personalization Tricks Detectors: The Feature-Inversion Trap in Machine-Generated Text Detection [64.23509202768945]
パーソナライズされた設定における検出ロバスト性を評価するための最初のベンチマークであるデータセットを紹介する。
実験により, 個別設定における検出器間の性能差が大きいことが示された。
パーソナライズされた設定における検出性能変化を簡易かつ信頼性の高い予測方法を提案する。
論文 参考訳(メタデータ) (2025-10-14T13:10:23Z) - Towards Bridging Review Sparsity in Recommendation with Textual Edge Graph Representation [28.893058826607735]
本稿では,意味的信号と構造的信号とを共同でモデル化することで,欠落レビューを示唆する統一的なフレームワークを提案する。
AmazonとGoodreadsデータセットの実験は、TWISTERが従来の数値、グラフベース、LLMベースラインを一貫して上回っていることを示している。
要約すると、TWISTERはより有用で、本物で、特定のレビューを生成し、構造的なシグナルを滑らかにすることで推奨を改善する。
論文 参考訳(メタデータ) (2025-08-02T00:53:40Z) - Towards Generalized and Training-Free Text-Guided Semantic Manipulation [123.80467566483038]
テキスト誘導意味操作は、ソースプロンプトから生成された画像をセマンティックに編集し、ターゲットプロンプトにマッチさせる。
本稿では,テキスト案内型セマンティック操作のための新しい$textitGTF$を提案する。
本実験は,本手法の有効性を実証し,セマンティックス操作の最先端化の可能性を強調した。
論文 参考訳(メタデータ) (2025-04-24T05:54:56Z) - Breaking BERT: Gradient Attack on Twitter Sentiment Analysis for Targeted Misclassification [0.0]
Transformers BERTの双方向表現は感情分析に広く応用されている。
BERTは敵の攻撃を受けやすい。
本稿は、Twitterの感情分析におけるそのようなモデル固有の脆弱性を精査することを目的としている。
論文 参考訳(メタデータ) (2025-04-02T04:21:19Z) - Discourse Features Enhance Detection of Document-Level Machine-Generated Content [53.41994768824785]
機械生成コンテンツは、学術プラジャリズムや誤報の拡散といった課題を提起する。
既存のMGC検出器は、しばしば表面レベルの情報のみに焦点を当て、暗黙的かつ構造的な特徴を見渡す。
これらの課題を克服するために、新しい方法論とデータセットを導入します。
論文 参考訳(メタデータ) (2024-12-17T08:47:41Z) - Integrating Bidirectional Long Short-Term Memory with Subword Embedding
for Authorship Attribution [2.3429306644730854]
マニフォールド語に基づくスタイリスティックマーカーは、著者帰属の本質的な問題に対処するために、ディープラーニング手法でうまく使われてきた。
提案手法は,CCAT50,IMDb62,Blog50,Twitter50の公営企業における最先端手法に対して実験的に評価された。
論文 参考訳(メタデータ) (2023-06-26T11:35:47Z) - Towards Variable-Length Textual Adversarial Attacks [68.27995111870712]
データの離散性のため、自然言語処理タスクに対してテキストによる敵意攻撃を行うことは非自明である。
本稿では,可変長テキスト対比攻撃(VL-Attack)を提案する。
本手法は、iwslt14ドイツ語英訳で3,18$ bleuスコアを達成でき、ベースラインモデルより1.47$改善できる。
論文 参考訳(メタデータ) (2021-04-16T14:37:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。