論文の概要: Differentially-Private Text Rewriting reshapes Linguistic Style
- arxiv url: http://arxiv.org/abs/2604.26656v1
- Date: Wed, 29 Apr 2026 13:23:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.417966
- Title: Differentially-Private Text Rewriting reshapes Linguistic Style
- Title(参考訳): 文の書き直しが言語的スタイルに変化
- Authors: Stefan Arnold,
- Abstract要約: テキストの差分プライバシーは、不連続な単語レベルの置換から連続的な文レベルの書き換えへと成熟した。
プライバシ制約下での書き換えは、テキストの通信署名の体系的な機能的変異を引き起こす。
このレジスタ・ブラインド・サニタイゼーションはセマンティック・コンテントを効果的に保存するが、ヒューマン・オーソライズド・言論を定義するニュアンスド・スタイリスティック・マーカーを構造的に均質化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Differential Privacy (DP) for text matured from disjointed word-level substitutions to contiguous sentence-level rewriting by leveraging the generative capacity of language models. While this form of text privatization is best suited for balancing formal privacy guarantees with grammatical coherence, its impact on the register identity of text remains largely unexplored. By conducting a multidimensional stylistic profiling of differentially-private rewriting, we demonstrate that the cost of privacy extends far beyond lexical variation. Specifically, we find that rewriting under privacy constraints induces a systematic functional mutation of the text's communicative signature. This shift is characterized by the severe attrition of interactive markers, contextual references, and complex subordination. By comparing autoregressive paraphrasing against bidirectional substitution across a spectrum of privacy budgets, we observe that both architectures force convergence toward a non-involved and non-persuasive register. This register-blind sanitization effectively preserves semantic content but structurally homogenizes the nuanced stylistic markers that define human-authored discourse.
- Abstract(参考訳): テキストの差分プライバシー(DP)は, 言語モデルの生成能力を活用して, 単語レベルの相違から連続的な文レベルの書き換えへと成熟した。
この形式のテキストの民営化は、形式的なプライバシー保証と文法的一貫性のバランスをとるのに最も適しているが、そのテキストのレジスターアイデンティティへの影響はほとんど解明されていない。
微分プライベートな書き換えの多次元スタイリスティックなプロファイリングを行うことにより、プライバシのコストが語彙的変動を超えることを実証する。
具体的には、プライバシ制約下での書き換えは、テキストの通信署名の体系的な機能的突然変異を引き起こす。
このシフトは、対話的マーカー、文脈参照、複雑な部分順序の厳格な誘惑によって特徴づけられる。
プライバシー予算の多岐にわたる双方向置換に対する自己回帰的言い換えを比較することで、両アーキテクチャが非包摂的かつ非包摂的レジスタに向けて収束を強要することを観察する。
このレジスタ・ブラインド・サニタイゼーションはセマンティック・コンテントを効果的に保存するが、ヒューマン・オーソライズド・言論を定義するニュアンスド・スタイリスティック・マーカーを構造的に均質化する。
関連論文リスト
- Zero-Shot Privacy-Aware Text Rewriting via Iterative Tree Search [60.197239728279534]
クラウドベースのサービスにおける大規模言語モデル(LLM)は、重大なプライバシー上の懸念を引き起こしている。
既存のテキスト匿名化と、ルールベースのリアクションやスクラブのような非識別技術は、プライバシー保護とテキストの自然性と実用性のバランスをとるのに苦労することが多い。
我々は,一貫性,妥当性,自然性を保ちながら,秘密情報を体系的に難読化・削除するゼロショット木探索型反復文書き換えアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-09-25T07:23:52Z) - Inspecting the Representation Manifold of Differentially-Private Text [0.0]
様々なプライバシー予算にまたがるパラフレーズテキストの本質的な次元を推定する。
単語レベルの手法は表現多様体を著しく高める。
自己回帰生成は、表現空間をカスケードし拡大する不自然な単語選択からの歪みを伝播させることを提案する。
論文 参考訳(メタデータ) (2025-03-19T08:36:58Z) - Instilling Multi-round Thinking to Text-guided Image Generation [72.2032630115201]
シングルラウンド世代は、特に靴やスリーブのようなきめ細かい変更の領域において、重要な詳細を見落としていることが多い。
既存の手法と互換性のある,新たな自己監督型正規化,すなわちマルチラウンド正規化を導入する。
修正順序が最終結果に概して影響を与えないという観察に基づいている。
論文 参考訳(メタデータ) (2024-01-16T16:19:58Z) - Disentangling the Linguistic Competence of Privacy-Preserving BERT [0.0]
差別化プライバシ(DP)は、テキストからテキストへの民営化というユニークな課題に対処するために調整されている。
我々は、摂動前文で訓練されたBERTから抽出した内部表現に対して、一連の解釈手法を用いる。
この相違点を解き放つために探索的タスクを用いることで、テキストからテキストへの民営化がいくつかの形式主義における言語能力に影響を及ぼす証拠を見出す。
論文 参考訳(メタデータ) (2023-10-17T16:00:26Z) - Don't lose the message while paraphrasing: A study on content preserving
style transfer [61.38460184163704]
スタイル伝達研究の現実的な応用には,コンテンツ保存が不可欠である。
形式性伝達領域の例において、様々なスタイル転送モデルを比較する。
我々は,スタイル伝達のための最先端技術について,精密な比較研究を行っている。
論文 参考訳(メタデータ) (2023-08-17T15:41:08Z) - Improving Joint Speech-Text Representations Without Alignment [92.60384956736536]
本研究では, 連続長を無視することで, 音節間の一貫した表現を自然に実現できることを示す。
一貫性の喪失は長さの差を許し、最適のアライメントを前提にできると我々は主張する。
論文 参考訳(メタデータ) (2023-08-11T13:28:48Z) - Guiding Text-to-Text Privatization by Syntax [0.0]
メトリック微分プライバシー(Metric Differential Privacy)は、テキストからテキストへのプライベート化というユニークな課題に対処するために設計された、差分プライバシーの一般化である。
置換後の単語の文法的カテゴリを保存するために,テキスト・テキスト・プライベート化の能力を分析する。
我々は、民営化のステップを、置換が一致した文法特性を持つ単語に向けられる候補選択問題に変換する。
論文 参考訳(メタデータ) (2023-06-02T11:52:21Z) - DP-BART for Privatized Text Rewriting under Local Differential Privacy [2.45626162429986]
本稿では,既存の LDP システムに大きく勝る新システム "DP-BART" を提案する。
提案手法では,新たなクリッピング手法,反復的プルーニング,およびDP保証に必要なノイズを劇的に低減する内部表現の訓練を用いる。
論文 参考訳(メタデータ) (2023-02-15T13:07:34Z) - Semantics-Preserved Distortion for Personal Privacy Protection in Information Management [65.08939490413037]
本稿では,意味的整合性を維持しつつテキストを歪ませる言語学的アプローチを提案する。
本稿では, 意味保存歪みの枠組みとして, 生成的アプローチと置換的アプローチの2つを提示する。
また、特定の医療情報管理シナリオにおけるプライバシ保護についても検討し、機密データの記憶を効果的に制限していることを示す。
論文 参考訳(メタデータ) (2022-01-04T04:01:05Z) - Improving Disentangled Text Representation Learning with
Information-Theoretic Guidance [99.68851329919858]
自然言語の独特な性質は、テキスト表現の分離をより困難にする。
情報理論にインスパイアされた本研究では,テキストの不整合表現を効果的に表現する手法を提案する。
条件付きテキスト生成とテキストスタイル転送の両方の実験は、不整合表現の質を実証する。
論文 参考訳(メタデータ) (2020-06-01T03:36:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。