論文の概要: Anchored Sliding Window: Toward Robust and Imperceptible Linguistic Steganography
- arxiv url: http://arxiv.org/abs/2604.09066v1
- Date: Fri, 10 Apr 2026 07:44:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.758283
- Title: Anchored Sliding Window: Toward Robust and Imperceptible Linguistic Steganography
- Title(参考訳): アンコレッドスライディングウィンドウ:ロバストで知覚不能な言語ステレオグラフィへ向けて
- Authors: Ruiyi Yan, Shiao Meng, Yugo Murawaki,
- Abstract要約: 本稿では,非受容性とロバスト性を改善するためのアンカード・スライディング・ウインドウ(ASW)フレームワークを提案する。
最新のトークンに加えて、プロンプトとブリッジコンテキストはコンテキストウィンドウ内に固定され、排除されたトークンを補うようモデルに促される。
実験の結果, ASWはテキストの品質, 知覚不能性, 堅牢性において, 基本的手法を著しく上回っていることがわかった。
- 参考スコア(独自算出の注目度): 7.46830613231036
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Linguistic steganography based on language models typically assumes that steganographic texts are transmitted without alteration, making them fragile to even minor modifications. While previous work mitigates this fragility by limiting the context window, it significantly compromises text quality. In this paper, we propose the anchored sliding window (ASW) framework to improve imperceptibility and robustness. In addition to the latest tokens, the prompt and a bridge context are anchored within the context window, encouraging the model to compensate for the excluded tokens. We formulate the optimization of the bridge context as a variant of prompt distillation, which we further extend using self-distillation strategies. Experiments show that our ASW significantly and consistently outperforms the baseline method in text quality, imperceptibility, and robustness across diverse settings. The code is available at github.com/ryehr/ASW_steganography.
- Abstract(参考訳): 言語モデルに基づく言語的ステガノグラフィーは、典型的には、ステガノグラフィーのテクストは変更なしに伝達されると仮定し、小さな修正までも脆弱である。
以前の作業では、コンテキストウィンドウを制限することで、この脆弱性を軽減していましたが、テキストの品質を著しく損ないます。
本稿では,非受容性とロバスト性を改善するためのアンカード・スライディング・ウインドウ(ASW)フレームワークを提案する。
最新のトークンに加えて、プロンプトとブリッジコンテキストはコンテキストウィンドウ内に固定され、排除されたトークンを補うようモデルに促される。
本稿では, 直接蒸留の変種としてブリッジ・コンテクストの最適化を定式化し, さらに自己蒸留戦略を用いて拡張する。
実験の結果、ASWはテキストの品質、非受容性、各種設定における堅牢性において、ベースライン法を著しく、一貫して上回っていることがわかった。
コードはgithub.com/ryehr/ASW_steganographyで入手できる。
関連論文リスト
- Diff-Aid: Inference-time Adaptive Interaction Denoising for Rectified Text-to-Image Generation [41.431041419460584]
ディフエイド(Diff-Aid)は、トランスフォーマーブロック間のテキストと画像の相互作用を調整する軽量な推論時間法である。
プラグイン・アンド・プレイモジュールとして、Diff-Aidはダウンストリームアプリケーションにシームレスに統合され、さらなる改善が期待できる。
論文 参考訳(メタデータ) (2026-02-14T04:08:05Z) - VISTA-Bench: Do Vision-Language Models Really Understand Visualized Text as Well as Pure Text? [51.02924254085878]
VLM(Vision-Language Models)は、テキスト入力と視覚入力のクロスモーダル理解において、優れたパフォーマンスを実現している。
VISTA-Benchは、マルチモーダル認識、推論、および非モーダル理解領域のベンチマークである。
論文 参考訳(メタデータ) (2026-02-04T17:48:55Z) - Towards Continual Expansion of Data Coverage: Automatic Text-guided Edge-case Synthesis [1.0152838128195467]
テキスト誘導エッジケース合成のための自動パイプラインを提案する。
提案手法では、画像キャプションの言い換えに、好みの学習によって微調整されたLarge Language Modelを用いる。
この作業は、データキュレーションを手作業から自動化されたターゲット合成に移行する、スケーラブルなフレームワークを確立する。
論文 参考訳(メタデータ) (2025-09-30T12:11:25Z) - Beyond Magic Words: Sharpness-Aware Prompt Evolving for Robust Large Language Models with TARE [57.67972800581953]
そこで,本論文では,プロンプトをハードパラフレーズで強調する内的,サンプリングに基づく逆探索を交互に行う,デリバティブフリーなフレームワークTAREを紹介する。
また,意味的近傍を形成するために異方性重みを学習し,時間とともに半径を調整し,探索と忠実性のバランスをとるATAREを提案する。
論文 参考訳(メタデータ) (2025-09-28T23:57:05Z) - ControlThinker: Unveiling Latent Semantics for Controllable Image Generation through Visual Reasoning [76.2503352325492]
ControlThinkerは、"Comprehend-then-generate"パラダイムを採用した、新しいフレームワークである。
制御画像からの潜在セマンティクスは、テキストプロンプトを豊かにするためにマイニングされる。
このリッチなセマンティック理解は、追加の複雑な修正を必要とせずに、画像生成をシームレスに支援する。
論文 参考訳(メタデータ) (2025-06-04T05:56:19Z) - Towards Visual Text Design Transfer Across Languages [49.78504488452978]
マルチモーダル・スタイル翻訳(MuST-Bench)の新たな課題について紹介する。
MuST-Benchは、視覚テキスト生成モデルが様々な書き込みシステム間で翻訳を行う能力を評価するために設計されたベンチマークである。
そこで我々は,スタイル記述の必要性を解消する多モーダルなスタイル翻訳フレームワークであるSIGILを紹介した。
論文 参考訳(メタデータ) (2024-10-24T15:15:01Z) - CLAP: Isolating Content from Style through Contrastive Learning with Augmented Prompts [11.752632557524969]
コンテンツの特徴を元の表現から切り離すために,データ拡張によるコントラスト学習を提案する。
多様なデータセットを対象とした実験では、ゼロショットと少数ショットの分類タスクが大幅に改善された。
論文 参考訳(メタデータ) (2023-11-28T03:00:59Z) - LayoutLLM-T2I: Eliciting Layout Guidance from LLM for Text-to-Image
Generation [121.45667242282721]
レイアウト計画と画像生成を実現するための粗大なパラダイムを提案する。
提案手法は,フォトリアリスティックなレイアウトと画像生成の観点から,最先端のモデルよりも優れている。
論文 参考訳(メタデータ) (2023-08-09T17:45:04Z) - Bridge the Gap Between CV and NLP! A Gradient-based Textual Adversarial
Attack Framework [17.17479625646699]
そこで本研究では,テキストの敵対的サンプルを作成するための統一的なフレームワークを提案する。
本稿では,T-PGD(Textual Projected Gradient Descent)という攻撃アルゴリズムを用いて,我々のフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2021-10-28T17:31:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。