論文の概要: CoreMark: Toward Robust and Universal Text Watermarking Technique
- arxiv url: http://arxiv.org/abs/2506.23066v1
- Date: Sun, 29 Jun 2025 02:57:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.700007
- Title: CoreMark: Toward Robust and Universal Text Watermarking Technique
- Title(参考訳): CoreMark:ロバストでユニバーサルなテキスト透かし技術を目指して
- Authors: Jiale Meng, Yiming Li, Zheming Lu, Zewei He, Hao Luo, Tianwei Zhang,
- Abstract要約: 本稿では,複数の黒画素セグメントを連続的に配置した新しい埋め込みパラダイムであるCOREを提案する。
COREに基づいて,CoreMarkというテキスト透かしフレームワークを提案する。
CoreMarkは、スクリーンショット、プリントスキャン、およびプリントカメラアタックに対する抵抗の大幅な改善を実現している。
- 参考スコア(独自算出の注目度): 18.52027130687945
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text watermarking schemes have gained considerable attention in recent years, yet still face critical challenges in achieving simultaneous robustness, generalizability, and imperceptibility. This paper introduces a new embedding paradigm,termed CORE, which comprises several consecutively aligned black pixel segments. Its key innovation lies in its inherent noise resistance during transmission and broad applicability across languages and fonts. Based on the CORE, we present a text watermarking framework named CoreMark. Specifically, CoreMark first dynamically extracts COREs from characters. Then, the characters with stronger robustness are selected according to the lengths of COREs. By modifying the thickness of the CORE, the hidden data is embedded into the selected characters without causing significant visual distortions. Moreover, a general plug-and-play embedding strength modulator is proposed, which can adaptively enhance the robustness for small font sizes by adjusting the embedding strength according to the font size. Experimental evaluation indicates that CoreMark demonstrates outstanding generalizability across multiple languages and fonts. Compared to existing methods, CoreMark achieves significant improvements in resisting screenshot, print-scan, and print camera attacks, while maintaining satisfactory imperceptibility.
- Abstract(参考訳): 近年、テキスト透かし方式は注目されているが、同時に堅牢性、一般化可能性、そして非受容性を達成する上で重要な課題に直面している。
本稿では,複数の黒画素セグメントを連続的に配置した新しい埋め込みパラダイムであるCOREを提案する。
その重要なイノベーションは、トランスミッション中の固有のノイズ耐性と、言語やフォントにまたがる幅広い適用性にある。
COREに基づいて,CoreMarkというテキスト透かしフレームワークを提案する。
特にCoreMarkは、まず文字からCOREを動的に抽出する。
次に、COREの長さに応じて強靭性を有する文字を選択する。
COREの厚さを変更することで、隠れたデータを選択した文字に埋め込むことができ、視覚的な歪みを生じさせない。
また,フォントサイズに応じて組込み強度を調整することで,小型フォントサイズに対するロバスト性を適応的に向上させることができる汎用プラグアンドプレイ組込み強度変調器を提案する。
実験により、CoreMarkは複数の言語やフォントにまたがる卓越した一般化性を示している。
既存の方法と比較して、CoreMarkは、十分な認識不能を維持しながら、スクリーンショット、プリントスキャン、およびプリントカメラアタックに対する抵抗の大幅な改善を実現している。
関連論文リスト
- KGMark: A Diffusion Watermark for Knowledge Graphs [9.42304926024755]
KGMARKは、堅牢で検出可能な透明な拡散指紋を生成するグラフ透かしフレームワークである。
本稿では,スワップマークを空間変動に適応させるクラスタリングに基づくアライメント手法を提案する。
また,拡散指紋の透明性を高めるために,新しい学習可能なマスクマトリックスを導入する。
論文 参考訳(メタデータ) (2025-05-29T12:28:05Z) - Improved Unbiased Watermark for Large Language Models [59.00698153097887]
本稿では,非バイアスのマルチチャネル型透かしであるMCmarkを紹介する。
MCmarkは言語モデルの本来の分布を保存する。
既存の非バイアスの透かしよりも検出性と堅牢性を大幅に改善する。
論文 参考訳(メタデータ) (2025-02-16T21:02:36Z) - Topic-Based Watermarks for Large Language Models [46.71493672772134]
本稿では,Large Language Model (LLM) 出力のための軽量なトピック誘導型透かし方式を提案する。
本手法は,Google の SynthID-Text など,業界をリードするシステムに匹敵する難易度を実現する。
論文 参考訳(メタデータ) (2024-04-02T17:49:40Z) - Improving the Generation Quality of Watermarked Large Language Models
via Word Importance Scoring [81.62249424226084]
トークンレベルの透かしは、トークン確率分布を変更して生成されたテキストに透かしを挿入する。
この透かしアルゴリズムは、生成中のロジットを変化させ、劣化したテキストの品質につながる可能性がある。
We propose to improve the quality of texts generated by a watermarked language model by Watermarking with Importance Scoring (WIS)。
論文 参考訳(メタデータ) (2023-11-16T08:36:00Z) - Practical Deep Dispersed Watermarking with Synchronization and Fusion [10.633580224539337]
我々は,textbfSynchronization と textbfFusion を併用した,実践的なdeep textbfDispersed textbfWatermarkingを提案する。
我々の盲目透かしは、平均してビット精度を5.28%改善し、5.93%を単独攻撃と組み合わせ攻撃に対して改善することができる。
論文 参考訳(メタデータ) (2023-10-23T03:34:05Z) - A Resilient and Accessible Distribution-Preserving Watermark for Large Language Models [65.40460716619772]
本研究は,textbfDistribution-textbf Preserving (DiP)ウォーターマークの重要性に焦点をあてる。
現在の戦略とは対照的に,提案したDiPmarkは透かし中に元のトークン分布を同時に保存する。
言語モデルAPIにアクセスせずに検出可能で(アクセス可能)、トークンの適度な変更に対して確実に堅牢である。
論文 参考訳(メタデータ) (2023-10-11T17:57:35Z) - Towards Tracing Code Provenance with Code Watermarking [37.41260851333952]
我々は、ビット文字列を変数に隠蔽し、コードの自然的および操作的意味論を尊重する電子透かしシステムであるCodeMarkを提案する。
自然性のために、我々は、グラフニューラルネットワーク上のコンテキストにおいてよりコヒーレントな透かし変数を生成するためのコンテキスト透かし方式を導入する。
CodeMarkは、透かし要求のバランスが良く、SOTA透かしシステムより優れていることを示す。
論文 参考訳(メタデータ) (2023-05-21T13:53:12Z) - Self-supervised Character-to-Character Distillation for Text Recognition [54.12490492265583]
そこで本研究では,テキスト表現学習を容易にする汎用的な拡張を可能にする,自己教師型文字-文字-文字間蒸留法CCDを提案する。
CCDは、テキスト認識の1.38%、テキストセグメンテーションの1.7%、PSNRの0.24dB、超解像の0.0321(SSIM)で、最先端の結果を達成する。
論文 参考訳(メタデータ) (2022-11-01T05:48:18Z) - DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in
Transformer [94.35116535588332]
ポリゴン点やベジエ曲線制御点を予測してテキストをローカライズするトランスフォーマーベースの手法は、シーンテキストの検出で非常に人気がある。
しかし、使用点ラベル形式は、トランスフォーマーモデルの堅牢性に影響を与える人間の読み順を意味する。
本稿では,DPText-DETRを提案する。これはクエリとしてポイント座標を直接使用し,デコーダ層間で動的に更新する。
論文 参考訳(メタデータ) (2022-07-10T15:45:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。