Fugu-MT 論文翻訳(概要): LLsM: Generative Linguistic Steganography with Large Language Model

論文の概要: LLsM: Generative Linguistic Steganography with Large Language Model

arxiv url: http://arxiv.org/abs/2401.15656v1
Date: Sun, 28 Jan 2024 13:21:44 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-30 17:02:23.482702
Title: LLsM: Generative Linguistic Steganography with Large Language Model
Title（参考訳）: LLsM:大規模言語モデルを用いた言語ステレオグラフィ
Authors: Yihao Wang and Ruiqi Song and Ru Zhang and Jianyi Liu and Lingxiao Li
Abstract要約: 言語ステガノグラフィー(LS)タスクは、秘密情報に基づいてステガノグラフィーテキスト(ステゴ)を生成することを目的としている。本稿では,Large Language Model(LLM)に基づくジェネレーティブLSであるLLsMという新しいスキームを提案する。実験により、LLsMはテキストの品質、統計分析、談話マッチング、アンチステガナリシスに関する一般的なベースラインよりも優れていることが示された。
参考スコア（独自算出の注目度）: 11.503978748679495
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Linguistic Steganography (LS) tasks aim to generate steganographic texts (stego) based on secret information. Only authorized recipients can perceive the existence of secret information in the texts and accurately extract it, thereby preserving privacy. However, the controllability of the stego generated by existing schemes is poor, and the generated stego is difficult to contain specific discourse characteristics such as style, genre, and theme. As a result, the stego are often easily detectable, compromising covert communication. To address these problems, this paper proposes a novel scheme named LLsM, a generative LS based on a Large Language Model (LLM). We fine-tuned the LLM LLaMA2 with a large-scale constructed dataset encompassing rich discourse characteristics, which enables the fine-tuned LLM to generate texts with specific discourse in a controllable manner. Then the discourse characteristics are used as guiding information and inputted into the fine-tuned LLM in the form of Prompt together with secret information. The candidate pool, derived from sampling and truncation, undergoes range encoding to ensure the stego imitate natural text distribution. Experiments demonstrate that LLsM performs superior to prevalent baselines regarding text quality, statistical analysis, discourse matching, and anti-steganalysis. In particular, LLsM's MAUVE surpasses that of some baselines by 70%-80%, and its anti-steganalysis performance is 30%-40% higher. Notably, we also present the long stego generated by LLsM, showing its potential superiority in long LS tasks.
Abstract（参考訳）: 言語ステガノグラフィー(LS)タスクは、秘密情報に基づいてステガノグラフィーテキスト(ステゴ)を生成することを目的としている。認証を受けた受取人だけが、テキスト内の秘密情報の存在を認識し、それを正確に抽出することで、プライバシーを保護できる。しかし,既存のスキームによるステゴの制御性は乏しく,スタイルやジャンル,テーマといった特定の談話の特徴を取り入れることは困難である。その結果、ステゴは容易に検出でき、カバート通信を妥協する。これらの問題に対処するため,本稿では,大言語モデル(llm)に基づく生成型lssであるllsmという新しいスキームを提案する。我々は、llm llama2を、リッチな談話特性を包含する大規模構築データセットで微調整し、特定の談話を含むテキストを制御可能な方法で生成できるようにした。そして、この談話特性を案内情報として使用し、秘密情報とともにPmpt形式で微調整LDMに入力する。サンプリングおよび切り離しから導かれた候補プールは、ステゴが自然なテキスト分布を模倣するようにレンジエンコーディングを行う。実験により、llsmは、テキスト品質、統計分析、談話マッチング、アンチステグアナリシスに関する一般的なベースラインよりも優れていることが示されている。特にllsmのmauveは、いくつかのベースラインを70%-80%上回っており、その反ステグアナライザ性能は30%-40%高い。また,LLsMが生成する長長のステゴを提示し,長長のLSタスクにおいてその潜在的な優位性を示す。

関連論文リスト

Coin selection by Random Draw according to the Boltzmann distribution [0.13048920509133805]
本稿では統計物理学の原理に着想を得た確率論的アルゴリズムであるボルツマン・ドローを提案する。このアルゴリズムはボルツマン分布に従ってトークンを描画することに依存しており、ランダムドロー法の拡張と改善の役割を果たしている。数値計算により, 選択した入力トークン数と, ダスト発生の低減, ウォレット内のトークンプールサイズの制限効果が示された。
論文参考訳（メタデータ） (2026-02-19T16:00:21Z)
Beyond Imitation: Reinforcement Learning for Active Latent Planning [18.05072303874982]
潜時推論メソッド個別の言語トークンを連続的な潜時トークンで置換するために、大言語モデルを微調整する。現在の潜在トークンは一般的に、言語ラベルの模倣に基づいて管理される。本稿では, ATP-Latentを条件付き変分自動エンコーダとして, 遅延トークンの監視過程をモデル化する。
論文参考訳（メタデータ） (2026-01-29T12:07:16Z)
LMK > CLS: Landmark Pooling for Dense Embeddings [18.49372789918725]
ランドマーク(LMK)プーリングを導入し、シーケンスをチャンクに分割し、チャンク間にランドマークトークンを挿入し、ランドマークトークンの埋め込みを平均プールすることで最終表現を形成する。この単純なメカニズムは、少数の特別なトークンを導入するコストで、局所的な有能な特徴を犠牲にすることなく、長文の外挿を改善する。
論文参考訳（メタデータ） (2026-01-29T10:40:37Z)
SCOPE: Saliency-Coverage Oriented Token Pruning for Efficient Multimodel LLMs [59.415473779171315]
textbfSaliency-textbfCoverage textbfOriented token textbfPruning for textbfEfficient MLLMs。
論文参考訳（メタデータ） (2025-10-28T09:29:37Z)
Exploiting Discriminative Codebook Prior for Autoregressive Image Generation [54.14166700058777]
トークンベースの自己回帰画像生成システムは、まずトークンインデックスのシーケンスをコードブックでトークン化し、次にこれらのシーケンスを自己回帰パラダイムでモデル化する。自己回帰生成モデルはインデックス値のみに基づいて訓練されるが、豊富なトークン類似性情報を含むコードブックにエンコードされた前者は利用されない。近年の研究では、トークン上に単純なk平均クラスタリングを行い、コードブックを減らした生成モデルのトレーニングを容易にすることで、これを先に組み込もうとしている。 k-meansの代替として、差別的コードブック先駆者(DCPE)を提案する。
論文参考訳（メタデータ） (2025-08-14T15:00:00Z)
IGD: Token Decisiveness Modeling via Information Gain in LLMs for Personalized Recommendation [70.2753541780788]
我々は,トークン決定性をチューニングと復号の両方に統合する情報ゲインに基づく決定性対応トークンハンドリング(IGD)戦略を導入する。 IGDはリコメンデーションの精度を一貫して改善し、強力なベースラインに比べて広く使われているランキングの指標で顕著に向上した。
論文参考訳（メタデータ） (2025-06-16T08:28:19Z)
Generating Long Semantic IDs in Parallel for Recommendation [29.97624755406803]
セマンティックIDベースのリコメンデーションのための軽量フレームワークであるRPGを提案する。我々は、マルチトークン予測損失を用いて、各トークンを独立して予測するようにモデルを訓練する。実験の結果、セマンティックIDの長さを64にスケールアップすることで、RPGは生成ベースラインを上回ります。
論文参考訳（メタデータ） (2025-06-06T06:20:37Z)
FIRP: Faster LLM inference via future intermediate representation prediction [54.897493351694195]
FIRPはデコードステップ毎に1つではなく複数のトークンを生成する。いくつかのモデルとデータセットで1.9x-3xのスピードアップ比を示す広範な実験を行った。
論文参考訳（メタデータ） (2024-10-27T15:53:49Z)
Contextualized Sequence Likelihood: Enhanced Confidence Scores for Natural Language Generation [37.63939774027709]
種々のトークンに異なる重みを割り当てることで予測シーケンス確率を向上させることを提案する。我々はこの新しいスコアを文脈化シーケンス類似度(CSL)と呼ぶ。
論文参考訳（メタデータ） (2024-06-03T21:55:07Z)
Parallel Decoding via Hidden Transfer for Lossless Large Language Model Acceleration [54.897493351694195]
本稿では,複数連続するトークンを1つのフォワードパスで同時に復号する,新しい並列復号法,すなわちthithidden Transferを提案する。加速度測定では,Medusa や Self-Speculative decoding など,単モデル加速技術よりも優れています。
論文参考訳（メタデータ） (2024-04-18T09:17:06Z)
Provably Secure Disambiguating Neural Linguistic Steganography [66.30965740387047]
サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。 SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文参考訳（メタデータ） (2024-03-26T09:25:57Z)
GEC-DePenD: Non-Autoregressive Grammatical Error Correction with Decoupled Permutation and Decoding [52.14832976759585]
文法的誤り訂正(GEC)は、通常自己回帰的なシーケンス・ツー・シーケンスモデルで解決される重要なNLPタスクである。本稿では, アーキテクチャを置換ネットワークに分離する, GEC に対する非自己回帰的アプローチを提案する。 GECの既知の非自己回帰手法よりもネットワークが向上することを示す。
論文参考訳（メタデータ） (2023-11-14T14:24:36Z)
Uncovering Prototypical Knowledge for Weakly Open-Vocabulary Semantic Segmentation [59.37587762543934]
本稿では,弱開語彙セマンティックセマンティックセグメンテーション(WOVSS)の問題点について検討する。既存の方法は、グループトークンの使用に関する粒度の矛盾に悩まされる。マルチモーダル正規化を組み込んだプロトタイプ誘導ネットワーク(PGSeg)を提案する。
論文参考訳（メタデータ） (2023-10-29T13:18:00Z)
Uncertainty-aware Self-training for Low-resource Neural Sequence Labeling [29.744621356187764]
本稿では,ニューラルシークエンスラベリング(NSL)のための新しい未知の自己学習フレームワークSeqUSTを提案する。ベイジアンニューラルネットワーク(BNN)にモンテカルロ(MC)ドロップアウトを組み込んでトークンレベルで不確実性評価を行い、ラベルのないデータから信頼性の高い言語トークンを選択する。ノイズロスのあるマスク付きシークエンスラベリングタスクは、ノイズのある擬似ラベルの問題を抑えることを目的とした堅牢なトレーニングを支援する。
論文参考訳（メタデータ） (2023-02-17T02:40:04Z)
Hiding Images in Deep Probabilistic Models [58.23127414572098]
我々は、画像の深い確率モデルに隠蔽するための異なる計算フレームワークについて述べる。具体的には、DNNを用いて、カバー画像の確率密度をモデル化し、学習した分布の特定の場所に秘密画像を隠す。我々は,抽出精度とモデルセキュリティの観点から,SinGANアプローチの実現可能性を示す。
論文参考訳（メタデータ） (2022-10-05T13:33:25Z)
Beyond the Prototype: Divide-and-conquer Proxies for Few-shot Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。分割・分散の精神において, 単純かつ多目的な枠組みを提案する。提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文参考訳（メタデータ） (2022-04-21T06:21:14Z)
BLISS: Robust Sequence-to-Sequence Learning via Self-Supervised Input Representation [92.75908003533736]
本稿では,自己教師型入力表現を用いたフレームワークレベルの頑健なシーケンス・ツー・シーケンス学習手法BLISSを提案する。我々は,機械翻訳,文法的誤り訂正,テキスト要約など,BLISSの様々なタスクにおける有効性を検証するための総合的な実験を行った。
論文参考訳（メタデータ） (2022-04-16T16:19:47Z)
Pyramid-BERT: Reducing Complexity via Successive Core-set based Token Selection [23.39962989492527]
BERTのようなトランスフォーマーベースの言語モデルは、様々なNLPタスクで最先端を達成しているが、計算的に禁止されている。本稿では,従来の使用法を,理論的な結果によって正当化されたemコアセットベースのトークン選択法で置き換えるピラミッド-BERTを提案する。コアセットベースのトークン選択技術により、高価な事前トレーニングを回避でき、空間効率の良い微調整が可能となり、長いシーケンス長を扱うのに適している。
論文参考訳（メタデータ） (2022-03-27T19:52:01Z)
Autoregressive Linguistic Steganography Based on BERT and Consistency Coding [17.881686153284267]
言語ステガノグラフィ(LS)は、秘密情報をテキストに埋め込むことによって、コミュニケーションの存在を隠蔽する。近年のアルゴリズムでは、言語モデル(LM)を用いてステガノグラフテキストを生成する。本稿では,BERTと整合性符号化に基づく自己回帰型LSアルゴリズムを提案する。
論文参考訳（メタデータ） (2022-03-26T02:36:55Z)
A Self-Supervised Gait Encoding Approach with Locality-Awareness for 3D Skeleton Based Person Re-Identification [65.18004601366066]
3Dスケルトン配列内の歩行特徴による人物再識別(Re-ID)は、いくつかの利点を持つ新しい話題である。本稿では、ラベルのない骨格データを利用して人物の歩行表現を学習できる自己教師付き歩行符号化手法を提案する。
論文参考訳（メタデータ） (2020-09-05T16:06:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。