論文の概要: Key-Conditioned Orthonormal Transform Gating (K-OTG): Multi-Key Access Control with Hidden-State Scrambling for LoRA-Tuned Models
- arxiv url: http://arxiv.org/abs/2512.17519v1
- Date: Fri, 19 Dec 2025 12:42:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-22 19:25:54.381177
- Title: Key-Conditioned Orthonormal Transform Gating (K-OTG): Multi-Key Access Control with Hidden-State Scrambling for LoRA-Tuned Models
- Title(参考訳): K-OTG(Key-Conditioned Orthonormal Transform Gating) - LoRA-Tuned Modelの隠れ状態スクランブルによるマルチキーアクセス制御
- Authors: Muhammad Haris Khan,
- Abstract要約: K-OTGはデュアルパスコーパスコーパスでトレーニングする:ロールキーを持つ認証された例はタスクの出力を、未承認例は可視なブロックトークンを学習する。
キーは特別なトークンとして追加されず、LoRAを4ビットベースでクリーンに構成する。
- 参考スコア(独自算出の注目度): 26.81598226089532
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a simple, PEFT-compatible mechanism that enforces secret-key access control in instruction-tuned language models. K-OTG trains on a dual-path corpus: authorized examples (prefixed with a role key) learn the task output, while unauthorized examples learn a visible block token. At inference, a pre-lm_head hook applies an orthonormal transform to the hidden state: with the correct key/role the inverse map restores the model's native basis; otherwise a session-ephemeral scrambler (permutation, sign flips, Householders) makes logits uninformative and the system short-circuits to BLOCK. Keys are not added as special tokens, and the method composes cleanly with LoRA on 4-bit bases. We evaluate an hour-scale protocol on 1-3B-class instruction models (Llama 3.2, Qwen2.5 1.5B) across utility (XSum ROUGE/BLEU, GSM8K accuracy, WikiText-2 perplexity), selectivity (3by3 role-key unlock matrices), nonce invariance, block suppression, and throughput. Authorized utility remains close to the base on summarization with the expected modest PPL increase from instruction tuning; unauthorized utility collapses (near-zero sequence metrics with exploding PPL), indicating practical unusability without the key. Unlock matrices are diagonally dominant (high on-target unlock, low cross-unlock), authorized block emission is 0 per N via robust bad-word lists, and greedy outputs match exactly across nonces, confirming correct inverse cancellation. The runtime overhead of the Python-level hook is 40% tokens per sec versus the base. K-OTG therefore provides a pragmatic, model-agnostic way to prevent unauthorized use while preserving authorized utility.
- Abstract(参考訳): 本稿では,命令調整言語モデルにおける秘密鍵アクセス制御を実現する,PEFT互換のシンプルな機構を提案する。
K-OTGはデュアルパスコーパスコーパスでトレーニングする: 許可された例(ロールキーでプリフィックスされた)はタスクの出力を学習し、許可されていない例は可視なブロックトークンを学習する。
プリlm_headフックは正規正規変換を隠蔽状態に適用する:正しいキー/ロールで逆写像がモデルのネイティブベースを復元する。
キーは特別なトークンとして追加されず、LoRAを4ビットベースでクリーンに構成する。
実用性(XSum ROUGE/BLEU, GSM8K精度, WikiText-2パープレキシティ)、選択性(3つのロールキーアンロック行列),ナンス不変性,ブロック抑制性,スループット)における1-3Bクラスの命令モデル(Llama 3.2, Qwen2.5 1.5B)の時間スケールプロトコルを評価する。
認可されたユーティリティは、命令チューニングから期待される質素なPPLの増加とともに、要約の基盤に近づき、未承認のユーティリティ崩壊(爆発的なPLPを持つゼロのシーケンスメトリクス)は、キーなしでは実用的使用不可能を示す。
アンロック行列は対角的に支配的である(高いオンターゲットアンロック、低いクロスアンロック)。
Pythonレベルのフックのランタイムオーバーヘッドは、ベースに対して毎秒40%のトークンである。
したがって、K-OTGは、認可されたユーティリティを保持しながら、許可されていない使用を防止するために、実用的で、モデルに依存しない方法を提供する。
関連論文リスト
- BlockCert: Certified Blockwise Extraction of Transformer Mechanisms [0.0]
本稿では,トランス機構のブロックワイズ抽出のためのフレームワークであるBlockCertを紹介する。
我々は、これらの局所的な保証をグローバルな偏差境界まで引き上げる単純なリプシッツに基づく合成定理をLean 4で定式化します。
以上の結果から,明示的な証明を用いたブロックワイズ抽出は,実際のトランスフォーマー言語モデルで実現可能であることが示唆された。
論文 参考訳(メタデータ) (2025-11-20T06:04:34Z) - Logit-Entropy Adaptive Stopping Heuristic for Efficient Chain-of-Thought Reasoning [0.0]
CoTプロンプト(Chain-of-Thought)は、大規模言語モデルにおいて複雑な推論を可能にする重要なテクニックである。
LEASH: Logit-Entropy Adaptive Stopping Heuristicは,有理数生成を適応的に停止する学習自由復号アルゴリズムである。
論文 参考訳(メタデータ) (2025-11-06T18:43:16Z) - What Layers When: Learning to Skip Compute in LLMs with Residual Gates [66.23658560048241]
GateSkipは、デコーダのみのLMにおけるトークンワイド層スキップを可能にする残差ストリームゲーティング機構である。
各Attention/MLPブランチは、残ストリームに再入力する前に、ブランチの出力を凝縮するシグモイドリニアゲートを備えている。
論文 参考訳(メタデータ) (2025-10-13T16:31:50Z) - Auditable Early Stopping for Agentic Routing: Ledger-Verified Run-Wise Certificates under Local DP [0.0]
ツール・ユース・エージェントのための最優先ルータが、よい葉を欠くことなく探索を止められるようになれば、私たちは対処します。
本稿では,各ノードのキーを,葉の摂動を実現する指数関数レースに結合するランワイズ証明書を提案する。
合成グラフと小さな実パイプラインの実験は、厳密な停止、決定論的リプレイ、オーバーヘッドの低さを示している。
論文 参考訳(メタデータ) (2025-09-09T01:25:09Z) - Causal Attention with Lookahead Keys [52.63961482746826]
標準的な因果的注意では、各トークンのクエリ、キー、値(QKV)は静的であり、先行するコンテキストのみをエンコードする。
本研究では,Lookahead kEys (CASTLE) を用いたCAuSal aTtentionを導入する。
論文 参考訳(メタデータ) (2025-09-09T00:15:23Z) - SLIP: Soft Label Mechanism and Key-Extraction-Guided CoT-based Defense Against Instruction Backdoor in APIs [9.581510737256389]
ブラックボックスのバックドア攻撃は、ホワイトボックスアクセスに依存する既存の防御を容易にバイパスする。
SLIP(Soft Label)機構と鍵抽出誘導CoTによるAPIのインストラクションバックドアに対する防御機構を提案する。
SLIPは非常に効果的で、平均攻撃成功率(ASR)を90.2%から25.13%に下げる。
論文 参考訳(メタデータ) (2025-08-08T09:17:33Z) - WR-ONE2SET: Towards Well-Calibrated Keyphrase Generation [57.11538133231843]
キーワード生成は、入力文書を要約する短いフレーズを自動的に生成することを目的としている。
最近登場したONE2SETパラダイムは、キーフレーズをセットとして生成し、競争性能を達成した。
本稿では, ONE2SET を拡張した WR-ONE2SET を提案する。
論文 参考訳(メタデータ) (2022-11-13T09:56:24Z) - Software mitigation of coherent two-qubit gate errors [55.878249096379804]
2量子ゲートは量子コンピューティングの重要な構成要素である。
しかし、量子ビット間の不要な相互作用(いわゆる寄生ゲート)は、量子アプリケーションの性能を低下させる。
寄生性2ビットゲート誤差を軽減するための2つのソフトウェア手法を提案する。
論文 参考訳(メタデータ) (2021-11-08T17:37:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。