論文の概要: A Watermark for Vision-Language-Action and World Action Models
- arxiv url: http://arxiv.org/abs/2606.23574v1
- Date: Mon, 22 Jun 2026 16:39:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 18:10:25.220303
- Title: A Watermark for Vision-Language-Action and World Action Models
- Title(参考訳): 視覚言語行動モデルと世界行動モデルのための透かし
- Authors: Yule Liu, Shuai Liu, Jiaheng Wei, Xinlei He,
- Abstract要約: 視覚言語行動モデル (VLA) と世界行動モデル (WAM) は汎用ロボット制御を駆動する生成モデルである。
本稿では,ガウス雑音ベクトルのシードからポリシーをフィンガープリンティングするEmphkeyed latent-provenance法を提案する。
本手法は,2つのロボットスイートにまたがる2つの代表モデルに対して評価を行う。
- 参考スコア(独自算出の注目度): 14.245193036354186
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision-language-action (VLA) models and world-action models (WAM) are the generative models now driving general-purpose robot control, turning raw camera input directly into motor commands. They are increasingly deployed as black-box services, where a partner runs the policy through an interface while the owner keeps the weights private. Training such a model takes proprietary data and heavy computational power, making the deployed model itself a valuable intellectual property. To address this, we propose the \emph{keyed latent-provenance verification} method, which fingerprints the policy through the seed of the Gaussian noise vector that the models draw before generation. At the injection stage, the owner swaps this seed for a keyed one with the same distribution as ordinary noise, so the fingerprinted actions are statistically identical to those of an ordinary run and an adversary watching the output finds no signal to detect or remove. At the verification stage, the owner runs the suspect model under authorized access and records the action channels the robot executes, a partial and possibly post-processed view of the policy's output. From this view, the verifier recovers the seed by gradient-based maximum a posteriori (MAP) optimization, tests it for the secret key to score each rollout, and aggregates these scores into a single decision on whether the suspect model belongs to the owner. We evaluate the method on two representative models across two robot suites. The experiments cover detection of the fingerprint, identification of which of several keys a suspect carries, robustness to a range of attacks, and an analysis of why the design works. Across both models, the fingerprint can be detected reliably with little change to task performance, and it remains detectable under output-side removal attacks and weight-level edits.
- Abstract(参考訳): ビジョン・ランゲージ・アクション(VLA)モデルとワールド・アクション・モデル(WAM)は、現在汎用ロボット制御を駆動し、生のカメラ入力を直接モーターコマンドに変換する生成モデルである。
ブラックボックスサービスとしてデプロイされ、パートナーがインターフェースを通じてポリシーを実行し、オーナーがウェイトをプライベートに保持するようになっている。
そのようなモデルをトレーニングするには、プロプライエタリなデータと重い計算能力が必要であり、デプロイされたモデル自体が貴重な知的財産となる。
そこで本研究では,モデルが生成前に描画するガウス雑音ベクトルのシードを用いて,ポリシーをフィンガープリントする<emph{keyed latent-provenance confirmed}法を提案する。
注入段階では、所有者は、このシードを通常の雑音と同じ分布のキー付きシードと交換するため、指紋による動作は通常の実行時と統計的に同一であり、出力を見ている相手は検出または除去する信号を見つけない。
検証段階では、所有者は、承認されたアクセスの下で被疑者モデルを実行し、ロボットが実行するアクションチャネルを記録する。
この観点から、検証者は、勾配に基づく最大アフター(MAP)最適化によりシードを回収し、シークレットキーが各ロールアウトをスコアするためにテストし、これらのスコアを、疑似モデルが所有者に属するかどうかの単一の判定に集約する。
本手法は,2つのロボットスイートにまたがる2つの代表モデルに対して評価を行う。
実験では、指紋の検出、被疑者の持ついくつかの鍵の識別、さまざまな攻撃に対する堅牢性、そしてなぜデザインが機能するのかの分析がカバーされた。
両モデルとも、指紋はタスク性能にほとんど変化がなく確実に検出でき、出力側除去攻撃や重みレベルの編集でも検出可能である。
関連論文リスト
- CIAware-Bench: Benchmarking Control Intervention Awareness Across Frontier LLMs [100.38986535324284]
我々は、フロンティアモデル全体でのtextbfcontrol textbfintervention (CI) の認識を測定するベンチマークである textbfCIAware-Bench を紹介する。
CIAware-Benchは、モデルが自身の軌跡を制御介入によって修正されたものと区別できるかどうかをテストする。
論文 参考訳(メタデータ) (2026-06-09T16:24:16Z) - A Behavioral Fingerprint for Large Language Models: Provenance Tracking via Refusal Vectors [43.11304710234668]
安全アライメントによって引き起こされる行動パターンを活用する新しいフィンガープリントフレームワークを提案する。
76の子孫モデルを対象とした大規模識別タスクにおいて,本手法は正しいモデル群を同定する際の精度を100%向上する。
本稿では,このプライベートフィンガープリントを,公開で検証可能なプライバシー保護アーティファクトに変換するための理論的枠組みを提案する。
論文 参考訳(メタデータ) (2026-02-10T05:57:35Z) - Detecting Semantic Backdoors in a Mystery Shopping Scenario [0.0]
分類モデルにおけるセマンティックバックドアの検出問題に対処する。
クリーントレーニングデータセットとモデルのトレーニングレシピが共に知られていることを前提として,参照モデルプールを提案する。
我々はモデル距離を計算するための様々なアプローチを実験的に分析し、また、プロバイダが検出を避けるためにアダプティブアタックを実行するシナリオをテストする。
論文 参考訳(メタデータ) (2026-01-07T11:04:04Z) - ExposeAnyone: Personalized Audio-to-Expression Diffusion Models Are Robust Zero-Shot Face Forgery Detectors [58.45131932883374]
ビデオ中のディープフェイクを検出するための完全自己教師型アプローチを提案する。
本モデルでは,拡散再構成誤差を用いて,疑わしい映像とパーソナライズされた被写体との同一性距離を算出する。
本手法は, ボケや圧縮などの汚損に対して極めて堅牢であり, 現実の顔偽造検出への適用性を強調している。
論文 参考訳(メタデータ) (2026-01-05T18:59:54Z) - AuthPrint: Fingerprinting Generative Models Against Malicious Model Providers [5.450474861880874]
本稿では,認証モデルの出力空間から隠れ指紋を抽出し,検知器を訓練する信頼性検証器を提案する。
検証中、この検出器は、特別なハードウェアやモデル修正を必要とせずに、新しい出力が認定されたモデルと一致しているかどうかを判断できる。
GANと拡散モデルの両方でFPR@95%TPRをほぼゼロとする実験を行った。
論文 参考訳(メタデータ) (2025-08-06T12:17:38Z) - Sample Correlation for Fingerprinting Deep Face Recognition [83.53005932513156]
SAC(SA Corremplelation)に基づく新しいモデル盗難検出手法を提案する。
SACは、顔認証や顔の感情認識を含む、深層顔認識における様々なモデル盗難攻撃に対して、AUC、p値、F1スコアの点で最高のパフォーマンスを示すことに成功した。
我々は,SAC-JC の評価を Tiny-ImageNet や CIFAR10 などのオブジェクト認識に拡張し,従来の手法よりも SAC-JC の優れた性能を示す。
論文 参考訳(メタデータ) (2024-12-30T07:37:06Z) - Model Pairing Using Embedding Translation for Backdoor Attack Detection on Open-Set Classification Tasks [63.269788236474234]
バックドア検出のためのオープンセット分類タスクにモデルペアを用いることを提案する。
このスコアは、異なるアーキテクチャのモデルがあるにもかかわらず、バックドアの存在を示す指標であることを示している。
この技術は、オープンセット分類タスク用に設計されたモデル上のバックドアの検出を可能にするが、文献ではほとんど研究されていない。
論文 参考訳(メタデータ) (2024-02-28T21:29:16Z) - Are You Stealing My Model? Sample Correlation for Fingerprinting Deep
Neural Networks [86.55317144826179]
従来の方法は、常にモデル指紋として転送可能な敵の例を利用する。
本稿では,SAmple correlation (SAC) に基づく新しいモデル盗難検出手法を提案する。
SACは、敵の訓練や移動学習を含む様々なモデル盗難攻撃をうまく防いでいる。
論文 参考訳(メタデータ) (2022-10-21T02:07:50Z) - FBI: Fingerprinting models with Benign Inputs [17.323638042215013]
本稿では,モデルファミリとその変種の概念を一般化することにより,モデルの大幅な修正に耐性のある指紋認証方式を提案する。
我々は、修正されていない画像である良性入力が、両方のタスクに十分な材料であることを実証することによって、両方の目標を達成する。
どちらのアプローチも、かつてない1000以上のネットワークに対して実験的に検証されている。
論文 参考訳(メタデータ) (2022-08-05T13:55:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。