論文の概要: Remotely Detectable Robot Policy Watermarking
- arxiv url: http://arxiv.org/abs/2512.15379v1
- Date: Wed, 17 Dec 2025 12:28:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.978475
- Title: Remotely Detectable Robot Policy Watermarking
- Title(参考訳): リモート検出可能なロボットポリシー透かし
- Authors: Michael Amir, Manon Flageat, Amanda Prorok,
- Abstract要約: 機械学習は、新しい形の知的財産権を生み出した。
物理的なポリシーは、リモート検出というユニークな課題を提示する。
リモート検出用に設計された最初の透かし方式であるカラーノイズコヒーレンシー(CoNoCo)を紹介する。
- 参考スコア(独自算出の注目度): 10.408008511936913
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of machine learning for real-world robotic systems has created a new form of intellectual property: the trained policy. This raises a critical need for novel methods that verify ownership and detect unauthorized, possibly unsafe misuse. While watermarking is established in other domains, physical policies present a unique challenge: remote detection. Existing methods assume access to the robot's internal state, but auditors are often limited to external observations (e.g., video footage). This ``Physical Observation Gap'' means the watermark must be detected from signals that are noisy, asynchronous, and filtered by unknown system dynamics. We formalize this challenge using the concept of a \textit{glimpse sequence}, and introduce Colored Noise Coherency (CoNoCo), the first watermarking strategy designed for remote detection. CoNoCo embeds a spectral signal into the robot's motions by leveraging the policy's inherent stochasticity. To show it does not degrade performance, we prove CoNoCo preserves the marginal action distribution. Our experiments demonstrate strong, robust detection across various remote modalities, including motion capture and side-way/top-down video footage, in both simulated and real-world robot experiments. This work provides a necessary step toward protecting intellectual property in robotics, offering the first method for validating the provenance of physical policies non-invasively, using purely remote observations.
- Abstract(参考訳): 現実世界のロボットシステムにおける機械学習の成功は、新しい形の知的財産、すなわち訓練されたポリシーを生み出した。
これにより、オーナシップを検証し、無許可で、おそらくは安全でない誤用を検出する新しい方法が重要になる。
ウォーターマーキングは他のドメインで確立されているが、物理的なポリシーにはユニークな課題がある。
既存の方法はロボットの内部状態へのアクセスを前提としているが、監査役は外部からの観察(ビデオ映像など)に限られることが多い。
この ‘Physical Observation Gap'' は、未知のシステムダイナミクスによってノイズがあり、非同期であり、フィルタリングされる信号から、透かしを検出しなければならないことを意味する。
我々は、この課題を「textit{glimpse sequence}」という概念を用いて定式化し、リモート検出用に設計された最初の透かし戦略であるColored Noise Coherency (CoNoCo)を紹介した。
CoNoCoは、ポリシー固有の確率性を利用して、スペクトル信号をロボットの動きに埋め込む。
性能が低下しないことを示すため,CoNoCoが限界動作分布を保持することを証明した。
我々の実験は、シミュレーションと現実世界の両方のロボット実験において、モーションキャプチャーやサイドウェイ/トップダウン映像を含む、様々なリモートモダリティの強い堅牢な検出を実証した。
この研究は、ロボット工学における知的財産権を保護するための必要なステップを提供し、純粋に遠隔観察を用いて、非侵襲的に物理的ポリシーの証明を検証するための最初の方法を提供する。
関連論文リスト
- Sight Over Site: Perception-Aware Reinforcement Learning for Efficient Robotic Inspection [57.37596278863949]
本研究では,認識・認識の観点からの検査を再考する。
本稿では,目標視認性を主目的とするエンドツーエンド強化学習フレームワークを提案する。
提案手法は,既存の古典的および学習的ナビゲーション手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-09-22T15:14:02Z) - Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration [58.4036440289082]
ハンドオブジェクトモーションキャプチャ(MoCap)は、大規模でコンタクトに富んだデモと、器用なロボットスコープの約束を提供する。
Dexploreは、リポジトリとトラッキングを実行し、MoCapから直接ロボット制御ポリシーを学習する、統一された単一ループ最適化である。
論文 参考訳(メタデータ) (2025-09-11T17:59:07Z) - Ensuring Force Safety in Vision-Guided Robotic Manipulation via Implicit Tactile Calibration [18.183151257773886]
本稿ではSafeDiffと呼ばれる新しい状態拡散フレームワークを紹介する。
これにより、現在のロボットの状態と視覚的コンテキスト観察から予測状態列を生成する。
リアルタイムの触覚フィードバックを組み込んでシーケンスを洗練させる。
実験では, 視覚触覚モデルにより, ドア開口部の有害な力の危険性が著しく軽減された。
論文 参考訳(メタデータ) (2024-12-13T18:45:26Z) - Multimodal Anomaly Detection based on Deep Auto-Encoder for Object Slip
Perception of Mobile Manipulation Robots [22.63980025871784]
提案フレームワークは,RGBや深度カメラ,マイク,力トルクセンサなど,さまざまなロボットセンサから収集した異種データストリームを統合する。
統合されたデータは、ディープオートエンコーダを訓練して、通常の状態を示す多感覚データの潜在表現を構築するために使用される。
次に、トレーニングされたエンコーダの潜伏値と再構成された入力データの潜伏値との差によって測定された誤差スコアによって異常を識別することができる。
論文 参考訳(メタデータ) (2024-03-06T09:15:53Z) - AI-Based Energy Transportation Safety: Pipeline Radial Threat Estimation
Using Intelligent Sensing System [52.93806509364342]
本稿では,分散光ファイバーセンシング技術に基づくエネルギーパイプラインの放射状脅威推定手法を提案する。
本稿では,包括的信号特徴抽出のための連続的マルチビュー・マルチドメイン機能融合手法を提案する。
本研究では,事前学習モデルによる伝達学習の概念を取り入れ,認識精度と学習効率の両立を図る。
論文 参考訳(メタデータ) (2023-12-18T12:37:35Z) - Learning Vision-based Pursuit-Evasion Robot Policies [54.52536214251999]
我々は、部分的に観察可能なロボットの監督を生成する完全観測可能なロボットポリシーを開発する。
我々は、RGB-Dカメラを搭載した4足歩行ロボットに、野生での追従回避のインタラクションにポリシーを展開させる。
論文 参考訳(メタデータ) (2023-08-30T17:59:05Z) - Look Around and Learn: Self-Training Object Detection by Exploration [23.620820805804616]
エージェントは、事前訓練されたオフザシェルフ検出器を使用して環境を探索し、オブジェクトを検出し、擬似ラベルを関連付ける。
同じオブジェクトの擬似ラベルが、異なる視点で一貫性を持っていなければならないと仮定することで、ハードサンプルをマイニングするためにLook Aroundという探索ポリシーを学びます。
我々は現在の最先端の統一されたベンチマークを実装し、既存の探索政策や知覚メカニズムと比較する。
論文 参考訳(メタデータ) (2023-02-07T16:26:45Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。