論文の概要: Remote Action Generation: Remote Control with Minimal Communication
- arxiv url: http://arxiv.org/abs/2605.01833v1
- Date: Sun, 03 May 2026 12:00:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.95745
- Title: Remote Action Generation: Remote Control with Minimal Communication
- Title(参考訳): リモートアクション生成:最小限の通信によるリモート制御
- Authors: Szymon Kobus, Deniz Gündüz,
- Abstract要約: 直接報酬アクセスを欠いた1人以上のアクターが通信制約のあるチャネル上でコントローラによって操縦されるリモート制御の課題に対処する。
本稿では,この対話型学習・制御プロセスを通じて,遠隔生成を活用してレート効率の高いコミュニケーションを実現する新しいフレームワークを提案する。
GRASP ( Guided Remote Action Sampling Policy) は,通信の大幅な削減を図っている。
- 参考スコア(独自算出の注目度): 47.77994074958904
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the challenge of remote control where one or more actors, lacking direct reward access, are steered by a controller over a communication-constrained channel. The controller learns an optimal policy from observed rewards and communicates action guidance to the actors, which becomes demanding for large or continuous action spaces. To achieve rate-efficient communication throughout this interactive learning and control process, we introduce a novel framework leveraging remote generation. Instead of transmitting full action specifications, the controller sends minimal information, enabling the actors to locally generate actions by sampling from the controller's evolving target policy. This guided sampling is facilitated by an importance sampling approach. Concurrently, the actors use the received guidance as supervised learning data to learn the controller's policy. This actor-side learning improves their local sampling capabilities, progressively reducing future communication needs. Our solution, Guided Remote Action Sampling Policy (GRASP), demonstrates significant communication reduction, achieving an average 12-fold data reduction across all experiments (50-fold for continuous action spaces) compared to direct action transmission, and a 41-fold reduction compared to reward transmission.
- Abstract(参考訳): 直接報酬アクセスを欠いた1人以上のアクターが通信制約のあるチャネル上でコントローラによって操縦されるリモート制御の課題に対処する。
コントローラは、観察された報酬から最適なポリシーを学び、アクターにアクションガイダンスを伝える。
この対話型学習・制御プロセスを通して、レート効率の高いコミュニケーションを実現するために、遠隔生成を利用した新しいフレームワークを提案する。
コントローラは、完全なアクション仕様を送信する代わりに、最小限の情報を送信するため、コントローラの進化するターゲットポリシーからサンプリングすることで、アクターがローカルにアクションを生成することができる。
このガイドサンプリングは、重要サンプリングアプローチによって促進される。
同時に、アクターは、受信したガイダンスを教師付き学習データとして使用して、コントローラのポリシーを学習する。
このアクター側学習は、局所的なサンプリング能力を向上し、将来的な通信ニーズを徐々に減少させる。
GRASP(ガイド・リモート・アクション・サンプリング・ポリシー)は,全ての実験(連続行動空間の50倍)の平均12倍のデータ削減,報酬伝達の41倍の削減を実現し,コミュニケーションの大幅な削減を図っている。
関連論文リスト
- Dexplore: Scalable Neural Control for Dexterous Manipulation from Reference-Scoped Exploration [58.4036440289082]
ハンドオブジェクトモーションキャプチャ(MoCap)は、大規模でコンタクトに富んだデモと、器用なロボットスコープの約束を提供する。
Dexploreは、リポジトリとトラッキングを実行し、MoCapから直接ロボット制御ポリシーを学習する、統一された単一ループ最適化である。
論文 参考訳(メタデータ) (2025-09-11T17:59:07Z) - From Pixels to CSI: Distilling Latent Dynamics For Efficient Wireless Resource Management [31.080933663717257]
本稿では,制御システムのダイナミクスを協調的にモデル化し,予測する新しい機械学習手法を提案する。
提案手法は,ベースライン方式に匹敵する制御性能を維持しつつ,送信電力を50%以上削減することを示す。
論文 参考訳(メタデータ) (2025-06-19T11:08:20Z) - Multi-Modal Self-Supervised Semantic Communication [52.76990720898666]
本稿では,マルチモーダルな自己教師型学習を活用し,タスク非依存の特徴抽出を強化するマルチモーダルセマンティックコミュニケーションシステムを提案する。
提案手法は,訓練関連通信オーバーヘッドを最小限に抑えつつ,モダリティの不変性とモダリティ特有の特徴の両方を効果的に捉えている。
この結果は、セマンティックコミュニケーションにおけるマルチモーダルな自己教師型学習の利点を浮き彫りにし、より効率的でスケーラブルなエッジ推論システムへの道を開いた。
論文 参考訳(メタデータ) (2025-03-18T06:13:02Z) - Time-Series JEPA for Predictive Remote Control under Capacity-Limited Networks [31.408649975934008]
時系列共同埋め込み予測アーキテクチャ(TS-JEPA)
TS-JEPAは、高次元の知覚データをセンサーに低次元のセマンティック埋め込みにエンコードする。
チャネル対応スケジューリングはデバイス送信を動的に優先順位付けするために統合される。
論文 参考訳(メタデータ) (2024-06-07T11:35:15Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications to Coverage Control [72.81786007015471]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - InterControl: Zero-shot Human Interaction Generation by Controlling Every Joint [67.6297384588837]
関節間の所望距離を維持するために,新しい制御可能な運動生成手法であるInterControlを導入する。
そこで本研究では,既成の大規模言語モデルを用いて,ヒューマンインタラクションのための結合ペア間の距離を生成できることを実証した。
論文 参考訳(メタデータ) (2023-11-27T14:32:33Z) - Semantic and Effective Communication for Remote Control Tasks with
Dynamic Feature Compression [23.36744348465991]
ロボットの群れの調整と産業システムのリモート無線制御は、5Gおよびそれ以上のシステムの主要なユースケースである。
本研究では,タスクを制御するアクターに知覚データを伝達しなければならないプロトタイパルシステムについて考察する。
本稿では,量子化レベルを動的に適応させるために,アンサンブルベクトル量子化変分オートエンコーダ(VQ-VAE)を符号化し,深層強化学習(DRL)エージェントを訓練する。
論文 参考訳(メタデータ) (2023-01-14T11:43:56Z) - Deep reinforcement learning of event-triggered communication and control
for multi-agent cooperative transport [9.891241465396098]
協調輸送のためのコミュニケーション・制御戦略の設計問題に対処する多エージェント強化学習手法を検討する。
我々のフレームワークはイベントトリガーアーキテクチャ、すなわち通信入力を演算するフィードバックコントローラと、入力を再更新する必要があるタイミングを決定するトリガー機構を利用する。
論文 参考訳(メタデータ) (2021-03-29T01:16:12Z) - Human-in-the-Loop Imitation Learning using Remote Teleoperation [72.2847988686463]
6-DoF操作設定に合わせたデータ収集システムを構築します。
システムによって収集された新しいデータに基づいて,ポリシーを反復的にトレーニングするアルゴリズムを開発した。
介入型システムで収集したデータに基づいて訓練されたエージェントと、非介入型デモ参加者が収集した同等数のサンプルで訓練されたアルゴリズムを上回るエージェントを実証する。
論文 参考訳(メタデータ) (2020-12-12T05:30:35Z) - Learning Event-triggered Control from Data through Joint Optimization [7.391641422048646]
イベントトリガー制御戦略のモデルフリー学習のためのフレームワークを提案する。
階層的強化学習に基づく新しいアルゴリズムを提案する。
得られたアルゴリズムは, 資源の節約や非線形・高次元システムへのシームレスなスケールで, 高性能な制御を実現する。
論文 参考訳(メタデータ) (2020-08-11T14:15:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。