論文の概要: Zero-Shot Adaptation for mmWave Beam-Tracking on Overhead Messenger
Wires through Robust Adversarial Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2102.08055v1
- Date: Tue, 16 Feb 2021 10:07:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-17 14:50:29.025292
- Title: Zero-Shot Adaptation for mmWave Beam-Tracking on Overhead Messenger
Wires through Robust Adversarial Reinforcement Learning
- Title(参考訳): ロバスト対比強化学習による上向きメッセンジャー線上のミリ波ビーム追跡のゼロショット適応
- Authors: Masao Shinzaki and Yusuke Koda and Koji Yamamoto and Takayuki Nishio
and Masahiro Morikura and Yushi Shirato and Daisei Uchida and Naoki Kita
- Abstract要約: ゼロショット適応は、学習エージェントが適応的な微調整なしでトレーニング中に見えないシナリオに適応することを意味します。
オーバヘッドメッセンジャーワイヤ上に配置したmmWaveノードの学習に基づくビーム追跡を考慮し、まずゼロショット適応の重要性を論じる。
この議論に動機づけられて,ゼロショット方式で幅広いテストシナリオに適応するためのロバストなビーム追跡手法を提案する。
- 参考スコア(独自算出の注目度): 6.618268038467747
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper discusses the opportunity of bringing the concept of zero-shot
adaptation into learning-based millimeter-wave (mmWave) communication systems,
particularly in environments with unstable urban infrastructures. Here,
zero-shot adaptation implies that a learning agent adapts to unseen scenarios
during training without any adaptive fine-tuning. By considering learning-based
beam-tracking of a mmWave node placed on an overhead messenger wire, we first
discuss the importance of zero-shot adaptation. More specifically, we confirm
that the gap between the values of wire tension and total wire mass in training
and test scenarios deteriorates the beam-tracking performance in terms of the
received power. Motivated by this discussion, we propose a robust beam-tracking
method to adapt to a broad range of test scenarios in a zero-shot manner, i.e.,
without requiring any retraining to adapt the scenarios. The key idea is to
leverage a recent, robust adversarial reinforcement learning technique, where
such training and test gaps are regarded as disturbances from adversaries. In
our case, a beam-tracking agent performs training competitively bases on an
intelligent adversary who causes beam misalignments. Numerical evaluations
confirm the feasibility of zero-shot adaptation by showing that the on-wire
node achieves feasible beam-tracking performance without any adaptive
fine-tuning in unseen scenarios.
- Abstract(参考訳): 本稿では,特に不安定な都市インフラ環境において,学習に基づくミリ波通信システムにおいてゼロショット適応の概念を導入する機会について述べる。
ここでは、ゼロショット適応は、学習エージェントが適応的な微調整なしでトレーニング中に見えないシナリオに適応することを意味します。
オーバヘッドメッセンジャーワイヤ上に配置したmmWaveノードの学習に基づくビーム追跡を考慮し、まずゼロショット適応の重要性を論じる。
より具体的には、トレーニングおよびテストシナリオにおけるワイヤー張力と総ワイヤー質量のギャップが受信電力の点でビーム追跡性能を低下させることを確認します。
この議論に動機づけられて、我々は、シナリオを適応させるために再訓練を必要とせずに、ゼロショットの方法で幅広いテストシナリオに適応するための堅牢なビーム追跡方法を提案します。
鍵となるアイデアは、最近の強固な敵強化学習技術を活用し、そのようなトレーニングとテストのギャップを敵からの障害と見なすことだ。
本例では,ビーム追跡エージェントが,ビームの不一致を引き起こす知的敵に対して,競争力のあるベースでトレーニングを行う。
数値的評価は、オンワイヤノードが目に見えないシナリオで適応的な微調整なしで実現可能なビーム追跡性能を達成することを示し、ゼロショット適応の実現性を確認する。
関連論文リスト
- Non-Stationary Learning of Neural Networks with Automatic Soft Parameter Reset [98.52916361979503]
非定常性を自動的にモデル化し適応する新しい学習手法を導入する。
非定常的・非政治的強化学習環境において,本手法が有効であることを示す。
論文 参考訳(メタデータ) (2024-11-06T16:32:40Z) - Can Active Sampling Reduce Causal Confusion in Offline Reinforcement
Learning? [58.942118128503104]
因果的混乱(英: Causal confusion)とは、エージェントがデータ中の不完全な急激な相関を反映するポリシーを学ぶ現象である。
この現象は特にロボット工学などの領域で顕著である。
本稿では,オフライン強化学習における因果的混乱について検討する。
論文 参考訳(メタデータ) (2023-12-28T17:54:56Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Is Stochastic Mirror Descent Vulnerable to Adversarial Delay Attacks? A
Traffic Assignment Resilience Study [20.11993437283895]
学習ベースのINSインフラは、情報構造に一定期間の中断を経験しても、ウォードロップ非平衡を実現することができることを示す。
これらの知見は、輸送生態系の様々な層にまたがる妨害攻撃に対して防御機構を設計するための貴重な洞察を与える。
論文 参考訳(メタデータ) (2023-04-03T17:28:24Z) - Deep Reinforcement Learning for mmWave Initial Beam Alignment [6.240268911509346]
我々は,mmWave通信における適応初期アクセスビームアライメント問題に対する深部強化学習アルゴリズムの適用性を検討した。
深層強化学習は、新しい広範囲のアプリケーションに対処する可能性がある。
提案手法は, 実測的な問題の大きさを訓練しても性能が良くないにもかかわらず, ビームフォーミングモジュールの形で動作空間の整形を導入することにより, 性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-02-17T16:10:42Z) - Adversarial Coreset Selection for Efficient Robust Training [11.510009152620666]
トレーニングデータの小さなサブセットを選択することは、堅牢なトレーニングの時間的複雑さを軽減するための原則的なアプローチを提供する方法を示す。
本手法が敵の訓練を2~3回高速化することを示すため,広範囲な実験を行った。
論文 参考訳(メタデータ) (2022-09-13T07:37:53Z) - Learning Domain Adaptive Object Detection with Probabilistic Teacher [93.76128726257946]
確率的教師(PT)と呼ばれる,シンプルで効果的な枠組みを提案する。
PTは、段階的に進化する教師から未ラベルの目標データの不確実性を捉え、相互に有利な方法で生徒の学習を指導することを目的としている。
また,不確実性誘導型自己学習を促進するために,新しいエントロピー・フォカル・ロス(EFL)を提案する。
論文 参考訳(メタデータ) (2022-06-13T16:24:22Z) - Distributed Adversarial Training to Robustify Deep Neural Networks at
Scale [100.19539096465101]
現在のディープニューラルネットワーク(DNN)は、入力に対する敵の摂動が分類を変更したり操作したりする敵の攻撃に対して脆弱である。
このような攻撃を防御するために、敵の訓練(AT)として知られる効果的なアプローチが、堅牢な訓練を緩和するために示されている。
複数のマシンにまたがって実装された大規模バッチ対逆トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-13T15:39:43Z) - Adaptive Feature Alignment for Adversarial Training [56.17654691470554]
CNNは通常、敵攻撃に対して脆弱であり、セキュリティに敏感なアプリケーションに脅威をもたらす。
任意の攻撃強度の特徴を生成するための適応的特徴アライメント(AFA)を提案する。
本手法は任意の攻撃強度の特徴を自動的に整列するように訓練されている。
論文 参考訳(メタデータ) (2021-05-31T17:01:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。