論文の概要: Stable Acoustic Relay Assignment with High Throughput via Lase Chaos-based Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2507.05900v1
- Date: Tue, 08 Jul 2025 11:41:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.950391
- Title: Stable Acoustic Relay Assignment with High Throughput via Lase Chaos-based Reinforcement Learning
- Title(参考訳): Lase Chaos-based Reinforcement Learningによる高スループットの安定音響リレーアサイン
- Authors: Zengjing Chen, Lu Wang, Chengzhi Xing,
- Abstract要約: 本研究では,水中音響ネットワークにおける安定な音響リレー配置の問題に対処する。
古典的な安定配置とあいまいな安定配置という2つの異なる目的が考慮されている。
レーザカオスに基づくマルチプロセス学習(LC-ML)法を導入し,高いスループットと高速な安定性を実現する。
- 参考スコア(独自算出の注目度): 4.121865876406014
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study addresses the problem of stable acoustic relay assignment in an underwater acoustic network. Unlike the objectives of most existing literature, two distinct objectives, namely classical stable arrangement and ambiguous stable arrangement, are considered. To achieve these stable arrangements, a laser chaos-based multi-processing learning (LC-ML) method is introduced to efficiently obtain high throughput and rapidly attain stability. In order to sufficiently explore the relay's decision-making, this method uses random numbers generated by laser chaos to learn the assignment of relays to multiple source nodes. This study finds that the laser chaos-based random number and multi-processing in the exchange process have a positive effect on higher throughput and strong adaptability with environmental changing over time. Meanwhile, ambiguous cognitions result in the stable configuration with less volatility compared to accurate ones. This provides a practical and useful method and can be the basis for relay selection in complex underwater environments.
- Abstract(参考訳): 本研究では,水中音響ネットワークにおける安定な音響リレー配置の問題に対処する。
多くの文献の目的とは異なり、古典的な安定配置と曖昧な安定配置という2つの異なる目的が考慮されている。
これらの安定な配置を実現するために,レーザーカオスに基づくマルチプロセス学習(LC-ML)法を導入し,高いスループットと高速な安定性を実現する。
本手法は,リレーの判断を十分に探索するために,レーザーカオスによって生成された乱数を用いて複数のソースノードへのリレーの割り当てを学習する。
本研究では,レーザーカオスに基づくランダム数と交換プロセスにおけるマルチプロセッシングが,時間とともに変化する環境にともなう高いスループットと高い適応性に肯定的な影響を及ぼすことを示した。
一方、曖昧な認識は、正確な認識に比べて不安定性が低い安定した構成をもたらす。
これは実用的で有用な方法であり、複雑な水中環境におけるリレー選択の基礎となる。
関連論文リスト
- Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning [56.47948583452555]
固定ステップのEulerスキームによるフローマッチング推論プロセスの離散化は,最適輸送から変化するJordan-Kinderlehrer-Otto原理と整合する,というキーインサイトに基づいて,SWFP(Stepwise Flow Policy)フレームワークを紹介した。
SWFPは、大域的な流れを、プロキシメート分布間の小さな漸進的な変換の列に分解する。
この分解は、小さな流れブロックのカスケードを介して事前訓練された流れを微調整する効率的なアルゴリズムを導き、大きな利点をもたらす。
論文 参考訳(メタデータ) (2025-10-17T07:43:51Z) - DoRAN: Stabilizing Weight-Decomposed Low-Rank Adaptation via Noise Injection and Auxiliary Networks [47.58150560549918]
重み分解低ランク適応(DoRA)は,バニラ低ランク適応(LoRA)法の学習能力と訓練安定性の両方を改善することが示されている。
そこで本研究では,DoRAのトレーニングを安定化し,サンプル効率を向上させるため,新しいDoRAの派生型であるDoRANを提案する。
論文 参考訳(メタデータ) (2025-10-05T19:27:48Z) - DSDE: Dynamic Speculative Decoding with KLD Stability for Real-World Serving [7.444978746197347]
本稿では, ポストホック, 診断信号の新たなクラスを探索し, 動的適応のための新しい方向について検討する。
本稿では,2つの主要コンポーネント上に構築されたトレーニングフリーフレームワークであるDynamic Speculative Decoding Engine (DSDE)を提案する。
実験では、動的適応にKLDベースの安定性信号を使用する可能性を示す。
論文 参考訳(メタデータ) (2025-09-01T03:13:50Z) - Online Robust Multi-Agent Reinforcement Learning under Model Uncertainties [10.054572105379425]
十分に訓練されたマルチエージェントシステムは、実環境にデプロイされた時にフェールする可能性がある。
DRMGは、定義された環境不確実性のセットに対して最悪のケースパフォーマンスを最適化することで、システムのレジリエンスを高める。
本稿では、DRMGにおけるオンライン学習の先駆者であり、エージェントは事前データなしで環境相互作用から直接学習する。
論文 参考訳(メタデータ) (2025-08-04T23:14:32Z) - Stable Neighbor Denoising for Source-free Domain Adaptive Segmentation [91.83820250747935]
擬似ラベルノイズは主に不安定なサンプルに含まれており、ほとんどのピクセルの予測は自己学習中に大きく変化する。
我々は, 安定・不安定な試料を効果的に発見する, SND(Stable Neighbor Denoising)アプローチを導入する。
SNDは、様々なSFUDAセマンティックセグメンテーション設定における最先端メソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-06-10T21:44:52Z) - Multi-scale Diffusion Denoised Smoothing [79.95360025953931]
ランダムな平滑化は、大規模モデルに敵対的ロバスト性を提供する、いくつかの具体的なアプローチの1つになっている。
本報告では, 分割平滑化におけるロバスト性と精度との現在のトレードオフに対処するスケーラブルな手法を提案する。
提案手法と拡散微細調整を併用したマルチスケール平滑化手法により,高騒音レベルで高い信頼性のロバスト性が得られることを示す。
論文 参考訳(メタデータ) (2023-10-25T17:11:21Z) - Expeditious Saliency-guided Mix-up through Random Gradient Thresholding [89.59134648542042]
混合学習アプローチはディープニューラルネットワークの一般化能力向上に有効であることが証明されている。
本稿では,両経路の分岐点に位置する新しい手法を提案する。
我々はR-Mixという手法を「Random Mix-up」という概念にちなむ。
より良い意思決定プロトコルが存在するかどうかという問題に対処するために、我々は、ミックスアップポリシーを決定する強化学習エージェントを訓練する。
論文 参考訳(メタデータ) (2022-12-09T14:29:57Z) - SmoothMix: Training Confidence-calibrated Smoothed Classifiers for
Certified Robustness [61.212486108346695]
自己混合によるスムーズな分類器のロバスト性を制御するためのトレーニングスキームSmoothMixを提案する。
提案手法は, 厳密性に制限された原因として, 信頼性の低い, オフクラスに近いサンプルを効果的に同定する。
提案手法はスムーズな分類器の検証値である$ell$-robustnessを大幅に改善できることを示す。
論文 参考訳(メタデータ) (2021-11-17T18:20:59Z) - Stabilizing two-qubit entanglement by mimicking a squeezed environment [0.0]
単純な古典的時間変調を用いて、非古典的な光を使わずに、絡み合い安定化を忠実に模倣できることを示す。
伝送線路または導波路を介して結合された2つの遠隔量子ビット間の絡み合いを安定化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-12T17:52:57Z) - A Simple Cooperative Diversity Method Based on Deep-Learning-Aided Relay
Selection [10.199674137417796]
本稿では,予測リレー選択(PRS)を用いたディープラーニング支援協調手法の開発と解析を行う。
ORSの単純さを維持しつつ、チャネル予測をフェードすることで、CSIの品質を著しく向上させることができる。
PRSは、低速な無線環境において完全な多様性向上を実現し、高速なフェーディングチャネルにおける既存のスキームを大幅に上回っている。
論文 参考訳(メタデータ) (2021-02-05T20:20:27Z) - Training Generative Adversarial Networks by Solving Ordinary
Differential Equations [54.23691425062034]
GANトレーニングによって引き起こされる連続時間ダイナミクスについて検討する。
この観点から、GANのトレーニングにおける不安定性は積分誤差から生じると仮定する。
本研究では,有名なODEソルバ(Runge-Kutta など)がトレーニングを安定化できるかどうかを実験的に検証する。
論文 参考訳(メタデータ) (2020-10-28T15:23:49Z) - Achieving fast high-fidelity optimal control of many-body quantum
dynamics [0.0]
本稿では, 難解な多体問題に適用することで, 最近の高精度最適制御手法の有効性を実証する。
我々は, プロセスの最小期間推定値を用いて, 0.99-0.9999の範囲の忠実度を観測した。
全体として、この比較は理想的なオープンループ設定における多体システムに対しても重要な方法論的改善を示唆している。
論文 参考訳(メタデータ) (2020-08-13T18:30:24Z) - Robust Reinforcement Learning with Wasserstein Constraint [49.86490922809473]
最適なロバストなポリシーの存在を示し、摂動に対する感度分析を行い、新しいロバストな学習アルゴリズムを設計する。
提案アルゴリズムの有効性はCart-Pole環境で検証する。
論文 参考訳(メタデータ) (2020-06-01T13:48:59Z) - A Reinforcement Learning based approach for Multi-target Detection in
Massive MIMO radar [12.982044791524494]
本稿では,MMIMO(Multiple input Multiple output)認知レーダ(CR)におけるマルチターゲット検出の問題点について考察する。
本稿では,未知の外乱統計の存在下での認知的マルチターゲット検出のための強化学習(RL)に基づくアルゴリズムを提案する。
定常環境と動的環境の両方において提案したRLアルゴリズムの性能を評価するため, 数値シミュレーションを行った。
論文 参考訳(メタデータ) (2020-05-10T16:29:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。