Fugu-MT 論文翻訳(概要): Networked Restless Multi-Armed Bandits for Mobile Interventions

論文の概要: Networked Restless Multi-Armed Bandits for Mobile Interventions

arxiv url: http://arxiv.org/abs/2201.12408v1
Date: Fri, 28 Jan 2022 20:38:01 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-05 06:53:05.704552
Title: Networked Restless Multi-Armed Bandits for Mobile Interventions
Title（参考訳）: モバイル介入のためのネットワークレストレストレストマルチアームバンディット
Authors: Han-Ching Ou, Christoph Siebenbrunner, Jackson Killian, Meredith B Brooks, David Kempe, Yevgeniy Vorobeychik, Milind Tambe
Abstract要約: ネットワーク効果を考慮したレスレスマルチアームバンディット(RMAB)について検討した。我々のモデルでは、アームは部分的にリチャージされ、グラフを介して接続されているため、一方のアームを引っ張ることで、隣接するアームの状態も改善される。 RMABのネットワーク効果は,既存の解法では考慮されていない強い報酬結合を誘導することを示す。
参考スコア（独自算出の注目度）: 41.74987432512137
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Motivated by a broad class of mobile intervention problems, we propose and study restless multi-armed bandits (RMABs) with network effects. In our model, arms are partially recharging and connected through a graph, so that pulling one arm also improves the state of neighboring arms, significantly extending the previously studied setting of fully recharging bandits with no network effects. In mobile interventions, network effects may arise due to regular population movements (such as commuting between home and work). We show that network effects in RMABs induce strong reward coupling that is not accounted for by existing solution methods. We propose a new solution approach for networked RMABs, exploiting concavity properties which arise under natural assumptions on the structure of intervention effects. We provide sufficient conditions for optimality of our approach in idealized settings and demonstrate that it empirically outperforms state-of-the art baselines in three mobile intervention domains using real-world graphs.
Abstract（参考訳）: 幅広い種類のモバイル介入問題に動機づけられ,ネットワーク効果を持つレストレス・マルチアーム・バンディット(rmabs)を提案し,検討した。我々のモデルでは、アームは部分的にリチャージされ、グラフを介して接続されているため、一方のアームを引くことで隣接するアームの状態も改善され、ネットワーク効果のない完全リチャージバンディットの設定が大幅に拡張される。モバイル介入では、ネットワーク効果は通常の人口移動(家と仕事の通勤など)によって生じることがある。 RMABのネットワーク効果は,既存の解法では考慮されていない強い報酬結合をもたらすことを示す。本稿では,ネットワーク化RMABに対する新しい解法を提案し,介入効果の構造に対する自然な仮定の下で生じる凹凸特性を利用する。理想化された環境でのアプローチの最適性に十分な条件を提供し,実世界グラフを用いた3つのモバイル介入領域における最先端のベースラインを経験的に上回っていることを示す。

関連論文リスト

Learning Robust Intervention Representations with Delta Embeddings [5.124256074746721]
因果表現学習はここ数年で大きな研究関心を集めている。分布の堅牢性を改善するための効果的な戦略は、潜伏空間における介入の表現に焦点を当てることである。本稿では,画像ペアから因果表現を学習できるフレームワークを提案する。
論文参考訳（メタデータ） (2025-08-06T14:39:34Z)
Efficient and Trustworthy Block Propagation for Blockchain-enabled Mobile Embodied AI Networks: A Graph Resfusion Approach [60.80257080226662]
本稿では,コンソーシアムブロックチェーン対応MEANETのためのグラフ再拡散モデルに基づく信頼性の高いブロック伝搬最適化フレームワークを提案する。具体的には,信頼クラウドモデルに基づく革新的な信頼計算機構を提案する。グラフニューラルネットワークと拡散モデルの強みを利用して,最適なブロック伝搬軌跡を効果的かつ適応的に生成するグラフ拡散モデルを開発した。
論文参考訳（メタデータ） (2025-01-26T07:47:05Z)
Influence Maximization via Graph Neural Bandits [54.45552721334886]
IM問題を多ラウンド拡散キャンペーンに設定し,影響を受けやすいユーザ数を最大化することを目的とした。 IM-GNB(Influence Maximization with Graph Neural Bandits)を提案する。
論文参考訳（メタデータ） (2024-06-18T17:54:33Z)
Distributed Autonomous Swarm Formation for Dynamic Network Bridging [40.27919181139919]
離散化された部分観測可能なマルコフ決定過程(Dec-POMDP)における動的ネットワークブリッジ問題について定式化する。グラフ畳み込み強化学習(DGN)に基づく問題に対するマルチエージェント強化学習(MARL)アプローチを提案する。提案手法はシミュレーション環境で評価し,将来性を示す集中型ベースラインと比較した。
論文参考訳（メタデータ） (2024-04-02T01:45:03Z)
Exploiting Regional Information Transformer for Single Image Deraining [40.96287901893822]
Region Transformer Block (RTB) は Region Masked Attention (RMA) 機構と Mixed Gate Forward Block (MGFB) を統合している我々のモデルは最先端の性能に到達し、画像劣化の品質を著しく向上させる。
論文参考訳（メタデータ） (2024-02-25T09:09:30Z)
Towards a Pretrained Model for Restless Bandits via Multi-arm Generalization [32.90636136408938]
Restless Multi-arm bandits (RMAB) は、医療、オンライン広告、密猟などの分野で広く利用されているリソース割り当て問題である。本研究では,これまで見つからなかった広範囲なRMABに対して,一般的なゼロショット能力を有するニューラルネットワークベース事前学習モデル(PreFeRMAB)を開発した。
論文参考訳（メタデータ） (2023-10-23T03:16:32Z)
Leveraging Low-Rank and Sparse Recurrent Connectivity for Robust Closed-Loop Control [63.310780486820796]
繰り返し接続のパラメータ化が閉ループ設定のロバスト性にどのように影響するかを示す。パラメータが少ないクローズドフォーム連続時間ニューラルネットワーク(CfCs)は、フルランクで完全に接続されたニューラルネットワークよりも優れています。
論文参考訳（メタデータ） (2023-10-05T21:44:18Z)
Model-based Causal Bayesian Optimization [74.78486244786083]
乗算重み付き因果ベイズ最適化のための最初のアルゴリズム(CBO-MW)を提案する。グラフ関連の量に自然に依存するCBO-MWに対する後悔の限界を導出する。我々の実験は、共有モビリティシステムにおいて、ユーザの需要パターンを学習するためにCBO-MWをどのように使用できるかの現実的なデモを含む。
論文参考訳（メタデータ） (2023-07-31T13:02:36Z)
Networked Restless Bandits with Positive Externalities [34.792869761921565]
ネットワーク型レスト・バンディット(networked restless bandit)は、腕をレストと有向グラフに埋め込んだ、新しいマルチアーム・バンディット・セッティングである。次に、グラフ対応のWhittleインデックスベースのアルゴリズムであるGretaを紹介し、各時間ステップで制約付き報酬最大化アクションベクトルを効率的に構築することができる。
論文参考訳（メタデータ） (2022-12-09T23:37:14Z)
Low-Latency Federated Learning over Wireless Channels with Differential Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文参考訳（メタデータ） (2021-06-20T13:51:18Z)
On Topology Optimization and Routing in Integrated Access and Backhaul Networks: A Genetic Algorithm-based Approach [70.85399600288737]
IABネットワークにおけるトポロジ最適化とルーティングの問題について検討する。我々は、IABノード配置と非IABバックホールリンク分布の両方に効率的な遺伝的アルゴリズムベースのスキームを開発する。メッシュベースのIABネットワークを実現する上での課題について論じる。
論文参考訳（メタデータ） (2021-02-14T21:52:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。