論文の概要: Integrating Multi-Armed Bandit, Active Learning, and Distributed Computing for Scalable Optimization
- arxiv url: http://arxiv.org/abs/2601.00615v1
- Date: Fri, 02 Jan 2026 09:06:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-05 15:04:33.543393
- Title: Integrating Multi-Armed Bandit, Active Learning, and Distributed Computing for Scalable Optimization
- Title(参考訳): スケーラブル最適化のためのマルチタスク帯域、アクティブラーニング、分散コンピューティングの統合
- Authors: Foo Hui-Mean, Yuan-chin Ivan Chang,
- Abstract要約: ALMAB-DCはスケーラブルなブラックボックス最適化のための統一されたフレームワークである。
アクティブラーニング、マルチアームバンディット、分散コンピューティングを統合している。
常に最先端のブラックボックス評価を上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern optimization problems in scientific and engineering domains often rely on expensive black-box evaluations, such as those arising in physical simulations or deep learning pipelines, where gradient information is unavailable or unreliable. In these settings, conventional optimization methods quickly become impractical due to prohibitive computational costs and poor scalability. We propose ALMAB-DC, a unified and modular framework for scalable black-box optimization that integrates active learning, multi-armed bandits, and distributed computing, with optional GPU acceleration. The framework leverages surrogate modeling and information-theoretic acquisition functions to guide informative sample selection, while bandit-based controllers dynamically allocate computational resources across candidate evaluations in a statistically principled manner. These decisions are executed asynchronously within a distributed multi-agent system, enabling high-throughput parallel evaluation. We establish theoretical regret bounds for both UCB-based and Thompson-sampling-based variants and develop a scalability analysis grounded in Amdahl's and Gustafson's laws. Empirical results across synthetic benchmarks, reinforcement learning tasks, and scientific simulation problems demonstrate that ALMAB-DC consistently outperforms state-of-the-art black-box optimizers. By design, ALMAB-DC is modular, uncertainty-aware, and extensible, making it particularly well suited for high-dimensional, resource-intensive optimization challenges.
- Abstract(参考訳): 科学的・工学的な領域における現代の最適化問題は、物理シミュレーションやディープラーニングパイプラインで発生するような高額なブラックボックス評価に頼っていることが多い。
これらの設定では、計算コストの禁止とスケーラビリティの低下により、従来の最適化手法はすぐに非現実的になる。
ALMAB-DCは、アクティブラーニング、マルチアームバンディット、分散コンピューティングとオプションのGPUアクセラレーションを統合した、スケーラブルなブラックボックス最適化のための統一的でモジュール化されたフレームワークである。
このフレームワークは、サロゲートモデリングと情報理論獲得機能を活用して、情報的サンプル選択を誘導する一方、バンディットベースのコントローラは、統計的に原則化された方法で、候補評価全体にわたって、動的に計算資源を割り当てる。
これらの決定は分散マルチエージェントシステム内で非同期に実行され、高スループット並列評価を可能にする。
UCB法およびトンプソン法に基づく変種に対する理論的後悔境界を確立し、アムダール法とグスタフソン法則に基づく拡張性解析を開発する。
総合ベンチマーク、強化学習タスク、科学シミュレーション問題による実験結果から、ALMAB-DCは最先端のブラックボックスオプティマイザを一貫して上回っていることが示された。
設計上、ALMAB-DCはモジュラーであり、不確実性を認識し、拡張可能であり、特に高次元のリソース集約最適化に適している。
関連論文リスト
- A General and Streamlined Differentiable Optimization Framework [10.851559133306196]
本稿では,Julia最適化フレームワークのためのDiffOptlインタフェースを提案する。
ファーストクラスのJuMPネイティブAPIでは、ユーザが名前付きパラメータのデリバティブを直接取得することができる。
その結果、ルーチンの区別は、標準のJuMPモデリングプラクティスから逸脱することなく、実験、学習、設計を行うためのトレーニングツールになり得ることが示される。
論文 参考訳(メタデータ) (2025-10-29T21:42:36Z) - Direct comparison of stochastic driven nonlinear dynamical systems for combinatorial optimization [0.669087470775851]
組合せ最適化問題は、産業応用において至るところに存在している。
過去数十年間、Isingタイプの問題解決ツールの開発に精力的に取り組んできた。
量子システムと古典システムの制御と操作の最近の進歩は、新しい計算パラダイムを可能にしている。
論文 参考訳(メタデータ) (2025-03-19T17:08:55Z) - Synergistic Development of Perovskite Memristors and Algorithms for Robust Analog Computing [53.77822620185878]
本稿では,ペロブスカイト・メムリスタの製作を同時に最適化し,ロバストなアナログDNNを開発するための相乗的手法を提案する。
BO誘導ノイズインジェクションを利用したトレーニング戦略であるBayesMultiを開発した。
我々の統合されたアプローチは、より深くより広いネットワークでのアナログコンピューティングの使用を可能にし、最大100倍の改善を実現します。
論文 参考訳(メタデータ) (2024-12-03T19:20:08Z) - Deep Symbolic Optimization for Combinatorial Optimization: Accelerating Node Selection by Discovering Potential Heuristics [10.22111332588471]
本稿では,その利点を生かした,新しい記号的最適化学習フレームワークを提案する。
Dso4NSは高次元離散記号空間内の数学的表現の探索をガイドし、最高性能の数学的表現を解法に組み込む。
実験では、Dso4NSが高品質な表現の学習に有効であることを示し、CPUマシンにおける既存のアプローチよりも優れていた。
論文 参考訳(メタデータ) (2024-06-14T06:02:14Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。