論文の概要: RLBayes: a Bayesian Network Structure Learning Algorithm via Reinforcement Learning-Based Search Strategy
- arxiv url: http://arxiv.org/abs/2504.05167v1
- Date: Mon, 07 Apr 2025 15:11:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:14:00.669067
- Title: RLBayes: a Bayesian Network Structure Learning Algorithm via Reinforcement Learning-Based Search Strategy
- Title(参考訳): RLBayes:強化学習に基づく検索戦略によるベイズネットワーク構造学習アルゴリズム
- Authors: Mingcan Wang, Junchang Xin, Luxuan Qu, Qi Chen, Zhiqiong Wang,
- Abstract要約: 結果: RLBayes はグローバルな BN 構造に収束できるが,RLBayes が他のほとんどの探索アルゴリズムよりも優れた効果を持つことを示す実験的に証明されている。
- 参考スコア(独自算出の注目度): 6.048200126394996
- License:
- Abstract: The score-based structure learning of Bayesian network (BN) is an effective way to learn BN models, which are regarded as some of the most compelling probabilistic graphical models in the field of representation and reasoning under uncertainty. However, the search space of structure learning grows super-exponentially as the number of variables increases, which makes BN structure learning an NP-hard problem, as well as a combination optimization problem (COP). Despite the successes of many heuristic methods on it, the results of the structure learning of BN are usually unsatisfactory. Inspired by Q-learning, in this paper, a Bayesian network structure learning algorithm via reinforcement learning-based (RL-based) search strategy is proposed, namely RLBayes. The method borrows the idea of RL and tends to record and guide the learning process by a dynamically maintained Q-table. By creating and maintaining the dynamic Q-table, RLBayes achieve storing the unlimited search space within limited space, thereby achieving the structure learning of BN via Q-learning. Not only is it theoretically proved that RLBayes can converge to the global optimal BN structure, but also it is experimentally proved that RLBayes has a better effect than almost all other heuristic search algorithms.
- Abstract(参考訳): BN(Bayesian Network)のスコアに基づく構造学習はBNモデルを学習する効果的な方法であり、不確実性の下で表現と推論の分野で最も説得力のある確率的グラフィカルモデルの1つである。
しかし、構造学習の探索空間は変数の数が増えるにつれて指数関数的に増大し、BN構造学習はNPハード問題であり、組合せ最適化問題(COP)でもある。
多くのヒューリスティック手法の成功にもかかわらず、BNの構造学習の結果は通常満足できない。
本稿では,強化学習に基づく(RLに基づく)探索戦略によるベイズネットワーク構造学習アルゴリズム,すなわちRLBayesを提案する。
この方法は、RLの概念を借用し、動的に維持されたQテーブルによって学習プロセスを記録し、指導する傾向がある。
動的Qテーブルの作成と維持により、RLBayesは制限された空間内に無制限の検索空間を格納し、QラーニングによるBNの構造学習を実現する。
RLBayesが大域的最適BN構造に収束できることが理論的に証明されているだけでなく、RLBayesが他のほとんどのヒューリスティック検索アルゴリズムよりも優れた効果を持つことが実験的に証明されている。
関連論文リスト
- Enhancing Bayesian Network Structural Learning with Monte Carlo Tree Search [0.6574756524825567]
本稿では,ベイジアンネットワーク(BN)の構造学習のためのモンテカルロ木探索(MCTS)アルゴリズムの適応について述べる。
当初はゲームツリー探索用に設計されていたが、BN構造学習の課題に対処するためにMCTSが再利用された。
我々は、Greedy Equivalent Search (GES)、PC、HCなど、他の検索アルゴリズムから得られる可変順序を組み込むことにより、この問題に対処する半ランダム化アプローチを採用する。
論文 参考訳(メタデータ) (2025-02-03T17:08:21Z) - Upside-Down Reinforcement Learning for More Interpretable Optimal Control [2.06242362470764]
ニューラルネットワーク(NN)以外の関数近似アルゴリズムも,アップサイドダウン強化学習フレームワークで利用できるかを検討する。
我々の実験は、いくつかの一般的な最適制御ベンチマークで実施され、ランダムフォレストや極端ランダム化ツリーのような木に基づく手法が、NNと同様に動作可能であることを示す。
論文 参考訳(メタデータ) (2024-11-18T10:44:20Z) - A Unified Framework for Neural Computation and Learning Over Time [56.44910327178975]
Hamiltonian Learningはニューラルネットワークを"時間とともに"学習するための新しい統合フレームワーク
i)外部ソフトウェアソルバを必要とせずに統合できる、(ii)フィードフォワードおよびリカレントネットワークにおける勾配に基づく学習の概念を一般化する、(iii)新しい視点で開放する、という微分方程式に基づいている。
論文 参考訳(メタデータ) (2024-09-18T14:57:13Z) - Online Network Source Optimization with Graph-Kernel MAB [62.6067511147939]
大規模ネットワークにおける最適なソース配置をオンラインで学習するためのグラフカーネルマルチアームバンディットアルゴリズムであるGrab-UCBを提案する。
適応グラフ辞書モデルを用いて,ネットワークプロセスを記述する。
我々は、ネットワークパラメータに依存する性能保証を導出し、シーケンシャルな意思決定戦略の学習曲線にさらに影響を及ぼす。
論文 参考訳(メタデータ) (2023-07-07T15:03:42Z) - Offline Reinforcement Learning with Differentiable Function
Approximation is Provably Efficient [65.08966446962845]
歴史的データを用いて意思決定戦略を最適化することを目的としたオフライン強化学習は、現実の応用に広く適用されている。
微分関数クラス近似(DFA)を用いたオフライン強化学習の検討から一歩踏み出した。
最も重要なことは、悲観的な適合Q-ラーニングアルゴリズムを解析することにより、オフライン微分関数近似が有効であることを示すことである。
論文 参考訳(メタデータ) (2022-10-03T07:59:42Z) - Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning [92.18524491615548]
対照的な自己指導型学習は、(深層)強化学習(RL)の実践にうまく統合されている
我々は,低ランク遷移を伴うマルコフ決定過程(MDP)とマルコフゲーム(MG)のクラスにおいて,コントラスト学習によってRLをどのように強化できるかを検討する。
オンライン環境下では,MDPやMGのオンラインRLアルゴリズムと対照的な損失を生かした,新しい高信頼境界(UCB)型アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-29T17:29:08Z) - Learning Bayesian Networks in the Presence of Structural Side
Information [22.734574764075226]
本研究では,システムに関する構造的側面情報が得られる場合に,変数の集合のベイズネットワーク(BN)を学習する問題について検討する。
そこで我々は,そのような知識を学習プロセスに効率的に組み込むアルゴリズムを開発した。
我々の研究の結果、木幅の有界BNは複雑に学習できることが示されている。
論文 参考訳(メタデータ) (2021-12-20T22:14:19Z) - Feature Selection for Efficient Local-to-Global Bayesian Network
Structure Learning [18.736822756439437]
本稿では,F2SL(Feature selection-based structure learning)による局所-グローバルBN構造学習手法を提案する。
F2SL法はまずMRMR法を用いてDAG骨格を学習し、その後、骨格の縁を向き付けている。
最先端のローカル-グローバル BN 学習アルゴリズムと比較して、提案アルゴリズムはより効率的で、競合する構造学習の質を提供することを示した。
論文 参考訳(メタデータ) (2021-12-20T07:44:38Z) - Provable Hierarchy-Based Meta-Reinforcement Learning [50.17896588738377]
HRLをメタRL設定で解析し、下流タスクで使用するメタトレーニング中に学習者が潜在階層構造を学習する。
我々は、この自然階層の標本効率の回復を保証し、抽出可能な楽観主義に基づくアルゴリズムとともに「多様性条件」を提供する。
我々の境界は、時間的・状態的・行動的抽象化などのHRL文献に共通する概念を取り入れており、我々の設定と分析が実際にHRLの重要な特徴を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-10-18T17:56:02Z) - Learning Structures for Deep Neural Networks [99.8331363309895]
我々は,情報理論に根ざし,計算神経科学に発達した効率的な符号化原理を採用することを提案する。
スパース符号化は出力信号のエントロピーを効果的に最大化できることを示す。
公開画像分類データセットを用いた実験により,提案アルゴリズムでスクラッチから学習した構造を用いて,最も優れた専門家設計構造に匹敵する分類精度が得られることを示した。
論文 参考訳(メタデータ) (2021-05-27T12:27:24Z) - Any Part of Bayesian Network Structure Learning [17.46459748913491]
ベイズネットワーク(BN)構造の一部を学習し、興味深く挑戦的な問題を研究する。
まず,局所bn構造学習手法が偽エッジ方向問題を持つ理由を説明するために,拡張バックトラックという新しい概念を提案する。
そこで我々は,効率的かつ正確なBN構造学習アルゴリズムAPSLを提案する。
論文 参考訳(メタデータ) (2021-03-23T10:03:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。