論文の概要: A reinforcement learning approach to resource allocation in genomic
selection
- arxiv url: http://arxiv.org/abs/2107.10901v1
- Date: Thu, 22 Jul 2021 19:55:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-26 14:00:23.213240
- Title: A reinforcement learning approach to resource allocation in genomic
selection
- Title(参考訳): ゲノム選択における資源配分への強化学習アプローチ
- Authors: Saba Moeinizade, Guiping Hu, Lizhi Wang
- Abstract要約: 我々は,異なる世代にまたがって限られた資源を割り当てることを自動的に学習する強化学習に基づくアルゴリズムを開発した。
本研究では,実データを用いたケーススタディを用いて,遺伝的ゲイン向上のための提案手法の有効性を実証する。
- 参考スコア(独自算出の注目度): 11.369433574169994
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Genomic selection (GS) is a technique that plant breeders use to select
individuals to mate and produce new generations of species. Allocation of
resources is a key factor in GS. At each selection cycle, breeders are facing
the choice of budget allocation to make crosses and produce the next generation
of breeding parents. Inspired by recent advances in reinforcement learning for
AI problems, we develop a reinforcement learning-based algorithm to
automatically learn to allocate limited resources across different generations
of breeding. We mathematically formulate the problem in the framework of Markov
Decision Process (MDP) by defining state and action spaces. To avoid the
explosion of the state space, an integer linear program is proposed that
quantifies the trade-off between resources and time. Finally, we propose a
value function approximation method to estimate the action-value function and
then develop a greedy policy improvement technique to find the optimal
resources. We demonstrate the effectiveness of the proposed method in enhancing
genetic gain using a case study with realistic data.
- Abstract(参考訳): ゲノミカル・セレクション(英: genomic selection、gs)は、植物育種者が新しい世代の種を交配し生産するために使用する技術である。
リソースの割り当てはGSの重要な要素である。
各選抜サイクルにおいて、ブリーダーは交配と次世代の育児親を生産するために予算配分の選択に直面している。
ai問題に対する強化学習の最近の進歩に触発されて,様々な世代にわたる限られた資源の割り当てを自動学習する強化学習ベースのアルゴリズムを開発した。
状態空間と行動空間を定義することにより,マルコフ決定過程(MDP)の枠組みにおける問題を数学的に定式化する。
状態空間の爆発を避けるため、資源と時間の間のトレードオフを定量化する整数線形プログラムが提案されている。
最後に, 行動-価値関数を推定する値関数近似法を提案し, 最適資源を求めるための欲望政策改善手法を考案する。
本研究では,実データを用いたケーススタディを用いて,遺伝的ゲイン向上における提案手法の有効性を実証する。
関連論文リスト
- Two-Timescale Model Caching and Resource Allocation for Edge-Enabled AI-Generated Content Services [55.0337199834612]
Generative AI(GenAI)は、カスタマイズされたパーソナライズされたAI生成コンテンツ(AIGC)サービスを可能にするトランスフォーメーション技術として登場した。
これらのサービスは数十億のパラメータを持つGenAIモデルの実行を必要とし、リソース制限の無線エッジに重大な障害を生じさせる。
我々は、AIGC品質とレイテンシメトリクスのトレードオフをバランスさせるために、AIGCサービスのジョイントモデルキャッシングとリソースアロケーションの定式化を導入する。
論文 参考訳(メタデータ) (2024-11-03T07:01:13Z) - Ancestral Reinforcement Learning: Unifying Zeroth-Order Optimization and Genetic Algorithms for Reinforcement Learning [0.8287206589886879]
Ancestral Reinforcement Learning (ARL)は、ZOOの頑健な勾配推定と遺伝的アルゴリズムの探索力を組み合わせたものである。
理論的には、ARLにおける集団探索は、対象関数のKL正規化を暗黙的に誘導し、探索が強化される。
論文 参考訳(メタデータ) (2024-08-18T14:16:55Z) - Genetic Algorithm enhanced by Deep Reinforcement Learning in parent
selection mechanism and mutation : Minimizing makespan in permutation flow
shop scheduling problems [0.18846515534317265]
RL+GA法はフローショップスケジューリング問題(FSP)で特に検証された。
このハイブリッドアルゴリズムはニューラルネットワーク(NN)を導入し、Qラーニング(Q-learning)というオフ政治手法を使用する。
本研究は, プリミティブGAの性能向上におけるRL+GAアプローチの有効性を明らかにするものである。
論文 参考訳(メタデータ) (2023-11-10T08:51:42Z) - Reinforcement Learning from Diverse Human Preferences [68.4294547285359]
本稿では,人選好ラベルをクラウドソーシングし,多様な嗜好から学習する手法を開発した。
提案手法はDMcontrolとMeta-worldの様々なタスクでテストされる。
多様なフィードバックから学ぶと、既存の好みベースのRLアルゴリズムよりも一貫性があり、大幅に改善されている。
論文 参考訳(メタデータ) (2023-01-27T15:18:54Z) - Genetic Imitation Learning by Reward Extrapolation [6.340280403330784]
我々は,遺伝的アルゴリズムと模倣学習を統合したGenILという手法を提案する。
遺伝的アルゴリズムの関与は、様々なリターンで軌道を再現することで、データ効率を向上させる。
我々はAtariドメインとMujocoドメインの両方でGenILをテストし、その結果、以前の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-01-03T14:12:28Z) - Training and Evaluation of Deep Policies using Reinforcement Learning
and Generative Models [67.78935378952146]
GenRLはシーケンシャルな意思決定問題を解決するためのフレームワークである。
強化学習と潜在変数生成モデルの組み合わせを利用する。
最終方針訓練の性能に最も影響を与える生成モデルの特徴を実験的に決定する。
論文 参考訳(メタデータ) (2022-04-18T22:02:32Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - Unsupervised Resource Allocation with Graph Neural Networks [0.0]
本研究では,教師なしの方法で資源の配分方法を学ぶことによって,グローバルなユーティリティ関数を最大化する手法を提案する。
我々は,GNNを用いて最適に近いアロケーションポリシーの報酬構造を学習することを提案する。
論文 参考訳(メタデータ) (2021-06-17T18:44:04Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - Lineage Evolution Reinforcement Learning [15.469857142001482]
線形進化強化学習は一般エージェント集団学習システムに対応する派生アルゴリズムである。
実験により,アタリ2600のゲームにおいて,系統進化の考え方により,元の強化学習アルゴリズムの性能が向上することが確認された。
論文 参考訳(メタデータ) (2020-09-26T11:58:16Z) - Resource Allocation via Model-Free Deep Learning in Free Space Optical
Communications [119.81868223344173]
本稿では,自由空間光学(FSO)通信におけるチャネルフェージング効果の緩和のための資源配分の一般的な問題について検討する。
本フレームワークでは,FSO資源割り当て問題を解決する2つのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-27T17:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。