論文の概要: Efficient Reconstruction of Stochastic Pedigrees: Some Steps From Theory
to Practice
- arxiv url: http://arxiv.org/abs/2204.04573v1
- Date: Sun, 10 Apr 2022 01:08:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-12 19:04:24.530683
- Title: Efficient Reconstruction of Stochastic Pedigrees: Some Steps From Theory
to Practice
- Title(参考訳): 確率的家系の効率的な再構築:理論から実践へ
- Authors: Elchanan Mossel, David Vulakh
- Abstract要約: モデルに基づいて生成したシミュレーションデータに対してREC-GENの性能について検討した。
祖先再構成と呼ばれるアルゴリズムの主なステップは、交配を伴わないが、ランダムな交配個体群ではうまく機能しない理想化された環境で正確に機能することが示される。
- 参考スコア(独自算出の注目度): 5.749044590090683
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In an extant population, how much information do extant individuals provide
on the pedigree of their ancestors? Recent work by Kim, Mossel, Ramnarayan and
Turner (2020) studied this question under a number of simplifying assumptions,
including random mating, fixed length inheritance blocks and sufficiently large
founding population. They showed that under these conditions if the average
number of offspring is a sufficiently large constant, then it is possible to
recover a large fraction of the pedigree structure and genetic content by an
algorithm they named REC-GEN.
We are interested in studying the performance of REC-GEN on simulated data
generated according to the model. As a first step, we improve the running time
of the algorithm. However, we observe that even the faster version of the
algorithm does not do well in any simulations in recovering the pedigree beyond
2 generations. We claim that this is due to the inbreeding present in any
setting where the algorithm can be run, even on simulated data. To support the
claim we show that a main step of the algorithm, called ancestral
reconstruction, performs accurately in a idealized setting with no inbreeding
but performs poorly in random mating populations.
To overcome the poor behavior of REC-GEN we introduce a Belief-Propagation
based heuristic that accounts for the inbreeding and performs much better in
our simulations.
- Abstract(参考訳): 現存する人口では、現存する個人は先祖の血統にどの程度の情報を提供しているか。
kim, mossel, ramnarayan and turner (2020) による最近の研究は、ランダムな交配、固定長継承ブロック、そして十分に大きな人口を含む多くの単純な仮定の下でこの問題を研究した。
これらの条件下では、平均子孫数が十分に大きな定数であれば、REC-GENと命名したアルゴリズムにより、家系構造と遺伝的含量の大部分を回収できることを示した。
モデルに基づいて生成されたシミュレーションデータに対してREC-GENの性能を検討することに興味がある。
最初のステップとして,アルゴリズムの実行時間を改善する。
しかし,アルゴリズムの高速バージョンでさえ,2世代以上の家系を復元する際のシミュレーションではうまくいかないことが観察された。
これは、シミュレーションされたデータであっても、アルゴリズムが実行できる任意の設定において、インブリードが存在するためであると主張する。
この主張を支持するために,祖先再構成と呼ばれるアルゴリズムの主ステップが,交配を伴わないがランダムな交配個体群では不十分な理想化環境で正確に実行されることを示す。
REC-GENの粗悪な振る舞いを克服するために,我々のシミュレーションにおいて,近縁関係を考慮し,より優れた性能を発揮するBreief-Propagationベースのヒューリスティックを導入する。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - The Power of Resets in Online Reinforcement Learning [73.64852266145387]
ローカルシミュレータアクセス(あるいはローカルプランニング)を用いたオンライン強化学習を通してシミュレータのパワーを探求する。
カバー性が低いMPPは,Qstar$-realizabilityのみのサンプル効率で学習可能であることを示す。
ローカルシミュレーターアクセス下では, 悪名高いExogenous Block MDP問題が抽出可能であることを示す。
論文 参考訳(メタデータ) (2024-04-23T18:09:53Z) - Already Moderate Population Sizes Provably Yield Strong Robustness to Noise [53.27802701790209]
2つの進化的アルゴリズムは、OneMaxベンチマークのランタイムを増大させることなく、一定のノイズ確率を許容できることを示す。
この結果は、ノイズのない子孫は親と騒々しい子孫の間に偏りのある均一な交叉と見なすことができるという、新しい証明の議論に基づいている。
論文 参考訳(メタデータ) (2024-04-02T16:35:52Z) - The tree reconstruction game: phylogenetic reconstruction using
reinforcement learning [30.114112337828875]
本研究では,系統樹の再構築に挑戦する強化学習アルゴリズムを提案する。
本研究では,強化学習を用いて最適な探索戦略を学習できることを実証する。
以上の結果から, 推定された系統の確率スコアは, 広く使われているソフトウェアと類似していることが示唆された。
論文 参考訳(メタデータ) (2023-03-12T16:19:06Z) - Symbolic Regression via Neural-Guided Genetic Programming Population
Seeding [6.9501458586819505]
シンボリック回帰(英: Symbolic regression)は、NPハードであると一般に信じられている離散最適化問題である。
この問題を解決するための従来のアプローチには、ニューラルガイド付き検索と遺伝的プログラミングがある。
本稿では、ランダムに再起動する遺伝的プログラミングコンポーネントの開始集団をシードする神経誘導成分を提案する。
論文 参考訳(メタデータ) (2021-10-29T19:26:41Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - Splitting Gaussian Process Regression for Streaming Data [1.2691047660244335]
入力空間を逐次分割し,各領域に局所化ガウス過程を適用するアルゴリズムを提案する。
このアルゴリズムは既存の手法よりも時間と空間の複雑さが優れていることが示されており、そのシーケンシャルな性質により、ストリーミングデータに応用できる。
我々の知る限りでは、このモデルは線形メモリ複雑性を実現するための最初の局所ガウス過程回帰モデルである。
論文 参考訳(メタデータ) (2020-10-06T01:37:13Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Real-Time Regression with Dividing Local Gaussian Processes [62.01822866877782]
局所ガウス過程は、ガウス過程の回帰に基づく新しい、計算効率の良いモデリング手法である。
入力空間の反復的データ駆動分割により、実際にはトレーニングポイントの総数において、サブ線形計算複雑性が達成される。
実世界のデータセットに対する数値的な評価は、予測と更新の速度だけでなく、精度の点で他の最先端手法よりも有利であることを示している。
論文 参考訳(メタデータ) (2020-06-16T18:43:31Z) - Efficient Reconstruction of Stochastic Pedigrees [7.847440192956767]
我々は、遺伝子データから既存の集団の系譜やテキストペディグリーを再構築する、 sc Rec-Gen と呼ばれる新しいアルゴリズムを導入する。
我々は,現実の系譜の特徴の一部を再現した理想化された生成モデルから,Sc Rec-Genの有効性の数学的証明を行うことによって,我々のアプローチを正当化する。
論文 参考訳(メタデータ) (2020-05-08T01:08:36Z) - Lower Bounds for Non-Elitist Evolutionary Algorithms via Negative
Multiplicative Drift [9.853329403413701]
乗法的ドリフトシナリオに対する単純な負のドリフト定理は既存の解析を単純化できることを示す。
我々は、非エリート変異に基づく進化アルゴリズムのランタイムにおける下位境界を証明するための最も一般的なツールの1つである集団法において、Lehre's emph negative drift in populations法(PPSN 2010)についてより詳細に論じる。
論文 参考訳(メタデータ) (2020-05-02T15:10:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。