論文の概要: Learning Bayesian Networks with Heterogeneous Agronomic Data Sets via
Mixed-Effect Models and Hierarchical Clustering
- arxiv url: http://arxiv.org/abs/2308.06399v3
- Date: Wed, 25 Oct 2023 07:16:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 20:01:17.191948
- Title: Learning Bayesian Networks with Heterogeneous Agronomic Data Sets via
Mixed-Effect Models and Hierarchical Clustering
- Title(参考訳): 混合効果モデルと階層クラスタリングによる異種農業データセットを用いたベイズネットワークの学習
- Authors: Lorenzo Valleggi and Marco Scutari and Federico Mattia Stefanini
- Abstract要約: 本研究では,ランダム効果をBN学習に統合する新しい手法を提案する。
その結果,提案手法によりBN学習が促進され,より解釈可能なモデルがもたらされることが示唆された。
同時に、トウモロコシ収量予測の誤差率を28%から17%に下げる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Maize is a major crop providing vital calories in sub-Saharan Africa, Asia
and Latin America, with a global cultivation area of 197 million hectares in
2021. Therefore, many statistical models (such as mixed-effect and random
coefficients models) and machine learning models (such as random forests and
deep learning architectures) have been developed to predict maize yield and how
it is affected by genotype, environment and genotype-environment interaction
factors, including field management. However, these models do not fully
leverage the network of causal relationships between these factors and the
hierarchical structure of the agronomic data arising from data collection.
Bayesian networks (BNs) provide a powerful framework for modelling causal and
probabilistic relationships using directed acyclic graphs to illustrate the
connections between variables. This study introduces a novel approach that
integrates random effects into BN learning. Rooted in the linear mixed-effects
models framework, it is particularly well-suited to hierarchical data. Results
from a real-world agronomic trial suggest that the proposed approach enhances
BN learning, leading to a more interpretable model and discovering new causal
connections. At the same time, the error rate of maize yield prediction is
reduced from 28% to 17%. Therefore, we argue that BNs should be the tool of
choice to construct practical decision support tools for hierarchical agronomic
data that allow for causal inference.
- Abstract(参考訳): トウモロコシはサハラ以南のアフリカ、アジア、ラテンアメリカで重要なカロリーを提供する主要作物であり、2021年の世界の栽培面積は1億9700万ヘクタールである。
そのため、トウモロコシの収量を予測するため、多くの統計モデル(混合効果モデルやランダム係数モデルなど)や機械学習モデル(ランダム森林やディープラーニングアーキテクチャなど)が開発され、フィールド管理を含むジェノタイプ、環境、ジェノタイプと環境の相互作用要因の影響を受けている。
しかし、これらのモデルは、これらの要因間の因果関係のネットワークと、データ収集から生じる農業データの階層構造を十分に活用していない。
ベイズネットワーク(bns)は、有向非巡回グラフを用いて変数間の接続を記述するために因果関係と確率関係をモデル化するための強力なフレームワークを提供する。
本研究では,ランダム効果をBN学習に統合する新しい手法を提案する。
線形混合効果モデルフレームワークに根ざしており、特に階層データに適している。
実世界の農業試験の結果は、提案手法がBN学習を強化し、より解釈可能なモデルと新たな因果関係の発見につながることを示唆している。
同時に、トウモロコシ収率予測の誤差率が28%から17%に低下する。
したがって、BNは因果推論を可能にする階層的農業データのための実用的な意思決定支援ツールを構築するためのツールであるべきだと論じる。
関連論文リスト
- Generalized Factor Neural Network Model for High-dimensional Regression [50.554377879576066]
複素・非線形・雑音に隠れた潜在低次元構造を持つ高次元データセットをモデル化する課題に取り組む。
我々のアプローチは、非パラメトリック回帰、因子モデル、高次元回帰のためのニューラルネットワークの概念のシームレスな統合を可能にする。
論文 参考訳(メタデータ) (2025-02-16T23:13:55Z) - An unified approach to link prediction in collaboration networks [0.0]
本稿では、協調ネットワークにおけるリンク予測の3つのアプローチについて検討し、比較する。
ERGMはネットワーク内の一般的な構造パターンをキャプチャするために使用される。
GCNとWord2Vec+MLPモデルはディープラーニング技術を利用してノードとその関係の適応的構造表現を学習する。
論文 参考訳(メタデータ) (2024-11-01T22:40:39Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Innovations in Agricultural Forecasting: A Multivariate Regression Study on Global Crop Yield Prediction [0.0]
本研究は,27年間で開発途上国37カ国の収量予測に6つの回帰モデルを適用した。
4つの主要な訓練パラメータ, 殺虫剤 (tonnes), 降雨剤 (mm), 温度 (Celsius), 収量 (hg/ha) が与えられた結果, 我々のランダムフォレスト回帰モデルは0.94の判定係数 (r2) を達成した。
論文 参考訳(メタデータ) (2023-12-04T18:45:28Z) - From Identifiable Causal Representations to Controllable Counterfactual Generation: A Survey on Causal Generative Modeling [17.074858228123706]
基本的な理論、方法論、欠点、データセット、メトリクスに重点を置いています。
フェアネス、プライバシ、アウト・オブ・ディストリビューションの一般化、精密医療、生物科学における因果生成モデルの応用について述べる。
論文 参考訳(メタデータ) (2023-10-17T05:45:32Z) - Scaling Laws Do Not Scale [54.72120385955072]
最近の研究によると、データセットのサイズが大きくなると、そのデータセットでトレーニングされたモデルのパフォーマンスが向上する。
このスケーリング法則の関係は、モデルのアウトプットの質を異なる集団がどのように認識するかと一致しないパフォーマンスを測定するために使われる指標に依存する、と我々は主張する。
異なるコミュニティは、互いに緊張関係にある価値を持ち、モデル評価に使用されるメトリクスについて、困難で、潜在的に不可能な選択をもたらす可能性がある。
論文 参考訳(メタデータ) (2023-07-05T15:32:21Z) - Characterization and Greedy Learning of Gaussian Structural Causal
Models under Unknown Interventions [3.441021278275805]
本研究は,各実験における介入対象が不明な場合の観察に基づく因果構造回復の問題について考察する。
干渉対象の知識のないデータ生成モデルの同値クラスを復元するために,GnIESと呼ばれるグリーディアルゴリズムを導出する。
我々は,この手法を活用し,合成,実,半合成のデータセット上でのGnIESの性能を評価する。
論文 参考訳(メタデータ) (2022-11-27T17:37:21Z) - Towards Understanding and Mitigating Dimensional Collapse in Heterogeneous Federated Learning [112.69497636932955]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - DRFLM: Distributionally Robust Federated Learning with Inter-client
Noise via Local Mixup [58.894901088797376]
連合学習は、生データをリークすることなく、複数の組織のデータを使用してグローバルモデルをトレーニングするための有望なアプローチとして登場した。
上記の2つの課題を同時に解決するための一般的な枠組みを提案する。
我々は、ロバストネス解析、収束解析、一般化能力を含む包括的理論的解析を提供する。
論文 参考訳(メタデータ) (2022-04-16T08:08:29Z) - Predicting Census Survey Response Rates With Parsimonious Additive
Models and Structured Interactions [14.003044924094597]
本研究では, フレキシブルで解釈可能な非パラメトリックモデル群を用いて, アンケート応答率を予測することの問題点を考察する。
この研究は、米国国勢調査局(US Census Bureau)の有名なROAMアプリケーションによって動機付けられている。
論文 参考訳(メタデータ) (2021-08-24T17:49:55Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。