論文の概要: Deep Hurdle Networks for Zero-Inflated Multi-Target Regression:
Application to Multiple Species Abundance Estimation
- arxiv url: http://arxiv.org/abs/2010.16040v1
- Date: Fri, 30 Oct 2020 03:26:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 15:50:47.654077
- Title: Deep Hurdle Networks for Zero-Inflated Multi-Target Regression:
Application to Multiple Species Abundance Estimation
- Title(参考訳): zero-inflated multi-target regressionのためのディープハードルネットワーク:多種多量推定への応用
- Authors: Shufeng Kong, Junwen Bai, Jae Hee Lee, Di Chen, Andrew Allyn, Michelle
Stuart, Malin Pinsky, Katherine Mills, Carla P. Gomes
- Abstract要約: 計算持続可能性の鍵となる問題は、時間とともに風景にまたがる種の分布を理解することである。
ゼロインフレートマルチターゲット回帰問題に対する新しいディープモデルを提案する。
我々のモデルは、2つの挑戦的な現実世界の種分布データセットに対して、既存の最先端のベースラインよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 32.29701235295987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A key problem in computational sustainability is to understand the
distribution of species across landscapes over time. This question gives rise
to challenging large-scale prediction problems since (i) hundreds of species
have to be simultaneously modeled and (ii) the survey data are usually inflated
with zeros due to the absence of species for a large number of sites. The
problem of tackling both issues simultaneously, which we refer to as the
zero-inflated multi-target regression problem, has not been addressed by
previous methods in statistics and machine learning. In this paper, we propose
a novel deep model for the zero-inflated multi-target regression problem. To
this end, we first model the joint distribution of multiple response variables
as a multivariate probit model and then couple the positive outcomes with a
multivariate log-normal distribution. By penalizing the difference between the
two distributions' covariance matrices, a link between both distributions is
established. The whole model is cast as an end-to-end learning framework and we
provide an efficient learning algorithm for our model that can be fully
implemented on GPUs. We show that our model outperforms the existing
state-of-the-art baselines on two challenging real-world species distribution
datasets concerning bird and fish populations.
- Abstract(参考訳): 計算持続可能性の鍵となる問題は、時間とともに景観にまたがる種の分布を理解することである。
この疑問は大規模な予測問題を引き起こす。
(i)何百もの種を同時にモデル化し
(ii) 調査データは通常, 多数の部位に種が存在しないため, ゼロで膨らませる。
ゼロ膨張多目標回帰問題 (zero-inflated multi-target regression problem) と呼ぶ2つの問題を同時に取り組む問題は、これまでの統計学や機械学習の手法では解決されていない。
本稿では,ゼロ膨張多目標回帰問題に対する新しい深層モデルを提案する。
この目的のために、まず複数の応答変数の結合分布を多変量プロビットモデルとしてモデル化し、その正の結果を多変量ログ正規分布と組み合わせる。
2つの分布の共分散行列の差分をペナル化することにより、両分布間のリンクを確立する。
モデル全体をエンドツーエンドの学習フレームワークとしてキャストし、GPUで完全に実装可能なモデルのための効率的な学習アルゴリズムを提供する。
鳥と魚の個体群に関する2つの実世界の種分布データセットにおいて,本モデルが既存の最先端のベースラインを上回っていることを示す。
関連論文リスト
- A Complete Decomposition of KL Error using Refined Information and Mode Interaction Selection [11.994525728378603]
我々は高次モード相互作用に着目したログ線形モデルの古典的定式化を再考する。
学習した分布は、実際に利用可能な有限量のデータをより効率的に利用することができる。
論文 参考訳(メタデータ) (2024-10-15T18:08:32Z) - Hybrid Spatial Representations for Species Distribution Modeling [4.015569252776372]
種分布モデリング(SDM)は、ある種が地球上の特定の位置に存在するかどうかを予測することを目的としている。
これまでの研究では、有望な結果を達成するモデルを構築するために、ニューラルな暗黙表現を使用してきた。
暗黙の埋め込みと明示的な埋め込みを組み合わせたハイブリッドな埋め込み方式を提案する。
論文 参考訳(メタデータ) (2024-10-14T17:59:58Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Bayesian predictive modeling of multi-source multi-way data [0.0]
初期鉄欠乏症 (ID) の予測因子として, 複数のオミクス源から得られた分子データについて検討した。
係数に低ランク構造を持つ線形モデルを用いて多方向依存を捕捉する。
本モデルでは, 誤分類率と推定係数と真の係数との相関から, 期待通りの性能を示すことを示す。
論文 参考訳(メタデータ) (2022-08-05T21:58:23Z) - Multi-scale Attention Flow for Probabilistic Time Series Forecasting [68.20798558048678]
マルチスケールアテンション正規化フロー(MANF)と呼ばれる非自己回帰型ディープラーニングモデルを提案する。
我々のモデルは累積誤差の影響を回避し、時間の複雑さを増大させない。
本モデルは,多くの多変量データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-16T07:53:42Z) - Machine Learning for Multi-Output Regression: When should a holistic
multivariate approach be preferred over separate univariate ones? [62.997667081978825]
ランダムフォレストのような木に基づくアンサンブルは、統計学の手法の中で近代的な古典である。
これらの手法を広範囲なシミュレーションで比較し,多変量アンサンブル技術を用いた場合の主問題に答える。
論文 参考訳(メタデータ) (2022-01-14T08:44:25Z) - X-model: Improving Data Efficiency in Deep Learning with A Minimax Model [78.55482897452417]
ディープラーニングにおける分類と回帰設定の両面でのデータ効率の向上を目標とする。
両世界の力を生かすために,我々は新しいX-モデルを提案する。
X-モデルは、特徴抽出器とタスク固有のヘッドの間でミニマックスゲームを行う。
論文 参考訳(メタデータ) (2021-10-09T13:56:48Z) - Flexible Model Aggregation for Quantile Regression [92.63075261170302]
量子回帰は、予測の不確実性を定量化する必要性によって動機付けられた統計学習の基本的な問題である。
条件付き量子モデルの任意の数を集約する手法について検討する。
この論文で検討するモデルはすべて、現代のディープラーニングツールキットに適合します。
論文 参考訳(メタデータ) (2021-02-26T23:21:16Z) - Multivariate Probabilistic Time Series Forecasting via Conditioned
Normalizing Flows [8.859284959951204]
時系列予測は科学的・工学的な問題の基本である。
深層学習法はこの問題に適している。
多くの実世界のデータセットにおける標準メトリクスの最先端よりも改善されていることを示す。
論文 参考訳(メタデータ) (2020-02-14T16:16:51Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。