論文の概要: A Data-driven feature selection and machine-learning model benchmark for
the prediction of longitudinal dispersion coefficient
- arxiv url: http://arxiv.org/abs/2107.12970v1
- Date: Fri, 16 Jul 2021 09:50:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-01 11:03:59.565950
- Title: A Data-driven feature selection and machine-learning model benchmark for
the prediction of longitudinal dispersion coefficient
- Title(参考訳): 長手分散係数予測のためのデータ駆動型特徴選択と機械学習モデルベンチマーク
- Authors: Yifeng Zhao, Pei Zhang, S.A. Galindo-Torres, Stan Z. Li
- Abstract要約: 縦方向分散(LD)係数の正確な予測は、関連するシミュレーションにおいて性能の飛躍をもたらすことができる。
本研究では, 蒸留した局所最適値と代表MLモデルとの数値比較により, 大域的最適特徴集合を提案した。
その結果,サポートベクタマシンは他のモデルよりも大幅に性能が向上していることがわかった。
- 参考スコア(独自算出の注目度): 29.58577229101903
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Longitudinal Dispersion(LD) is the dominant process of scalar transport in
natural streams. An accurate prediction on LD coefficient(Dl) can produce a
performance leap in related simulation. The emerging machine learning(ML)
techniques provide a self-adaptive tool for this problem. However, most of the
existing studies utilize an unproved quaternion feature set, obtained through
simple theoretical deduction. Few studies have put attention on its reliability
and rationality. Besides, due to the lack of comparative comparison, the proper
choice of ML models in different scenarios still remains unknown. In this
study, the Feature Gradient selector was first adopted to distill the local
optimal feature sets directly from multivariable data. Then, a global optimal
feature set (the channel width, the flow velocity, the channel slope and the
cross sectional area) was proposed through numerical comparison of the
distilled local optimums in performance with representative ML models. The
channel slope is identified to be the key parameter for the prediction of LDC.
Further, we designed a weighted evaluation metric which enables comprehensive
model comparison. With the simple linear model as the baseline, a benchmark of
single and ensemble learning models was provided. Advantages and disadvantages
of the methods involved were also discussed. Results show that the support
vector machine has significantly better performance than other models. Decision
tree is not suitable for this problem due to poor generalization ability.
Notably, simple models show superiority over complicated model on this
low-dimensional problem, for their better balance between regression and
generalization.
- Abstract(参考訳): 縦方向分散(LD)は自然流におけるスカラー輸送の主要な過程である。
LD係数(Dl)の正確な予測は、関連するシミュレーションにおいて性能の飛躍をもたらす。
新興機械学習(ML)技術は、この問題に対する自己適応ツールを提供する。
しかし、既存の研究の多くは、単純な理論的推論によって得られた証明されていない四元数の特徴集合を利用している。
信頼性と合理性に注目する研究はほとんどない。
さらに、比較の欠如により、異なるシナリオにおけるMLモデルの適切な選択は依然として不明である。
本研究では,多変数データから局所最適特徴集合を直接抽出するために,まず特徴勾配セレクタを採用した。
次に, 蒸留した局所最適特性を代表的mlモデルと数値的に比較し, 最適特徴集合(流路幅, 流速, 流路傾斜, 断面面積)を提案した。
流路傾斜はLCDの予測の鍵となるパラメータである。
さらに,包括的モデル比較が可能な重み付き評価指標を設計した。
ベースラインとして単純な線形モデルを用い,単一およびアンサンブル学習モデルのベンチマークを行った。
関連する手法の利点と欠点についても論じた。
その結果,サポートベクタマシンは他のモデルよりも大幅に性能が向上した。
一般化能力の低さから、決定木はこの問題には適さない。
特に、単純モデルは、回帰と一般化のバランスが良くなるため、この低次元問題における複雑なモデルよりも優れている。
関連論文リスト
- Scaling and renormalization in high-dimensional regression [72.59731158970894]
本稿では,様々な高次元リッジ回帰モデルの訓練および一般化性能の簡潔な導出について述べる。
本稿では,物理と深層学習の背景を持つ読者を対象に,これらのトピックに関する最近の研究成果の紹介とレビューを行う。
論文 参考訳(メタデータ) (2024-05-01T15:59:00Z) - Variational Bayesian surrogate modelling with application to robust design optimisation [0.9626666671366836]
サロゲートモデルは複雑な計算モデルに対して素早く評価できる近似を提供する。
入力の不確かさと次元減少を伴う統計的代理を構築するためのベイズ推定について考察する。
コスト関数がモデル出力の平均および標準偏差の重み付け和に依存するような本質的で頑健な構造最適化問題を示す。
論文 参考訳(メタデータ) (2024-04-23T09:22:35Z) - Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Online Variational Sequential Monte Carlo [49.97673761305336]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - Learning Residual Model of Model Predictive Control via Random Forests
for Autonomous Driving [13.865293598486492]
自律運転における予測制御(MPC)の大きな問題は、システムモデルの予測と計算の矛盾である。
本稿では、MPC追跡精度をプログラム(QP)問題最適化として再構成し、プログラム(QP)が効果的に解けるようにする。
論文 参考訳(メタデータ) (2023-04-10T03:32:09Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Variational Inference with NoFAS: Normalizing Flow with Adaptive
Surrogate for Computationally Expensive Models [7.217783736464403]
マルコフ連鎖モンテカルロのようなサンプリングに基づくアプローチの使用は、それぞれの可能性評価が計算的に高価であるときに難解になる可能性がある。
変分推論と正規化フローを組み合わせた新しいアプローチは、潜在変数空間の次元と線形にしか成長しない計算コストによって特徴づけられる。
本稿では,ニューラルネットワークサロゲートモデルの正規化フローパラメータと重みを代わりに更新する最適化戦略である,適応サロゲートを用いた正規化フロー(NoFAS)を提案する。
論文 参考訳(メタデータ) (2021-08-28T14:31:45Z) - An interpretable prediction model for longitudinal dispersion
coefficient in natural streams based on evolutionary symbolic regression
network [30.99493442296212]
縦分散係数(LDC)の予測には様々な方法が提案されている。
本稿では,まずこれらの手法の詳細な解析を行い,その欠陥を明らかにする。
次に、進化的記号回帰ネットワーク(ESRN)と呼ばれる新しい記号回帰法を設計する。
論文 参考訳(メタデータ) (2021-06-17T07:06:05Z) - Combining data assimilation and machine learning to infer unresolved
scale parametrisation [0.0]
近年、動的数値モデルにおいて、未解決プロセスのデータ駆動パラメトリクスを考案する機械学習が提案されている。
我々のゴールは、高分解能シミュレーションの使用を超えて、直接データを用いてMLベースのパラメーターを訓練することである。
いずれの場合も、ハイブリッドモデルは、切り落とされたモデルよりも優れたスキルで予測を得られることを示す。
論文 参考訳(メタデータ) (2020-09-09T14:12:11Z) - Non-parametric Models for Non-negative Functions [48.7576911714538]
同じ良い線形モデルから非負関数に対する最初のモデルを提供する。
我々は、それが表現定理を認め、凸問題に対する効率的な二重定式化を提供することを証明した。
論文 参考訳(メタデータ) (2020-07-08T07:17:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。