論文の概要: Denoising ESG: quantifying data uncertainty from missing data with Machine Learning and prediction intervals
- arxiv url: http://arxiv.org/abs/2407.20047v1
- Date: Mon, 29 Jul 2024 14:31:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 13:34:43.340928
- Title: Denoising ESG: quantifying data uncertainty from missing data with Machine Learning and prediction intervals
- Title(参考訳): Denoising ESG: 機械学習と予測間隔による欠落データからのデータの不確実性を定量化する
- Authors: Sergio Caprioli, Jacopo Foschi, Riccardo Crupi, Alessandro Sabatino,
- Abstract要約: 本稿では,実世界のESGデータセットに欠落したデータを計算するために,確立された機械学習手法の適用について検討する。
本研究は,複数の計算手法を用いて計算手法のロバスト性を評価し,欠落データに関連する不確実性を定量化する。
- 参考スコア(独自算出の注目度): 43.5280757929682
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Environmental, Social, and Governance (ESG) datasets are frequently plagued by significant data gaps, leading to inconsistencies in ESG ratings due to varying imputation methods. This paper explores the application of established machine learning techniques for imputing missing data in a real-world ESG dataset, emphasizing the quantification of uncertainty through prediction intervals. By employing multiple imputation strategies, this study assesses the robustness of imputation methods and quantifies the uncertainty associated with missing data. The findings highlight the importance of probabilistic machine learning models in providing better understanding of ESG scores, thereby addressing the inherent risks of wrong ratings due to incomplete data. This approach improves imputation practices to enhance the reliability of ESG ratings.
- Abstract(参考訳): 環境、社会、ガバナンス(ESG)データセットは、しばしば大きなデータギャップに悩まされ、様々な計算方法によるESG評価の不整合を引き起こす。
本稿では、実世界のESGデータセットに欠落したデータを計算するための機械学習手法の適用について検討し、予測間隔による不確実性の定量化を強調した。
本研究は,複数の計算手法を用いて計算手法のロバスト性を評価し,欠落データに関連する不確実性を定量化する。
この結果は、ESGスコアをよりよく理解することにおける確率論的機械学習モデルの重要性を強調し、不完全なデータによる誤った評価の固有のリスクに対処する。
このアプローチは、ESGレーティングの信頼性を高めるために、計算の慣行を改善する。
関連論文リスト
- An Investigation on Machine Learning Predictive Accuracy Improvement and Uncertainty Reduction using VAE-based Data Augmentation [2.517043342442487]
深層生成学習は、特定のMLモデルを使用して、既存のデータの基盤となる分布を学習し、実際のデータに似た合成サンプルを生成する。
本研究では,変分オートエンコーダ(VAE)を用いた深部生成モデルを用いて,データ拡張の有効性を評価することを目的とする。
本研究では,拡張データを用いてトレーニングしたディープニューラルネットワーク(DNN)モデルの予測において,データ拡張が精度の向上につながるかどうかを検討した。
論文 参考訳(メタデータ) (2024-10-24T18:15:48Z) - Uncertainty for Active Learning on Graphs [70.44714133412592]
不確実性サンプリングは、機械学習モデルのデータ効率を改善することを目的とした、アクティブな学習戦略である。
予測の不確実性を超えた不確実性サンプリングをベンチマークし、他のアクティブラーニング戦略に対する大きなパフォーマンスギャップを強調します。
提案手法は,データ生成プロセスの観点から基幹的ベイズ不確実性推定法を開発し,不確実性サンプリングを最適クエリへ導く上での有効性を実証する。
論文 参考訳(メタデータ) (2024-05-02T16:50:47Z) - On the Validation of Gibbs Algorithms: Training Datasets, Test Datasets
and their Aggregation [70.540936204654]
Gibbsアルゴリズム(GA)のトレーニングデータへの依存を解析的に特徴付ける。
この記述により、異なるデータセットでトレーニングされたGAのトレーニングエラーとテストエラーを含む明示的な表現の開発が可能になる。
論文 参考訳(メタデータ) (2023-06-21T16:51:50Z) - Machine Learning Based Missing Values Imputation in Categorical Datasets [2.5611256859404983]
この研究では、分類データセットのギャップを埋めるための機械学習アルゴリズムの使用について検討した。
Error Correction Output Codesフレームワークを使用して構築されたアンサンブルモデルに重点が置かれた。
大量のラベル付きデータの要求を含む、これらの奨励的な結果にもかかわらず、データ計算の欠如に対する深い学習には障害がある。
論文 参考訳(メタデータ) (2023-06-10T03:29:48Z) - Lightweight, Uncertainty-Aware Conformalized Visual Odometry [2.429910016019183]
データ駆動型ビジュアルオドメトリー(VO)は、自律エッジロボティクスにとって重要なサブルーチンである。
昆虫スケールドローンや外科ロボットのような最先端ロボットデバイスは、VOの予測の不確実性を推定する計算的に効率的な枠組みを欠いている。
本稿では,共形推論(CI)を利用してVOの不確実な帯域を抽出する,新しい,軽量で統計的に堅牢なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-03T20:37:55Z) - Uncertainty Estimation by Fisher Information-based Evidential Deep
Learning [61.94125052118442]
不確実性推定は、ディープラーニングを実用アプリケーションで信頼できるものにする鍵となる要素である。
漁業情報に基づくエビデンシャルディープラーニング(mathcalI$-EDL)を提案する。
特に,各サンプルが有する証拠の情報量を測定するためにFisher Information Matrix (FIM)を導入し,目的的損失項を動的に重み付けし,不確実なクラスの表現学習に集中させる。
論文 参考訳(メタデータ) (2023-03-03T16:12:59Z) - Self-Supervised Learning for Data Scarcity in a Fatigue Damage
Prognostic Problem [0.0]
自己監督学習(Self-Supervised Learning)は、教師なし学習アプローチのサブカテゴリである。
本稿では,未ラベルセンサデータを用いた自己学習型DLモデルの有効性について検討する。
その結果, 自己教師付き事前学習モデルでは, 下流RUL予測タスクにおいて, 非事前学習モデルよりも大幅に優れていることがわかった。
論文 参考訳(メタデータ) (2023-01-20T06:45:32Z) - Doing Great at Estimating CATE? On the Neglected Assumptions in
Benchmark Comparisons of Treatment Effect Estimators [91.3755431537592]
もっとも単純な設定であっても、無知性仮定に基づく推定は誤解を招く可能性があることを示す。
異種処理効果評価のための機械学習ベンチマークデータセットを2つ検討した。
ベンチマークデータセットの固有の特性が、他のものよりもいくつかのアルゴリズムを好んでいる点を強調します。
論文 参考訳(メタデータ) (2021-07-28T13:21:27Z) - Stochastic Approximation for High-frequency Observations in Data
Assimilation [0.0]
高周波センサは、ダウンストリーム推定の統計的精度を高める機会を提供するが、その周波数はデータ同化タスクにおける多くの計算問題をもたらす。
データ同化における高周波観測の独特な課題に対処するために近似法を適用する。
その結果, 上記の計算問題を回避し, 推定値の統計的精度を維持する方法で, 全観測値を活用する推定値を生成することができた。
論文 参考訳(メタデータ) (2020-11-05T06:02:27Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。