論文の概要: Using Text Classification with a Bayesian Correction for Estimating
Overreporting in the Creditor Reporting System on Climate Adaptation Finance
- arxiv url: http://arxiv.org/abs/2211.16947v1
- Date: Wed, 30 Nov 2022 12:45:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-01 17:41:50.391761
- Title: Using Text Classification with a Bayesian Correction for Estimating
Overreporting in the Creditor Reporting System on Climate Adaptation Finance
- Title(参考訳): 気候適応財務債権報告システムにおける過剰レポート推定のためのベイズ補正を用いたテキスト分類
- Authors: Janos Borst, Thomas Wencker, Andreas Niekler
- Abstract要約: 調査は、報告された数字の信頼性に疑問を投げかけ、適応融資が公表された数字より実際は低いことを示唆している。
大規模データセットにおけるリアルタイムなオーバーレポート率を時間とともに推定するために,最先端のテキスト分類に基づくアプローチを提案する。
- 参考スコア(独自算出の注目度): 1.1709515977932758
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Development funds are essential to finance climate change adaptation and are
thus an important part of international climate policy. % However, the absence
of a common reporting practice makes it difficult to assess the amount and
distribution of such funds. Research has questioned the credibility of reported
figures, indicating that adaptation financing is in fact lower than published
figures suggest. Projects claiming a greater relevance to climate change
adaptation than they target are referred to as "overreported". To estimate
realistic rates of overreporting in large data sets over times, we propose an
approach based on state-of-the-art text classification. To date, assessments of
credibility have relied on small, manually evaluated samples. We use such a
sample data set to train a classifier with an accuracy of $89.81\% \pm 0.83\%$
(tenfold cross-validation) and extrapolate to larger data sets to identify
overreporting. Additionally, we propose a method that incorporates evidence of
smaller, higher-quality data to correct predicted rates using Bayes' theorem.
This enables a comparison of different annotation schemes to estimate the
degree of overreporting in climate change adaptation. Our results support
findings that indicate extensive overreporting of $32.03\%$ with a credible
interval of $[19.81\%;48.34\%]$.
- Abstract(参考訳): 開発資金は気候変動の適応に欠かせないものであり、国際気候政策の重要な部分である。
% しかし, 共通報告慣行が欠如しているため, 当該資金の額や分布を評価することは困難である。
調査は報告された数字の信頼性を疑問視しており、適応融資が公表された数字より実際に低いことを示している。
気候変動への適応が目標よりも大きいと主張するプロジェクトは「過剰報告」と呼ばれる。
大規模データセットにおけるオーバレポーティングのリアルタイム性を評価するために,最先端テキスト分類に基づくアプローチを提案する。
これまで、信頼性の評価は小さく手作業で評価されたサンプルに依存している。
このようなサンプルデータセットを用いて,89.81\% \pm 0.83\%$(10倍のクロスバリデーション)の精度で分類器を訓練し,オーバーレポートを特定するためにより大きなデータセットに外挿する。
さらに,ベイズの定理を用いて,より小さく高品質なデータの証拠を組み込んで予測率を補正する手法を提案する。
これにより、異なるアノテーションスキームの比較により、気候変動適応における過剰レポートの程度を推定することができる。
以上の結果から,$[19.81\%;48.34\%]$の信頼できる間隔で,$32.03\%$の広範な過剰報告が得られた。
関連論文リスト
- Fighting Sampling Bias: A Framework for Training and Evaluating Credit Scoring Models [2.918530881730374]
本稿では,サンプリングバイアスがモデルトレーニングおよび評価に与える影響について考察する。
スコアカード評価のためのバイアス認識型自己学習と拒絶推論フレームワークを提案する。
その結果,ベイズ評価を用いて受入率を決定する場合,利益率が約8%向上することが示唆された。
論文 参考訳(メタデータ) (2024-07-17T20:59:54Z) - Uncertainty in Language Models: Assessment through Rank-Calibration [65.10149293133846]
言語モデル(LM)は、自然言語生成において有望な性能を示している。
与えられた入力に応答する際の不確実性を正確に定量化することは重要である。
我々は、LMの確実性と信頼性を評価するために、Rank$-$Calibration$と呼ばれる斬新で実用的なフレームワークを開発する。
論文 参考訳(メタデータ) (2024-04-04T02:31:05Z) - Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - The Impact of Differential Feature Under-reporting on Algorithmic Fairness [86.275300739926]
解析的に抽出可能な差分特徴のアンダーレポーティングモデルを提案する。
そして、この種のデータバイアスがアルゴリズムの公正性に与える影響を特徴づける。
我々の結果は、実世界のデータ設定では、アンダーレポートが典型的に格差を増大させることを示している。
論文 参考訳(メタデータ) (2024-01-16T19:16:22Z) - Towards Fine-Grained Information: Identifying the Type and Location of
Translation Errors [80.22825549235556]
既存のアプローチでは、エラーの位置と型を同期的に考慮することはできない。
我々はtextbf の追加と textbfomission エラーを予測するために FG-TED モデルを構築した。
実験により,本モデルではエラータイプと位置の同時同定が可能であり,最先端の結果が得られた。
論文 参考訳(メタデータ) (2023-02-17T16:20:33Z) - Two-stage Modeling for Prediction with Confidence [0.0]
分布シフト条件下でニューラルネットワークの性能を一般化することは困難である。
本稿では,分散シフト問題に対する新しい2段階モデルを提案する。
我々のモデルは、ほとんどのデータセットに対して信頼性の高い予測を提供することを示す。
論文 参考訳(メタデータ) (2022-09-19T08:48:07Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Test-time Batch Statistics Calibration for Covariate Shift [66.7044675981449]
我々は,推論中に深層モデルを新しい環境に適応させることを提案する。
バッチ統計の校正に$alpha$-BNの一般的な定式化を提案する。
また、統合テスト時間適応フレームワークCoreを形成するための新しい損失関数も提示する。
論文 参考訳(メタデータ) (2021-10-06T08:45:03Z) - Transfer Learning via $\ell_1$ Regularization [9.442139459221785]
本稿では,ソースドメインからターゲットドメインへの知識伝達手法を提案する。
提案手法は推定値自体と推定値の変化の両方に対して空間性を与える。
実験結果から, 本手法は安定性と塑性のバランスを効果的に保っていることが示された。
論文 参考訳(メタデータ) (2020-06-26T07:42:03Z) - Fast Fair Regression via Efficient Approximations of Mutual Information [0.0]
本稿では, 回帰モデルに対する独立性, 分離性, 充足性グループフェアネス基準の高速な近似について紹介する。
正規化リスク最小化フレームワーク内で公正性を強制するために、正規化のような近似を使用する。
実世界のデータセットでの実験では、計算効率が優れているにもかかわらず、我々のアルゴリズムは依然として最先端の精度/フェアネスのトレードオフを示す。
論文 参考訳(メタデータ) (2020-02-14T08:50:51Z) - The Counterfactual $\chi$-GAN [20.42556178617068]
因果推論は、しばしば、治療の割り当てが結果から独立していることを要求する反ファクト的枠組みに依存する。
本研究は,CGAN(Counterfactual $chi$-GAN)と呼ばれるGAN(Generative Adversarial Network)に基づくモデルを提案する。
論文 参考訳(メタデータ) (2020-01-09T17:23:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。