論文の概要: A Comparative Study of Penalised, Bayesian, Spatial, and Tree-Based Models for Provincial Poverty in Indonesia: Small Samples and High Collinearity
- arxiv url: http://arxiv.org/abs/2604.06278v1
- Date: Tue, 07 Apr 2026 09:41:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.144357
- Title: A Comparative Study of Penalised, Bayesian, Spatial, and Tree-Based Models for Provincial Poverty in Indonesia: Small Samples and High Collinearity
- Title(参考訳): インドネシアの地方貧困に対するペナルティ、ベイズ、空間、木に基づくモデルの比較研究:小サンプルと高いコリニアリティ
- Authors: A. H. Jamaluddin, A. T. R. Dani, N. I. Mahat, V. Ratnasari, S. S. M. Fauzi,
- Abstract要約: 本稿では,インドネシアにおける貧困の地域的原因を,具体的な統計的リスクに対処して評価する。
我々は,コリニアリティの高い小さなサンプルを対象とした厳密なモデル比較フレームワークを採用している。
結果、アルゴリズムの複雑さは本質的に地域データセットにおいて危険であることが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Identifying the structural drivers of poverty in regional datasets is frequently hindered by small sample sizes and high multidimensional collinearity, which can result in unstable and misleading policy advice. This paper evaluates the provincial causes of poverty in Indonesia by addressing these specific statistical hazards. We employ a rigorous model-comparison framework designed for small samples ($n=34$) with high collinearity, comparing standard linear models with frequentist penalisation, Bayesian shrinkage priors, an adjusted spatial intrinsic conditionally autoregressive (ICAR) model, and complex machine learning ensembles. To ensure a robust evaluation, we measure predictive performance using strict Leave-One-Out Cross-Validation (LOOCV). The results demonstrate that algorithmic complexity is inherently risky in regional datasets: simple linear shrinkage models (Ridge, Elastic Net, LASSO) achieve the superior out-of-sample prediction, whereas complex ensembles like BART suffer from severe overfitting. Across all successful regularised models, ICT skills consistently emerge as the most stable proxy for lower provincial poverty. The primary contribution of this paper is demonstrating that, in data-constrained regional analysis, parametrically regularised linear shrinkage provides a more reliable mathematical foundation for isolating structural development priorities, such as ICT, than either naive OLS or unconstrained machine learning.
- Abstract(参考訳): 地域データセットにおける貧困の構造的要因を特定することは、小さなサンプルサイズと高次元のコリニアリティによってしばしば妨げられ、不安定で誤った政策アドバイスをもたらす可能性がある。
本稿では,インドネシアにおける貧困の地域的原因を,これらの具体的な統計リスクに対処して評価する。
我々は,小サンプル (n=34$) と高コリニアリティ (colinearity) のために設計された厳密なモデル比較フレームワークを用いて,標準線形モデルと頻繁なペナル化,ベイズ縮小前処理,調整された空間内在的条件付き自己回帰(ICAR)モデル,複雑な機械学習アンサンブルを比較検討した。
頑健な評価を実現するため,厳密なLeft-One-Out Cross-Validation (LOOCV) を用いた予測性能の測定を行った。
単純な線形縮退モデル(Ridge, Elastic Net, LASSO)はより優れたサンプル外予測を実現する一方、BARTのような複雑なアンサンブルは過度なオーバーフィッティングに悩まされる。
すべての成功した正規化モデルの中で、ICTスキルは一貫して、低州の貧困の最も安定したプロキシとして現れている。
この論文の主な貢献は、データ制約のある地域分析において、パラメータ正規化線形収縮は、単純なOLSや制約なし機械学習よりも、ICTのような構造的開発優先事項を分離するための信頼性の高い数学的基盤を提供することを示すことである。
関連論文リスト
- Reproducibility study on how to find Spurious Correlations, Shortcut Learning, Clever Hans or Group-Distributional non-robustness and how to fix them [0.8594140167290097]
我々は、一般的な非XAIベースラインと並行して、説明可能な人工知能(XAI)技術に基づく補正手法の評価を行った。
XAIに基づく手法は一般に非XAI手法よりも優れていた。
実験では、多くのメソッドの実践的応用がグループラベルへの依存によって妨げられていることも明らかにした。
論文 参考訳(メタデータ) (2026-04-06T08:29:33Z) - CTTVAE: Latent Space Structuring for Conditional Tabular Data Generation on Imbalanced Datasets [0.0]
本稿では,2つの相補的機構を備えた条件変換器を用いたタブラル変分自動エンコーダであるCTTVAEを紹介する。
CTTVAE+TBSは、トレーニングを不安定にすることなく、より代表的で実用性に整ったサンプルを一貫して得る。
論文 参考訳(メタデータ) (2026-02-03T15:25:26Z) - Did Models Sufficient Learn? Attribution-Guided Training via Subset-Selected Counterfactual Augmentation [61.248535801314375]
Subset-Selected Counterfactual Augmentation (SS-CA)
我々は,モデル予測を選択的に変更可能な最小空間領域集合を識別するために,対実的LIMAを開発した。
実験により,SS-CAは分布内テストデータ(ID)の一般化を改善し,分布外ベンチマーク(OOD)において優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-11-15T08:39:22Z) - Modest-Align: Data-Efficient Alignment for Vision-Language Models [67.48633659305592]
クロスモーダルアライメントモデルは、リソース制約のある環境での運用において、過信と劣化したパフォーマンスに悩まされることが多い。
我々は,ロバスト性と効率性に配慮した軽量アライメントフレームワークであるModest-Alignを提案する。
本手法は,実世界の低リソースシナリオにおけるクロスモーダルアライメントを実現するための,実用的でスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-10-24T16:11:10Z) - The Statistical Fairness-Accuracy Frontier [50.323024516295725]
機械学習モデルは正確性と公平さのバランスをとる必要があるが、これらの目標はしばしば矛盾する。
このトレードオフを理解するための有用なツールとしてフェアネス・精度フロンティアがあり、フェアネスと精度の両方で同時に改善できないモデルの集合を特徴付ける。
本研究では, 有限サンプル体制におけるFAフロンティアについて検討し, 人口の減少と, 最悪のケースギャップの定量化について検討した。
論文 参考訳(メタデータ) (2025-08-25T03:01:35Z) - Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - Conditional Data Synthesis Augmentation [4.3108820946281945]
Conditional Data Synthesis Augmentation (CoDSA)は、マルチモーダルドメイン間のモデルパフォーマンスを改善するために高忠実度データを合成する新しいフレームワークである。
合成データの現実性を高め,スパース領域の試料密度を高めるために,CoDSAファインチューン事前学習生成モデルを構築した。
本稿では,合成サンプル量と対象領域割り当ての関数として,CoDSAが実現した統計的精度向上を定量化する理論的枠組みを提案する。
論文 参考訳(メタデータ) (2025-04-10T03:38:11Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - Survival Analysis with Adversarial Regularization [3.9686445409447617]
生存分析(Survival Analysis、SA)は、医学、防衛学、金融学、航空宇宙学などの分野で応用されるイベントが起こるまでの時間をモデル化する。
最近の研究は、ニューラルネットワーク(NN)がSAの複雑なデータパターンを効果的にキャプチャできることを示唆している。
我々は、NN検証の進歩を活用して、堅牢で完全なパラメトリックSAモデルのためのトレーニング目標を開発する。
論文 参考訳(メタデータ) (2023-12-26T12:18:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。