論文の概要: Data-Driven Socio-Economic Deprivation Prediction via Dimensionality Reduction: The Power of Diffusion Maps
- arxiv url: http://arxiv.org/abs/2312.09830v2
- Date: Tue, 05 Nov 2024 13:37:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-06 14:56:12.639458
- Title: Data-Driven Socio-Economic Deprivation Prediction via Dimensionality Reduction: The Power of Diffusion Maps
- Title(参考訳): 次元削減によるデータ駆動型社会経済的脱落予測:拡散マップの力
- Authors: June Moh Goo,
- Abstract要約: 本研究は, 人口統計データを用いて, 市内で最も被害の少ない地域の位置を推定するモデルを提案する。
拡散マップアルゴリズムを用いて次元の減少とパターンの発見を行う。
このモデルは、プロジェクト領域における将来の損失を予測する上で、強いパフォーマンスを示します。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: This research proposes a model to predict the location of the most deprived areas in a city using data from the census. Census data is very high-dimensional and needs to be simplified. We use the diffusion map algorithm to reduce dimensionality and find patterns. Features are defined by eigenvectors of the Laplacian matrix that defines the diffusion map. The eigenvectors corresponding to the smallest eigenvalues indicate specific characteristics of the population. Previous work has found qualitatively that the second most important dimension for describing the census data in Bristol, UK is linked to deprivation. In this research, we analyse how good this dimension is as a model for predicting deprivation by comparing it with the recognised measures. The Pearson correlation coefficient was found to be greater than 0.7. The top 10 per cent of deprived areas in the UK, which are also located in Bristol, are extracted to test the accuracy of the model. There are 52 of the most deprived areas, and 38 areas are correctly identified by comparing them to the model. The influence of scores of IMD domains that do not correlate with the models and Eigenvector 2 entries of non-deprived Output Areas cause the model to fail the prediction of 14 deprived areas. The model demonstrates strong performance in predicting future deprivation in the project areas, which is expected to assist in government resource allocation and funding greatly. The codes can be accessed here: https://github.com/junegoo94/diffusion_maps
- Abstract(参考訳): 本研究は, 人口統計データを用いて, 市内で最も被害の少ない地域の位置を推定するモデルを提案する。
国勢調査データは高次元であり、単純化する必要がある。
拡散マップアルゴリズムを用いて次元の減少とパターンの発見を行う。
特徴は拡散写像を定義するラプラシア行列の固有ベクトルによって定義される。
最小の固有値に対応する固有ベクトルは、個体群の特定の特性を示す。
以前の研究では、ブリストルの国勢調査データを記述する上で2番目に重要な次元は、剥奪と結びついていることが分かりました。
本研究では,この次元が減量予測のモデルとしてどの程度優れているかを,認識された指標と比較して分析する。
ピアソン相関係数は0.7以上であった。
同じくブリストルにある英国では、削除された地域の上位10%が、モデルの精度をテストするために抽出されている。
最も取り除かれた地域は52か所あり、モデルと比較すると38か所が正しく識別されている。
モデルと相関しないIMDドメインのスコアと非削除出力領域の固有ベクター2エントリの影響により、モデルは14の削除領域の予測に失敗する。
このモデルは、政府の資源配分と資金提供を大いに支援することが期待されているプロジェクト領域における将来の損失を予測する上で、強いパフォーマンスを示す。
https://github.com/junegoo94/diffusion_maps
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Less is More: Fewer Interpretable Region via Submodular Subset Selection [54.07758302264416]
本稿では,上述の画像帰属問題を部分モジュラ部分選択問題として再モデル化する。
我々は、より正確な小さな解釈領域を発見するために、新しい部分モジュラー関数を構築する。
正しく予測されたサンプルに対しては,HSIC-Attributionに対する平均4.9%と2.5%の利得で,Deletion and Insertionスコアを改善した。
論文 参考訳(メタデータ) (2024-02-14T13:30:02Z) - Estimation of embedding vectors in high dimensions [10.55292041492388]
我々は、いくつかの「真」だが未知の埋め込みが存在する離散データに対する単純な確率モデルを考える。
このモデルでは、埋め込みは低ランク近似メッセージパッシング(AMP)法の変種によって学習できることが示されている。
提案手法は, 合成データと実テキストデータの両方のシミュレーションにより検証した。
論文 参考訳(メタデータ) (2023-12-12T23:41:59Z) - Toward Data-Driven Glare Classification and Prediction for Marine
Megafauna Survey [0.3694429692322631]
カナダ北大西洋海域の絶滅危惧種は、個体群を推定するために体系的に調査されている。
政策に影響を及ぼすため、人口の正確さが重要である。
本稿では,データ駆動型グレアモデリングシステムの基礎を築いた。
論文 参考訳(メタデータ) (2023-03-03T18:46:19Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Combating Mode Collapse in GANs via Manifold Entropy Estimation [70.06639443446545]
Generative Adversarial Networks (GAN) は、様々なタスクやアプリケーションにおいて魅力的な結果を示している。
GANのモード崩壊問題に対処するための新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-25T12:33:31Z) - Fine-Grained Population Mobility Data-Based Community-Level COVID-19
Prediction Model [5.548510262756311]
本研究では,2つの地域レベルのデータを利用した人口移動データモデル(FGC-COVID)を提案する。
CBGの埋め込みをコミュニティレベルに集約する空間重み付けアグリゲーションモジュールを導入する。
我々のモデルは、コミュニティレベルの新型コロナウイルスの予測において、既存の予測モデルよりも優れています。
論文 参考訳(メタデータ) (2022-02-13T08:40:47Z) - A windowed correlation based feature selection method to improve time
series prediction of dengue fever cases [0.20072624123275526]
予測性能の低さは、不適切なデータを持つ場所につながる可能性がある。
新しいフレームワークは、インシデントデータのウィンドウ化と時間シフト相関に基づくメトリクスの計算を行う。
繰り返しニューラルネットワークに基づく予測モデルは、平均33.6%の精度向上を達成している。
論文 参考訳(メタデータ) (2021-04-21T00:28:28Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。