論文の概要: Socio-Economic Deprivation Analysis: Diffusion Maps
- arxiv url: http://arxiv.org/abs/2312.09830v1
- Date: Fri, 15 Dec 2023 14:34:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 15:29:29.781461
- Title: Socio-Economic Deprivation Analysis: Diffusion Maps
- Title(参考訳): 社会・経済デプリベーション分析:拡散マップ
- Authors: June Moh Goo
- Abstract要約: 本報告では, 人口統計データを用いて, 市内で最も被害の少ない地域の位置を推定するモデルを提案する。
我々は次元の減少とパターンの発見に新しいアルゴリズムを用いる:拡散マップ。
最も取り除かれた地域は52か所あり、モデルと比較すると38か所が正しく識別されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This report proposes a model to predict the location of the most deprived
areas in a city using data from the census. A census data is very high
dimensional and needs to be simplified. We use a novel algorithm to reduce
dimensionality and find patterns: The diffusion map. Features are defined by
eigenvectors of the Laplacian matrix that defines the diffusion map.
Eigenvectors corresponding to the smallest eigenvalues indicate specific
population features. Previous work has found qualitatively that the second most
important dimension for describing the census data in Bristol is linked to
deprivation. In this report, we analyse how good this dimension is as a model
for predicting deprivation by comparing with the recognised measures. The
Pearson correlation coefficient was found to be over 0.7. The top 10 per cent
of deprived areas in the UK which also locate in Bristol are extracted to test
the accuracy of the model. There are 52 most deprived areas, and 38 areas are
correctly identified by comparing to the model. The influence of scores of IMD
domains that do not correlate with the models, Eigenvector 2 entries of
non-deprived OAs and orthogonality of Eigenvectors cause the model to fail the
prediction of 14 deprived areas.
However, overall, the model shows a high performance to predict the future
deprivation of overall areas where the project considers. This project is
expected to support the government to allocate resources and funding.
- Abstract(参考訳): 本報告では, 人口統計データを用いて, 都市で最も被害の少ない地域の位置を推定するモデルを提案する。
国勢調査データは極めて高次元であり、単純化する必要がある。
我々は次元の減少とパターンの発見に新しいアルゴリズムを用いる:拡散マップ。
特徴は拡散写像を定義するラプラシアン行列の固有ベクトルによって定義される。
最小の固有値に対応する固有ベクトルは、特定の集団の特徴を示す。
以前の研究では、ブリストルの国勢調査データを記述する上で2番目に重要な次元が剥奪と結びついていることが定性的に判明した。
本報告では,この次元がいかに良好であるかを,認識された指標との比較により推定するモデルとして分析する。
ピアソン相関係数は0.7以上であった。
このモデルの精度をテストするために、ブリストルにも立地するイギリスにおける不足地域の上位10%を抽出した。
52の領域が不足しており、38の領域がモデルと比較して正確に識別されている。
モデルと相関しないIMD領域のスコアの影響、非欠落OAの固有ベクトル2エントリ、および固有ベクトルの直交性は、モデルを14個の欠落領域の予測に失敗させる。
しかし、全体としては、プロジェクトが考慮する全体領域の将来の損失を予測するための高いパフォーマンスを示している。
このプロジェクトは、政府が資源と資金の割り当てをサポートすることが期待されている。
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Less is More: Fewer Interpretable Region via Submodular Subset Selection [54.07758302264416]
本稿では,上述の画像帰属問題を部分モジュラ部分選択問題として再モデル化する。
我々は、より正確な小さな解釈領域を発見するために、新しい部分モジュラー関数を構築する。
正しく予測されたサンプルに対しては,HSIC-Attributionに対する平均4.9%と2.5%の利得で,Deletion and Insertionスコアを改善した。
論文 参考訳(メタデータ) (2024-02-14T13:30:02Z) - Estimation of embedding vectors in high dimensions [10.55292041492388]
我々は、いくつかの「真」だが未知の埋め込みが存在する離散データに対する単純な確率モデルを考える。
このモデルでは、埋め込みは低ランク近似メッセージパッシング(AMP)法の変種によって学習できることが示されている。
提案手法は, 合成データと実テキストデータの両方のシミュレーションにより検証した。
論文 参考訳(メタデータ) (2023-12-12T23:41:59Z) - Toward Data-Driven Glare Classification and Prediction for Marine
Megafauna Survey [0.3694429692322631]
カナダ北大西洋海域の絶滅危惧種は、個体群を推定するために体系的に調査されている。
政策に影響を及ぼすため、人口の正確さが重要である。
本稿では,データ駆動型グレアモデリングシステムの基礎を築いた。
論文 参考訳(メタデータ) (2023-03-03T18:46:19Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Combating Mode Collapse in GANs via Manifold Entropy Estimation [70.06639443446545]
Generative Adversarial Networks (GAN) は、様々なタスクやアプリケーションにおいて魅力的な結果を示している。
GANのモード崩壊問題に対処するための新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-25T12:33:31Z) - Fine-Grained Population Mobility Data-Based Community-Level COVID-19
Prediction Model [5.548510262756311]
本研究では,2つの地域レベルのデータを利用した人口移動データモデル(FGC-COVID)を提案する。
CBGの埋め込みをコミュニティレベルに集約する空間重み付けアグリゲーションモジュールを導入する。
我々のモデルは、コミュニティレベルの新型コロナウイルスの予測において、既存の予測モデルよりも優れています。
論文 参考訳(メタデータ) (2022-02-13T08:40:47Z) - A windowed correlation based feature selection method to improve time
series prediction of dengue fever cases [0.20072624123275526]
予測性能の低さは、不適切なデータを持つ場所につながる可能性がある。
新しいフレームワークは、インシデントデータのウィンドウ化と時間シフト相関に基づくメトリクスの計算を行う。
繰り返しニューラルネットワークに基づく予測モデルは、平均33.6%の精度向上を達成している。
論文 参考訳(メタデータ) (2021-04-21T00:28:28Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。