論文の概要: Socio-Economic Deprivation Analysis: Diffusion Maps
- arxiv url: http://arxiv.org/abs/2312.09830v1
- Date: Fri, 15 Dec 2023 14:34:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 15:29:29.781461
- Title: Socio-Economic Deprivation Analysis: Diffusion Maps
- Title(参考訳): 社会・経済デプリベーション分析:拡散マップ
- Authors: June Moh Goo
- Abstract要約: 本報告では, 人口統計データを用いて, 市内で最も被害の少ない地域の位置を推定するモデルを提案する。
我々は次元の減少とパターンの発見に新しいアルゴリズムを用いる:拡散マップ。
最も取り除かれた地域は52か所あり、モデルと比較すると38か所が正しく識別されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This report proposes a model to predict the location of the most deprived
areas in a city using data from the census. A census data is very high
dimensional and needs to be simplified. We use a novel algorithm to reduce
dimensionality and find patterns: The diffusion map. Features are defined by
eigenvectors of the Laplacian matrix that defines the diffusion map.
Eigenvectors corresponding to the smallest eigenvalues indicate specific
population features. Previous work has found qualitatively that the second most
important dimension for describing the census data in Bristol is linked to
deprivation. In this report, we analyse how good this dimension is as a model
for predicting deprivation by comparing with the recognised measures. The
Pearson correlation coefficient was found to be over 0.7. The top 10 per cent
of deprived areas in the UK which also locate in Bristol are extracted to test
the accuracy of the model. There are 52 most deprived areas, and 38 areas are
correctly identified by comparing to the model. The influence of scores of IMD
domains that do not correlate with the models, Eigenvector 2 entries of
non-deprived OAs and orthogonality of Eigenvectors cause the model to fail the
prediction of 14 deprived areas.
However, overall, the model shows a high performance to predict the future
deprivation of overall areas where the project considers. This project is
expected to support the government to allocate resources and funding.
- Abstract(参考訳): 本報告では, 人口統計データを用いて, 都市で最も被害の少ない地域の位置を推定するモデルを提案する。
国勢調査データは極めて高次元であり、単純化する必要がある。
我々は次元の減少とパターンの発見に新しいアルゴリズムを用いる:拡散マップ。
特徴は拡散写像を定義するラプラシアン行列の固有ベクトルによって定義される。
最小の固有値に対応する固有ベクトルは、特定の集団の特徴を示す。
以前の研究では、ブリストルの国勢調査データを記述する上で2番目に重要な次元が剥奪と結びついていることが定性的に判明した。
本報告では,この次元がいかに良好であるかを,認識された指標との比較により推定するモデルとして分析する。
ピアソン相関係数は0.7以上であった。
このモデルの精度をテストするために、ブリストルにも立地するイギリスにおける不足地域の上位10%を抽出した。
52の領域が不足しており、38の領域がモデルと比較して正確に識別されている。
モデルと相関しないIMD領域のスコアの影響、非欠落OAの固有ベクトル2エントリ、および固有ベクトルの直交性は、モデルを14個の欠落領域の予測に失敗させる。
しかし、全体としては、プロジェクトが考慮する全体領域の将来の損失を予測するための高いパフォーマンスを示している。
このプロジェクトは、政府が資源と資金の割り当てをサポートすることが期待されている。
関連論文リスト
- Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - DisenHCN: Disentangled Hypergraph Convolutional Networks for
Spatiotemporal Activity Prediction [53.76601630407521]
本稿では,既存のソリューションのギャップを埋めるために,DistenHCNと呼ばれるハイパーグラフネットワークモデルを提案する。
特に,ユーザの好みと時間的活動の複雑なマッチングをヘテロジニアスなハイパーグラフにまとめる。
次に、ユーザ表現を異なる側面(位置認識、時間認識、活動認識)に切り離し、構築したハイパーグラフ上に対応するアスペクトの特徴を集約する。
論文 参考訳(メタデータ) (2022-08-14T06:51:54Z) - Estimating Graph Dimension with Cross-validated Eigenvalues [5.0013150536632995]
応用統計学では、潜在次元の数を推定したり、クラスターの数を推定することは基本的な問題であり、繰り返し発生する問題である。
この問題に対するクロスバリデーションな固有値アプローチを提供する。
我々の手順は、すべての$k$次元を推定できるシナリオにおいて、一貫して$k$を推定することを証明する。
論文 参考訳(メタデータ) (2021-08-06T23:52:30Z) - Featurized Density Ratio Estimation [82.40706152910292]
本研究では,2つの分布を推定前の共通特徴空間にマッピングするために,可逆生成モデルを活用することを提案する。
この偉業化は、学習された入力空間の密度比が任意に不正確な場合、潜在空間において密度が密接な関係をもたらす。
同時に、特徴写像の可逆性は、特徴空間で計算された比が入力空間で計算された比と同値であることを保証する。
論文 参考訳(メタデータ) (2021-07-05T18:30:26Z) - Estimation of population size based on capture recapture designs and
evaluation of the estimation reliability [0.2810625954925814]
本研究では,K試料の捕捉回収設計に基づく集団サイズ推定手法を提案する。
捕獲-回収モデルを特定するために一般的に想定される線形および非線形制約の解を提案する。
提案手法は,中国南西部の一地域からの多元的監視データを用いて寄生虫感染の有病率を推定するものである。
論文 参考訳(メタデータ) (2021-05-12T00:12:13Z) - A windowed correlation based feature selection method to improve time
series prediction of dengue fever cases [0.20072624123275526]
予測性能の低さは、不適切なデータを持つ場所につながる可能性がある。
新しいフレームワークは、インシデントデータのウィンドウ化と時間シフト相関に基づくメトリクスの計算を行う。
繰り返しニューラルネットワークに基づく予測モデルは、平均33.6%の精度向上を達成している。
論文 参考訳(メタデータ) (2021-04-21T00:28:28Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z) - Magnify Your Population: Statistical Downscaling to Augment the Spatial
Resolution of Socioeconomic Census Data [48.7576911714538]
重要社会経済的属性の詳細な推定を導出する新しい統計的ダウンスケーリング手法を提案する。
選択された社会経済変数ごとに、ランダムフォレストモデルが元の国勢調査単位に基づいて訓練され、その後、微細なグリッド化された予測を生成するために使用される。
本研究では,この手法を米国の国勢調査データに適用し,ブロック群レベルで選択された社会経済変数を,300の空間分解能のグリッドにダウンスケールする。
論文 参考訳(メタデータ) (2020-06-23T16:52:18Z) - Distributed Estimation for Principal Component Analysis: an Enlarged
Eigenspace Analysis [45.829683377074524]
本稿では,基本統計的機械学習問題,主成分分析(PCA)の分散推定について検討する。
本稿では,分散データのためのトップ$L$-dim固有空間を構築するための新しいマルチラウンドアルゴリズムを提案する。
我々のアルゴリズムは、シフト・アンド・インバート・プレコンディショニングと凸最適化を利用する。
論文 参考訳(メタデータ) (2020-04-05T22:28:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。