論文の概要: Police Text Analysis: Topic Modeling and Spatial Relative Density
Estimation
- arxiv url: http://arxiv.org/abs/2202.04176v1
- Date: Tue, 8 Feb 2022 22:18:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-11 04:02:00.507316
- Title: Police Text Analysis: Topic Modeling and Spatial Relative Density
Estimation
- Title(参考訳): 警察のテキスト分析:トピックモデリングと空間相対密度推定
- Authors: Sarah Huestis-Mitchell, Xiuyuan Cheng, Yao Xie
- Abstract要約: 話題の空間的分布を理解するために,警察事件談話資料の大規模なコーパスを分析した。
我々のアプローチは、コーパスを2つの異なる教師なし機械学習アルゴリズムを使用してトピックに分割することである。
トピックごとの空間密度比を推定し、これを各トピックのデータ発見と分析に利用する。
- 参考スコア(独自算出の注目度): 15.793267225282571
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We analyze a large corpus of police incident narrative documents in
understanding the spatial distribution of the topics. The motivation for doing
this is that police narratives in each incident report contains very
fine-grained information that is richer than the category that is manually
assigned by the police. Our approach is to split the corpus into topics using
two different unsupervised machine learning algorithms - Latent Dirichlet
Allocation and Non-negative Matrix Factorization. We validate the performance
of each learned topic model using model coherence. Then, using a k-nearest
neighbors density ratio estimation (kNN-DRE) approach that we propose, we
estimate the spatial density ratio per topic and use this for data discovery
and analysis of each topic, allowing for insights into the described incidents
at scale. We provide a qualitative assessment of each topic and highlight some
key benefits for using our kNN-DRE model for estimating spatial trends.
- Abstract(参考訳): 事例の空間分布を理解するために,警察事件事例文書の大規模なコーパスを分析した。
これを行う動機は、各事件報告における警察の物語が、警察が手動で割り当てたカテゴリよりも、非常にきめ細かい情報を含んでいることである。
我々のアプローチは、コーパスを2つの異なる教師なし機械学習アルゴリズムを使ってトピックに分割することである。
モデルコヒーレンスを用いて各学習トピックモデルの性能を検証する。
そこで,本稿では,k-nearest neighbors density ratio Estimation (kNN-DRE) を用いてトピックごとの空間密度比を推定し,これを各トピックのデータ発見と解析に利用し,大規模インシデントについて考察する。
我々は,各トピックの質的評価を行い,空間的傾向を推定するためにkNN-DREモデルを使用する際の重要な利点を強調した。
関連論文リスト
- Sequential transport maps using SoS density estimation and $α$-divergences [0.5999777817331317]
輸送型密度推定法は, 近似密度から試料を効率よく生成できるため, 関心が高まりつつある。
本稿では,$alpha$-divergencesの情報幾何学的性質に基づいて,シーケンシャルトランスポートマップの新たな収束解析を行う。
本研究では,ベイズ推論問題と教師なし学習課題について数値解析を行った。
論文 参考訳(メタデータ) (2024-02-27T23:52:58Z) - $CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models [26.55769846846542]
群集カウントは群集分析の基本的な問題であり、群集密度マップを推定し、群集密度値の和を和らげることが典型的である。
逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
また,拡散モデルの性質から,数量化性能を向上させるため,複数の密度マップを作成することを提案する。
論文 参考訳(メタデータ) (2023-03-22T17:58:01Z) - Your diffusion model secretly knows the dimension of the data manifold [0.0]
拡散モデルは、様々なレベルの汚損に対する目標分布のノイズ崩壊バージョンにおけるログ密度の勾配を近似する。
データを高次元の周囲空間に埋め込まれた多様体の周りに集中させると、腐敗のレベルが低下するにつれて、スコア関数は多様体へ向けられる。
論文 参考訳(メタデータ) (2022-12-23T23:15:14Z) - Counting Like Human: Anthropoid Crowd Counting on Modeling the
Similarity of Objects [92.80955339180119]
メインストリームの群衆計数法は 密度マップを補強して 計数結果を得るために統合する。
これに触発された我々は,合理的かつ人為的な集団カウントフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-02T07:00:53Z) - Far Away in the Deep Space: Dense Nearest-Neighbor-Based
Out-of-Distribution Detection [33.78080060234557]
Nearest-Neighborsアプローチは、オブジェクト中心のデータドメインでうまく機能することが示されている。
近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近近
論文 参考訳(メタデータ) (2022-11-12T13:32:19Z) - Unveiling the Sampling Density in Non-Uniform Geometric Graphs [69.93864101024639]
グラフを幾何学グラフとみなす: ノードは基礎となる計量空間からランダムにサンプリングされ、その距離が指定された近傍半径以下であれば任意のノードが接続される。
ソーシャルネットワークでは、コミュニティは密集したサンプル領域としてモデル化でき、ハブはより大きな近傍半径を持つノードとしてモデル化できる。
我々は,未知のサンプリング密度を自己監督的に推定する手法を開発した。
論文 参考訳(メタデータ) (2022-10-15T08:01:08Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Completely Self-Supervised Crowd Counting via Distribution Matching [92.09218454377395]
我々は,密集した群集数に対するトレーニングモデルに対する完全な自己超越的アプローチを提案する。
トレーニングに必要な入力は、大量の未ラベルの群衆画像以外は、群衆数に近似した上限である。
提案手法は,自然群集が逆伝播の誤り信号を生成するために利用可能な電力法分布に従うという考え方に富む。
論文 参考訳(メタデータ) (2020-09-14T13:20:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。