論文の概要: UPDExplainer: an Interpretable Transformer-based Framework for Urban
Physical Disorder Detection Using Street View Imagery
- arxiv url: http://arxiv.org/abs/2305.02911v1
- Date: Thu, 4 May 2023 15:18:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 15:06:54.178889
- Title: UPDExplainer: an Interpretable Transformer-based Framework for Urban
Physical Disorder Detection Using Street View Imagery
- Title(参考訳): UPDExplainer:ストリートビュー画像を用いた都市身体障害検出のための解釈可能なトランスフォーマーベースフレームワーク
- Authors: Chuanbo Hu, Shan Jia, Fan Zhang, Changjiang Xiao, Mindi Ruan, Jacob
Thrasher, Xin Li
- Abstract要約: 古い建物や放棄された建物、壊れた歩道、ゴミ、落書きなどの都市身体障害(UPD)は、住民の生活の質に悪影響を及ぼす。
UPDの検出と理解には効率的で信頼性の高い方法が欠けている。
UPD検出のための解釈可能なトランスフォーマーベースのフレームワークであるUDDExplainerを提案する。
- 参考スコア(独自算出の注目度): 11.212803472640894
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban Physical Disorder (UPD), such as old or abandoned buildings, broken
sidewalks, litter, and graffiti, has a negative impact on residents' quality of
life. They can also increase crime rates, cause social disorder, and pose a
public health risk. Currently, there is a lack of efficient and reliable
methods for detecting and understanding UPD. To bridge this gap, we propose
UPDExplainer, an interpretable transformer-based framework for UPD detection.
We first develop a UPD detection model based on the Swin Transformer
architecture, which leverages readily accessible street view images to learn
discriminative representations. In order to provide clear and comprehensible
evidence and analysis, we subsequently introduce a UPD factor identification
and ranking module that combines visual explanation maps with semantic
segmentation maps. This novel integrated approach enables us to identify the
exact objects within street view images that are responsible for physical
disorders and gain insights into the underlying causes. Experimental results on
the re-annotated Place Pulse 2.0 dataset demonstrate promising detection
performance of the proposed method, with an accuracy of 79.9%. For a
comprehensive evaluation of the method's ranking performance, we report the
mean Average Precision (mAP), R-Precision (RPrec), and Normalized Discounted
Cumulative Gain (NDCG), with success rates of 75.51%, 80.61%, and 82.58%,
respectively. We also present a case study of detecting and ranking physical
disorders in the southern region of downtown Los Angeles, California, to
demonstrate the practicality and effectiveness of our framework.
- Abstract(参考訳): 古い建物や放棄された建物、壊れた歩道、ゴミ、落書きなどの都市身体障害(upd)は、住民の生活の質に悪影響を及ぼす。
また、犯罪率を高め、社会障害を引き起こし、公衆衛生上のリスクを引き起こすこともある。
現在、updの検出と理解のための効率的で信頼性の高い方法が欠けている。
このギャップを埋めるために、UPD検出のための解釈可能なトランスフォーマーベースのフレームワークであるUDDExplainerを提案する。
まず,簡易なストリートビュー画像を用いて識別表現を学習するswain transformerアーキテクチャに基づくupd検出モデルを開発した。
明確で分かりやすいエビデンスと分析を提供するため,視覚説明地図とセマンティックセグメンテーションマップを組み合わせたUDD因子識別とランキングモジュールを導入する。
この新たな統合アプローチにより、身体障害の原因となるストリートビュー画像内の正確なオブジェクトを特定し、根本原因の洞察を得ることができる。
再アノテートされたPlace Pulse 2.0データセットの実験結果から,提案手法の有望な検出性能が79.9%の精度で示された。
本手法の総合評価では,平均精度 (mAP), R精度 (RPrec), 正規化カウント累積ゲイン (NDCG), 成功率 (75.51%), 80.61%, 82.58%) について報告する。
また,カリフォルニア州ロサンゼルス中心街の南部地域における身体障害の検出とランキングを事例として,本フレームワークの実用性と有効性を示す。
関連論文リスト
- Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Semi-Truths: A Large-Scale Dataset of AI-Augmented Images for Evaluating Robustness of AI-Generated Image detectors [62.63467652611788]
実画像27,600枚、223,400枚、AI拡張画像1,472,700枚を含むSEMI-TRUTHSを紹介する。
それぞれの画像には、検出器のロバスト性の標準化と目標評価のためのメタデータが添付されている。
以上の結果から,現状の検出器は摂動の種類や程度,データ分布,拡張方法に様々な感度を示すことが示唆された。
論文 参考訳(メタデータ) (2024-11-12T01:17:27Z) - Counterfactuals and Uncertainty-Based Explainable Paradigm for the Automated Detection and Segmentation of Renal Cysts in Computed Tomography Images: A Multi-Center Study [1.83277723272657]
Routine Computed Tomography (CT)スキャンは、しばしば広範囲の腎嚢胞を検知するが、そのうちのいくつかは悪性である可能性がある。
しかし、現在のセグメンテーション法では、特徴レベルとピクセルレベルで十分な解釈性を提供していない。
我々は、解釈可能なセグメンテーションフレームワークを開発し、多中心データセット上で検証した。
論文 参考訳(メタデータ) (2024-08-07T14:14:05Z) - Cut-and-Paste with Precision: a Content and Perspective-aware Data Augmentation for Road Damage Detection [5.939858158928473]
道路の損傷は、道路インフラの完全性、安全性、耐久性に重大な課題をもたらす可能性がある。
近年、道路監視アプリケーションにおいて、画像に基づく損傷検出のための様々なデータ駆動手法が研究されている。
本稿では、コンテンツ認識(すなわち、画像中の道路の真の位置を考える)と視点認識(すなわち、注入された損傷と対象画像との視点の差を考慮する)の両面から改善されたカット・アンド・ペースト増強手法を提案する。
論文 参考訳(メタデータ) (2024-06-06T09:06:42Z) - PULSAR: Graph based Positive Unlabeled Learning with Multi Stream
Adaptive Convolutions for Parkinson's Disease Recognition [1.9482539692051932]
パーキンソン病(英: Parkinsons disease、PD)は、運動、発話、協調に影響を及ぼす神経変性疾患である。
本稿では,ウェブカメラで記録した指タップのビデオからPDをスクリーニングする新しい手法PULSARを提案する。
適応型グラフ畳み込みニューラルネットワークを用いて,指触りタスクに特有の時間グラフを動的に学習した。
論文 参考訳(メタデータ) (2023-12-10T05:56:20Z) - From Global to Local: Multi-scale Out-of-distribution Detection [129.37607313927458]
アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)トレーニングプロセス中にラベルが見られない未知のデータを検出することを目的としている。
近年の表現学習の進歩により,距離に基づくOOD検出がもたらされる。
グローバルな視覚情報と局所的な情報の両方を活用する第1のフレームワークであるマルチスケールOOD検出(MODE)を提案する。
論文 参考訳(メタデータ) (2023-08-20T11:56:25Z) - Diffusion Models for Counterfactual Generation and Anomaly Detection in Brain Images [39.94162291765236]
病気の画像の健全なバージョンを生成し,それを用いて画素単位の異常マップを得るための弱教師付き手法を提案する。
健常者を対象にした拡散モデルを用いて, サンプリングプロセスの各ステップで拡散拡散確率モデル (DDPM) と拡散拡散確率モデル (DDIM) を組み合わせる。
論文 参考訳(メタデータ) (2023-08-03T21:56:50Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - Exploring Covariate and Concept Shift for Detection and Calibration of
Out-of-Distribution Data [77.27338842609153]
キャラクタリゼーションにより、OODデータの検出と信頼性校正には、それぞれのシフトに対する感度が重要であることが明らかになった。
分布内データのみを用いて両シフトでのOOD検出を改善するために,幾何学的に着想を得た手法を提案する。
我々は,OOD検出とキャリブレーションの両面で,異なるタイプのシフトの下でうまく機能する手法を最初に提案する。
論文 参考訳(メタデータ) (2021-10-28T15:42:55Z) - OODformer: Out-Of-Distribution Detection Transformer [15.17006322500865]
現実世界の安全クリティカルなアプリケーションでは、新しいデータポイントがOODであるかどうかを認識することが重要です。
本稿では,OODformer というファースト・オブ・ザ・キンドな OOD 検出アーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-07-19T15:46:38Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。