論文の概要: Automatic Signboard Detection and Localization in Densely Populated
Developing Cities
- arxiv url: http://arxiv.org/abs/2003.01936v4
- Date: Mon, 22 Aug 2022 15:03:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 13:18:42.068065
- Title: Automatic Signboard Detection and Localization in Densely Populated
Developing Cities
- Title(参考訳): 人口密集型都市における看板の自動検出と位置推定
- Authors: Md. Sadrul Islam Toaha, Sakib Bin Asad, Chowdhury Rafeed Rahman, S.M.
Shahriar Haque, Mahfuz Ara Proma, Md. Ahsan Habib Shuvo, Tashin Ahmed, Md.
Amimul Basher
- Abstract要約: 自然シーン画像における看板検出は, エラーのない情報検索における最優先課題である。
本稿では,看板を自動的に検出し,そのような都市に適した新しい物体検出手法を提案する。
提案手法では,符号板を正確に検出できる(背景の形状や色が多様であっても平均精度は0.90 mAP)。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most city establishments of developing cities are digitally unlabeled because
of the lack of automatic annotation systems. Hence location and trajectory
services such as Google Maps, Uber etc remain underutilized in such cities.
Accurate signboard detection in natural scene images is the foremost task for
error-free information retrieval from such city streets. Yet, developing
accurate signboard localization system is still an unresolved challenge because
of its diverse appearances that include textual images and perplexing
backgrounds. We present a novel object detection approach that can detect
signboards automatically and is suitable for such cities. We use Faster R-CNN
based localization by incorporating two specialized pretraining methods and a
run time efficient hyperparameter value selection algorithm. We have taken an
incremental approach in reaching our final proposed method through detailed
evaluation and comparison with baselines using our constructed SVSO (Street
View Signboard Objects) signboard dataset containing signboard natural scene
images of six developing countries. We demonstrate state-of-the-art performance
of our proposed method on both SVSO dataset and Open Image Dataset. Our
proposed method can detect signboards accurately (even if the images contain
multiple signboards with diverse shapes and colours in a noisy background)
achieving 0.90 mAP (mean average precision) score on SVSO independent test set.
Our implementation is available at:
https://github.com/sadrultoaha/Signboard-Detection
- Abstract(参考訳): 開発途上国の都市施設の多くは、自動アノテーションシステムがないため、デジタルにラベルが付けられていない。
そのため、Google MapsやUberなどの位置情報・トラジェクトリサービスは、こうした都市では未利用のままである。
自然景観画像における正確な看板検出は,このような街路からの誤りのない情報検索において最重要課題である。
しかし、テキスト画像や複雑な背景を含む多様な外観のため、正確な看板位置決めシステムの開発は未解決の課題である。
本稿では,このような都市に適した標識を自動的に検出する新しい物体検出手法を提案する。
高速なR-CNNに基づくローカライゼーションを,2つの特別な事前学習法と実行時間効率の高いハイパーパラメータ値選択アルゴリズムを組み込んだ。
そこで本研究では,6ヶ国の看板自然景観画像を含むSVSO (Street View Signboard Objects) サインボードデータセットを用いて,提案手法の詳細な評価とベースラインとの比較を行った。
SVSOデータセットとOpen Image Datasetの両方で提案手法の最先端性能を示す。
提案手法は,SVSO独立テストセット上で0.90mAP(平均精度)のスコアを達成できる符号板を正確に検出する。
私たちの実装は、https://github.com/sadrultoaha/Signboard-detectionで利用可能です。
関連論文リスト
- AddressCLIP: Empowering Vision-Language Models for City-wide Image Address Localization [57.34659640776723]
そこで我々は,より意味論的に問題を解決するために,AddressCLIPというエンドツーエンドのフレームワークを提案する。
われわれはピッツバーグとサンフランシスコに3つのデータセットを構築した。
論文 参考訳(メタデータ) (2024-07-11T03:18:53Z) - HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D
Images [58.720142291102135]
本稿では,屋内環境における視覚的位置認識能力の探索を目的とした,HPointLocという新しいデータセットを提案する。
データセットは人気のあるHabitatシミュレータに基づいており、独自のセンサーデータとオープンデータセットの両方を使用して屋内シーンを生成することができる。
論文 参考訳(メタデータ) (2022-12-30T12:20:56Z) - SpaText: Spatio-Textual Representation for Controllable Image Generation [61.89548017729586]
SpaTextはオープン語彙シーン制御を用いたテキスト・ツー・イメージ生成の新しい手法である。
シーン全体を記述したグローバルテキストプロンプトに加えて、ユーザはセグメンテーションマップを提供する。
現状拡散モデルである画素ベースと潜在条件ベースでの有効性を示す。
論文 参考訳(メタデータ) (2022-11-25T18:59:10Z) - Which country is this picture from? New data and methods for DNN-based
country recognition [33.73817899937691]
これまでの研究は主に、写真が撮影された場所のジオコーディネートの推定に焦点が当てられていた。
約400万枚の画像を含む新しいデータセットであるVIPPGeoデータセットを導入する。
このデータセットを用いて、国別認識問題を分類問題とするディープラーニングアーキテクチャを訓練する。
論文 参考訳(メタデータ) (2022-09-02T10:56:41Z) - Visual Cross-View Metric Localization with Dense Uncertainty Estimates [11.76638109321532]
本研究は、屋外ロボティクスにおける視覚的クロスビューメトリックローカライゼーションに対処する。
地上レベルのカラー画像と局地的な環境を含む衛星パッチが与えられた場合、衛星パッチ内の地上カメラの位置を特定することが課題である。
我々は、より高密度な衛星記述子、ボトルネックにおける類似性マッチング、およびマルチモーダルなローカライゼーションの曖昧さを捉えるための出力としての密度空間分布を備えた新しいネットワークアーキテクチャを考案した。
論文 参考訳(メタデータ) (2022-08-17T20:12:23Z) - SeeTheSeams: Localized Detection of Seam Carving based Image Forgery in
Satellite Imagery [15.127101376238418]
シーム彫刻は、コンテンツ認識画像操作の一般的なテクニックである。
本稿では,このような画像中のシームの検出と位置決定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-08-28T00:00:37Z) - Object Tracking and Geo-localization from Street Images [4.5958644027273685]
本稿では,低フレームレートのストリートビデオから交通標識を検出・位置情報化するフレームワークを提案する。
提案システムは、カメラに対する各符号の位置オフセットを予測するRetinaNet(GPS-RetinaNet)の修正版を用いている。
提案したデータセットは、幅広い道路から収集された多様な環境群をカバーする。
論文 参考訳(メタデータ) (2021-07-13T17:32:04Z) - City-scale Scene Change Detection using Point Clouds [71.73273007900717]
2つの異なる時間にカメラを設置して撮影した画像を用いて都市の構造変化を検出する手法を提案する。
変化検出のための2点雲の直接比較は、不正確な位置情報のため理想的ではない。
この問題を回避するために,ポイントクラウド上での深層学習に基づく非厳密な登録を提案する。
提案手法は,視点や照明の違いがあっても,シーン変化を効果的に検出できることを示す。
論文 参考訳(メタデータ) (2021-03-26T08:04:13Z) - Bounding Boxes Are All We Need: Street View Image Classification via
Context Encoding of Detected Buildings [7.1235778791928634]
「Detector-Encoder-Classifier」フレームワークが提案されている。
BEAUTY"データセットは、ストリートビューイメージの分類だけでなく、マルチクラスのビルディング検出にも利用できる。
論文 参考訳(メタデータ) (2020-10-03T08:49:51Z) - BoMuDANet: Unsupervised Adaptation for Visual Scene Understanding in
Unstructured Driving Environments [54.22535063244038]
非構造交通環境における視覚的シーン理解のための教師なし適応手法を提案する。
本手法は,車,トラック,二輪車,三輪車,歩行者からなる密集・異種交通を伴う非構造現実シナリオを対象としたものである。
論文 参考訳(メタデータ) (2020-09-22T08:25:44Z) - UC-Net: Uncertainty Inspired RGB-D Saliency Detection via Conditional
Variational Autoencoders [81.5490760424213]
データラベリングプロセスから学習することで、RGB-Dサリエンシ検出に不確実性を利用するための第1のフレームワーク(UCNet)を提案する。
そこで本研究では,サリエンシデータラベリングにヒントを得て,確率的RGB-Dサリエンシ検出ネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-13T04:12:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。