論文の概要: Automatic location detection based on deep learning
- arxiv url: http://arxiv.org/abs/2403.10912v1
- Date: Sat, 16 Mar 2024 12:25:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-19 21:06:03.163679
- Title: Automatic location detection based on deep learning
- Title(参考訳): 深層学習に基づく位置の自動検出
- Authors: Anjali Karangiya, Anirudh Sharma, Divax Shah, Kartavya Badgujar, Dr. Chintan Thacker, Dainik Dave,
- Abstract要約: 本研究は,インドにおける都市画像の識別・分類に適した画像分類システムの詳細な研究と実装について述べる。
インドでは,Ahmedabad,Delhi,Kerala,Kolkata,Mumbaiの5都市に画像の分類を行った。
本研究は,観光,都市計画,さらにはリアルタイム位置情報システムへの応用の可能性を示すものである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The proliferation of digital images and the advancements in deep learning have paved the way for innovative solutions in various domains, especially in the field of image classification. Our project presents an in-depth study and implementation of an image classification system specifically tailored to identify and classify images of Indian cities. Drawing from an extensive dataset, our model classifies images into five major Indian cities: Ahmedabad, Delhi, Kerala, Kolkata, and Mumbai to recognize the distinct features and characteristics of each city/state. To achieve high precision and recall rates, we adopted two approaches. The first, a vanilla Convolutional Neural Network (CNN) and then we explored the power of transfer learning by leveraging the VGG16 model. The vanilla CNN achieved commendable accuracy and the VGG16 model achieved a test accuracy of 63.6%. Evaluations highlighted the strengths and potential areas of improvement, positioning our model as not only competitive but also scalable for broader applications. With an emphasis on open-source ethos, our work aims to contribute to the community, encouraging further development and diverse applications. Our findings demonstrate the potential applications in tourism, urban planning, and even real-time location identification systems, among others.
- Abstract(参考訳): デジタル画像の普及と深層学習の進歩は、特に画像分類の分野で、様々な領域における革新的な解決策の道を開いた。
本研究は,インドにおける都市画像の識別・分類に適した画像分類システムの詳細な研究と実装について述べる。
大規模なデータセットから、我々のモデルは、Ahmedabad, Delhi, Kerala, Kolkata, Mumbaiの5つの主要なインド都市に分類し、各都市と州の特徴と特徴を認識する。
高い精度とリコール率を達成するために,我々は2つのアプローチを採用した。
まず,バニラ畳み込みニューラルネットワーク(CNN)を用いて,VGG16モデルを用いて伝達学習のパワーについて検討した。
バニラCNNは高い精度を達成し、VGG16モデルは63.6%のテスト精度を達成した。
評価は改善の強みと潜在的な領域を強調し、我々のモデルを競争力だけでなく、より広範なアプリケーションにもスケーラブルに位置づけた。
オープンソースの倫理に重点を置いて、私たちの仕事はコミュニティに貢献し、さらなる開発と多様なアプリケーションを促進することを目的としています。
本研究は,観光,都市計画,さらにはリアルタイム位置情報システムなどへの応用の可能性を示すものである。
関連論文リスト
- CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - Domain Generalization for Mammographic Image Analysis with Contrastive
Learning [62.25104935889111]
効果的なディープラーニングモデルのトレーニングには、さまざまなスタイルと品質を備えた大規模なデータが必要である。
より優れたスタイルの一般化能力を備えた深層学習モデルを実現するために,新しいコントラスト学習法が開発された。
提案手法は,様々なベンダスタイルドメインのマンモグラムや,いくつかのパブリックデータセットを用いて,広範囲かつ厳密に評価されている。
論文 参考訳(メタデータ) (2023-04-20T11:40:21Z) - GIVL: Improving Geographical Inclusivity of Vision-Language Models with
Pre-Training Methods [62.076647211744564]
我々は地理包摂型視覚・言語事前学習モデルであるGIVLを提案する。
1) 類似のカテゴリにおける概念は独自の知識と視覚的特徴を持ち、2) 類似の視覚的特徴を持つ概念は、全く異なるカテゴリに該当する可能性がある。
GIVLは、同様のスケールのデータを事前訓練した類似サイズのモデルと比較して、最先端のSOTA(State-of-the-art)を達成し、ジオディバースなV&Lタスクにおけるよりバランスの取れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-01-05T03:43:45Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Multi-dimension Geospatial feature learning for urban region function
recognition [16.775454672972863]
都市部機能認識は、限られた都市部を監視・管理する上で重要な役割を担っている。
都市部機能認識のための高次元GBDデータとRS画像を組み合わせた多次元特徴学習モデル(MDFL)を提案する。
我々のモデルは全体の精度を92.75で達成し、最先端の技術を10%上回った。
論文 参考訳(メタデータ) (2022-07-18T09:29:10Z) - Deep transfer learning for image classification: a survey [4.590533239391236]
画像分類のベストプラクティスは、大量のラベル付きデータに基づいて大きな深層モデルをトレーニングできることである。
これらのシナリオでは、トランスファーラーニングはパフォーマンスを改善するのに役立つ。
画像分類におけるトランスファーラーニングの適用の新たな分類法を提案する。
論文 参考訳(メタデータ) (2022-05-20T00:03:39Z) - Segmenting across places: The need for fair transfer learning with
satellite imagery [24.087993065704527]
最先端のモデルは、都市部に比べて農村部での全体的な精度が良い。
本研究では, 都市部に比べて, 原産地と対象地域とでは, 生衛星画像が相違点が多いことを示す。
論文 参考訳(メタデータ) (2022-04-09T02:14:56Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - PGL: Prior-Guided Local Self-supervised Learning for 3D Medical Image
Segmentation [87.50205728818601]
本稿では,潜在特徴空間における局所的一貫性を学習するPGL(PresideedGuided Local)自己教師モデルを提案する。
我々のPGLモデルは、局所領域の特異な表現を学習し、したがって構造情報を保持できる。
論文 参考訳(メタデータ) (2020-11-25T11:03:11Z) - City-Scale Visual Place Recognition with Deep Local Features Based on
Multi-Scale Ordered VLAD Pooling [5.274399407597545]
本稿では,コンテンツに基づく画像検索に基づいて,都市規模で位置認識を行うシステムを提案する。
まず,視覚的位置認識の包括的分析を行い,その課題を概観する。
次に,画像表現ベクトルに空間情報を埋め込むために,畳み込み型ニューラルネットワークアクティベーションを用いた単純なプーリング手法を提案する。
論文 参考訳(メタデータ) (2020-09-19T15:21:59Z) - Automatic Signboard Detection and Localization in Densely Populated
Developing Cities [0.0]
自然シーン画像における看板検出は, エラーのない情報検索における最優先課題である。
本稿では,看板を自動的に検出し,そのような都市に適した新しい物体検出手法を提案する。
提案手法では,符号板を正確に検出できる(背景の形状や色が多様であっても平均精度は0.90 mAP)。
論文 参考訳(メタデータ) (2020-03-04T08:04:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。