論文の概要: Classification of Tents in Street Bazaars Using CNN
- arxiv url: http://arxiv.org/abs/2506.17946v1
- Date: Sun, 22 Jun 2025 08:52:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.664038
- Title: Classification of Tents in Street Bazaars Using CNN
- Title(参考訳): CNNを用いた街路バザーのテントの分類
- Authors: Azamat Ibragimov, Ruslan Isaev, Remudin Reshid Mekuria, Gulnaz Gimaletdinova, Dim Shaiakhmetov,
- Abstract要約: 本研究では,街路バザーのテント分類のための改良されたディープラーニングモデルを提案する。
我々は、独自の畳み込みニューラルネットワーク(CNN)とEfficientNetB0を比較した。
その結果、CNNのカスタムモデルは92.8%の精度を示し、EfficientNetB0は98.4%の精度を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This research paper proposes an improved deep learning model for classifying tents in street bazaars, comparing a custom Convolutional Neural Network (CNN) with EfficientNetB0. This is a critical task for market organization with a tent classification, but manual methods in the past have been inefficient. Street bazaars represent a vital economic hub in many regions, yet their unstructured nature poses significant challenges for the automated classification of market infrastructure, such as tents. In Kyrgyzstan, more than a quarter of the country's GDP is derived from bazaars. While CNNs have been widely applied to object recognition, their application to bazaar-specific tasks remains underexplored. Here, we build upon our original approach by training on an extended set of 126 original photographs that were augmented to generate additional images. This dataset is publicly available for download on Kaggle. A variety of performance metrics, such as accuracy, precision, recall, F1 score, and mean average precision (mAP), were used to assess the models comparatively, providing a more extensive analysis of classification performance. The results show that the CNN custom model achieved 92.8% accuracy, and EfficientNetB0 showed 98.4% accuracy results, confirming the effectiveness of transfer learning in the bazaar image classification. Also, when analyzing the confusion matrix, the analysis reveals the weaknesses and strengths of each model. These findings suggest that using a pre-trained model such as EfficientNetB0 significantly improves classification accuracy and generalization.
- Abstract(参考訳): 本研究では,街路バザーのテントを分類するための改良されたディープラーニングモデルを提案し,CNN(Convolutional Neural Network)とEfficientNetB0を比較した。
これは、テント分類による市場組織にとって重要な課題であるが、過去には手作業の方法が非効率であった。
ストリートバザーは、多くの地域で重要な経済拠点となっているが、その非構造的な性質は、テントのような市場インフラの自動分類に重大な課題をもたらす。
キルギスでは、同国のGDPの4分の1以上がバザールに由来する。
CNNはオブジェクト認識に広く応用されているが、バザー固有のタスクへの応用はいまだに未検討である。
ここでは、追加画像を生成するために拡張された126枚のオリジナル写真をトレーニングすることで、元のアプローチを構築します。
このデータセットは、Kaggleでダウンロードすることができる。
モデルの精度、精度、リコール、F1スコア、平均平均精度(mAP)などの様々なパフォーマンス指標を比較評価するために使用し、分類性能をより広範囲に分析した。
その結果、CNNのカスタムモデルは92.8%の精度を示し、EfficientNetB0は98.4%の精度を示し、バザー画像分類における転送学習の有効性を確認した。
また、混乱行列を解析すると、各モデルの弱点と強度が明らかになる。
これらの結果から,EfficientNetB0のような事前学習モデルを用いることで,分類精度と一般化が著しく向上することが示唆された。
関連論文リスト
- Self-Supervised Learning in Deep Networks: A Pathway to Robust Few-Shot Classification [0.0]
まず、ラベルのない大量のデータから共通特徴表現を学習できるように、自己スーパービジョンでモデルを事前訓練する。
その後、数ショットのデータセットMini-ImageNetで微調整を行い、限られたデータの下でモデルの精度と一般化能力を改善する。
論文 参考訳(メタデータ) (2024-11-19T01:01:56Z) - A Comparative Analysis of CNN-based Deep Learning Models for Landslide Detection [0.0]
インド北部とネパールの地すべりは大きな破壊をもたらし、インフラを損傷し、地域社会に脅威を与えている。
近年のインド北部とネパールの地すべりは、大きな破壊を招き、インフラを損傷し、地域社会に脅威を与えている。
ディープラーニング技術の一種であるCNNは、画像処理において顕著な成功を収めている。
論文 参考訳(メタデータ) (2024-08-03T07:20:10Z) - Stacking-Enhanced Bagging Ensemble Learning for Breast Cancer Classification with CNN [0.24578723416255752]
本稿では,乳がん分類のためのBaggingおよびスタックングアンサンブル学習手法に基づくCNN分類ネットワークを提案する。
このモデルは入力画像の高速かつ正確な分類を行うことができる。
二項分類(乳がんの有無)では、精度は98.84%に達し、5級分類では98.34%に達した。
論文 参考訳(メタデータ) (2024-07-15T09:44:43Z) - Multi-layer Representation Learning for Robust OOD Image Classification [3.1372269816123994]
我々は、CNNの中間層から特徴を抽出することで、モデルの最終的な予測を支援することができると主張している。
具体的には、ハイパーカラム法をResNet-18に適用し、NICOデータセットで評価した場合、モデルの精度を大幅に向上させる。
論文 参考訳(メタデータ) (2022-07-27T17:46:06Z) - Facilitated machine learning for image-based fruit quality assessment in
developing countries [68.8204255655161]
自動画像分類は食品科学における教師あり機械学習の一般的な課題である。
事前学習型視覚変換器(ViT)に基づく代替手法を提案する。
標準的なデバイス上で限られたリソースで簡単に実装できる。
論文 参考訳(メタデータ) (2022-07-10T19:52:20Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - To be Critical: Self-Calibrated Weakly Supervised Learning for Salient
Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。
擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。
十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-04T02:45:22Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Performance Evaluation of Convolutional Neural Networks for Gait
Recognition [0.0]
CNN(Convolutional Neural Networks)はCASIA-BデータセットのGait Energy Images (GEIs)を用いて再訓練された。
ほぼ全てのモデルは90%を超える高い精度を達成しており、クラスの増加に対して堅牢である。
論文 参考訳(メタデータ) (2021-01-25T14:44:05Z) - Fusion of CNNs and statistical indicators to improve image
classification [65.51757376525798]
畳み込みネットワークは過去10年間、コンピュータビジョンの分野を支配してきた。
この傾向を長引かせる主要な戦略は、ネットワーク規模の拡大によるものだ。
我々は、異種情報ソースを追加することは、より大きなネットワークを構築するよりもCNNにとって費用対効果が高いと仮定している。
論文 参考訳(メタデータ) (2020-12-20T23:24:31Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。