論文の概要: Evaluating the Visual Similarity of Southwest China's Ethnic Minority Brocade Based on Deep Learning
- arxiv url: http://arxiv.org/abs/2408.14060v1
- Date: Mon, 26 Aug 2024 07:37:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 14:52:59.845076
- Title: Evaluating the Visual Similarity of Southwest China's Ethnic Minority Brocade Based on Deep Learning
- Title(参考訳): 深層学習に基づく中国南西部の民族的マイノリティブロードの視覚的類似性の評価
- Authors: Shichen Liu, Huaxing Lu,
- Abstract要約: 本稿では,中国南西部における少数民族パターンの視覚的類似性について,深層学習法を用いて検討する。
カスタマイズされたSResNet-18ネットワークが開発され、テストセットで98.7%の精度を実現した。
- 参考スコア(独自算出の注目度): 8.122777887706587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper employs deep learning methods to investigate the visual similarity of ethnic minority patterns in Southwest China. A customized SResNet-18 network was developed, achieving an accuracy of 98.7% on the test set, outperforming ResNet-18, VGGNet-16, and AlexNet. The extracted feature vectors from SResNet-18 were evaluated using three metrics: cosine similarity, Euclidean distance, and Manhattan distance. The analysis results were visually represented on an ethnic thematic map, highlighting the connections between ethnic patterns and their regional distributions.
- Abstract(参考訳): 本稿では,中国南西部における少数民族パターンの視覚的類似性について,深層学習法を用いて検討する。
SResNet-18ネットワークは、テストセットで98.7%の精度を実現し、ResNet-18、VGGNet-16、AlexNetを上回った。
SResNet-18から抽出した特徴ベクトルは,コサイン類似度,ユークリッド距離,マンハッタン距離の3つの指標を用いて評価した。
分析結果は、民族のパターンと地域分布の関連性を明らかにするために、民族のテーママップ上に視覚的に表現された。
関連論文リスト
- $\mathbb{X}$-Sample Contrastive Loss: Improving Contrastive Learning with Sample Similarity Graphs [62.565573316667276]
サンプルが他者とどのように関連しているかを符号化する目的を開発する。
クラスやテキストのキャプション記述における類似性に基づいて視覚モデルを訓練する。
我々の目標は、特に低いデータ体制でうまく機能しているようで、CLIPが16.8%、ImageNet Realが18.1%だった。
論文 参考訳(メタデータ) (2024-07-25T15:38:16Z) - 3SHNet: Boosting Image-Sentence Retrieval via Visual Semantic-Spatial Self-Highlighting [12.770499009990864]
本稿では,高精度,高効率,高一般化画像文検索のための視覚的セマンティック・空間自己ハイライトネットワーク(3SHNet)を提案する。
3SHNetは、目立った物体とその空間的位置を視覚的に識別する。
MS-COCOとFlickr30Kベンチマークで実施された実験は、提案した3SHNetの優れた性能、推論効率、一般化を裏付けるものである。
論文 参考訳(メタデータ) (2024-04-26T09:25:18Z) - DeepTriNet: A Tri-Level Attention Based DeepLabv3+ Architecture for
Semantic Segmentation of Satellite Images [0.0]
本研究では,衛星画像のセマンティックセグメンテーションのための3レベルアテンションに基づくDeepLabv3+アーキテクチャ(DeepTriNet)を提案する。
提案手法は, 圧縮・励起ネットワーク (SENets) とトリレベルアテンションユニット (TAUs) をバニラのDeepLabv3+アーキテクチャと組み合わせたものである。
提案したDeepTriNetは、精度が98%と77%、IoU 80%と58%、精度が88%と68%で、それぞれ4クラスのLand-Cover.aiデータセットと15クラスのGID-2データセットで79%と55%のリコールで、従来の多くの手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-05T18:35:34Z) - SeLiNet: Sentiment enriched Lightweight Network for Emotion Recognition
in Images [1.5070398746522742]
本稿では、感情に富んだ軽量ネットワークSeLiNetと、画像の文脈的感情認識のためのエンド・ツー・エンド・デバイスパイプラインを提案する。
SeLiNetモデルは、身体特徴抽出器、画像美学特徴抽出器、学習ベース融合ネットワークで構成され、個別の感情と人間の感情を共同で推定する。
論文 参考訳(メタデータ) (2023-07-06T04:49:47Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - MogaNet: Multi-order Gated Aggregation Network [64.16774341908365]
我々は,識別的視覚的表現学習のために,MogaNetと呼ばれる現代ConvNetの新たなファミリーを提案する。
MogaNetは概念的に単純だが効果的な畳み込みをカプセル化し、集約をコンパクトモジュールに集約する。
MogaNetは、ImageNetの最先端のViTやConvNetと比較して、優れたスケーラビリティ、パラメータの大幅な効率、競争性能を示している。
論文 参考訳(メタデータ) (2022-11-07T04:31:17Z) - Segmentation of Weakly Visible Environmental Microorganism Images Using
Pair-wise Deep Learning Features [7.837413642215894]
本研究では,Pairwise Deep Learning Feature Network (PDLF-Net)を提案する。
PDLFを使用することで、各画像の対角深層学習機能をベースモデルのSegNetの異なるブロックに結合することにより、ネットワークはフォアグラウンド(EM)にもっと集中することができる。
PDLF-Netは89.24%、63.20%、77.27%、35.15%、89.72%、91.44%、89.30%という優れたセグメンテーション結果を達成する。
論文 参考訳(メタデータ) (2022-08-31T16:37:52Z) - Dense Siamese Network [86.23741104851383]
本稿では,Dense Siamese Network(DenseSiam)を提案する。
画像の2つのビュー間の類似性を最大化し、ピクセルの一貫性と領域の一貫性という2種類の一貫性を学習する。
最先端のセグメンテーション手法を2.1 mIoUで28%のトレーニングコストで上回っている。
論文 参考訳(メタデータ) (2022-03-21T15:55:23Z) - Hex2vec -- Context-Aware Embedding H3 Hexagons with OpenStreetMap Tags [9.743315439284407]
都市機能と土地利用に関する地域ベクトル表現をマイクロエリアグリッドで学習するための最初のアプローチを提案する。
土地利用, 建築, 都市域の機能, 水の種類, 緑その他の自然地域の主な特徴に関連するOpenStreetMapタグのサブセットを同定する。
結果として得られるベクトル表現は、ベクトルベースの言語モデルに見られるものと同様、地図特性のセマンティック構造を示す。
論文 参考訳(メタデータ) (2021-11-01T14:22:53Z) - Weakly Supervised Person Search with Region Siamese Networks [65.76237418040071]
教師付き学習は人検索において支配的であるが、境界ボックスとアイデンティティの詳細なラベル付けが必要である。
私たちは、バウンディングボックスアノテーションのみが利用できる弱い教師付き設定を提示します。
我々のモデルはCUHK-SYSUベンチマークで87.1%のランク1と86.0%のmAPを達成している。
論文 参考訳(メタデータ) (2021-09-13T16:33:27Z) - With a Little Help from My Friends: Nearest-Neighbor Contrastive
Learning of Visual Representations [87.72779294717267]
対比損失で最も近い隣り合わせを正として使用すると、ImageNet分類でパフォーマンスが大幅に向上します。
提案手法が複雑なデータ拡張に依存しないことを実証的に証明する。
論文 参考訳(メタデータ) (2021-04-29T17:56:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。