論文の概要: Development of Image Collection Method Using YOLO and Siamese Network
- arxiv url: http://arxiv.org/abs/2410.12561v1
- Date: Wed, 16 Oct 2024 13:36:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-17 13:43:54.581941
- Title: Development of Image Collection Method Using YOLO and Siamese Network
- Title(参考訳): YOLOとシームズネットワークを用いた画像収集手法の開発
- Authors: Chan Young Shin, Ah Hyun Lee, Jun Young Lee, Ji Min Lee, Soo Jin Park,
- Abstract要約: 著者らは、意図しないデータがユーザとともに収集されるのに、クローリング方法に問題があることに気付いた。
彼らは、オブジェクト認識モデル YOLOv10 を用いてフィルタリングできることを発見した。
著者らは、Siameseネットワークは少ないリソースで高いパフォーマンスを達成することができることも見出した。
- 参考スコア(独自算出の注目度): 2.0616129322243104
- License:
- Abstract: As we enter the era of big data, collecting high-quality data is very important. However, collecting data by humans is not only very time-consuming but also expensive. Therefore, many scientists have devised various methods to collect data using computers. Among them, there is a method called web crawling, but the authors found that the crawling method has a problem in that unintended data is collected along with the user. The authors found that this can be filtered using the object recognition model YOLOv10. However, there are cases where data that is not properly filtered remains. Here, image reclassification was performed by additionally utilizing the distance output from the Siamese network, and higher performance was recorded than other classification models. (average \_f1 score YOLO+MobileNet 0.678->YOLO+SiameseNet 0.772)) The user can specify a distance threshold to adjust the balance between data deficiency and noise-robustness. The authors also found that the Siamese network can achieve higher performance with fewer resources because the cropped images are used for object recognition when processing images in the Siamese network. (Class 20 mean-based f1 score, non-crop+Siamese(MobileNetV3-Small) 80.94 -> crop preprocessing+Siamese(MobileNetV3-Small) 82.31) In this way, the image retrieval system that utilizes two consecutive models to reduce errors can save users' time and effort, and build better quality data faster and with fewer resources than before.
- Abstract(参考訳): ビッグデータの時代に入ると、高品質なデータを集めることがとても重要です。
しかし、人間によるデータ収集は、非常に時間を要するだけでなく、コストもかかる。
そのため、多くの科学者がコンピュータを用いてデータを収集する方法を考案した。
その中にはウェブクローリングと呼ばれる方法があるが、このクローリング手法には、意図しないデータがユーザとともに収集されるという問題がある。
著者らは、オブジェクト認識モデル YOLOv10 を用いてフィルタリングできることを発見した。
しかし、適切にフィルタリングされていないデータが残っている場合もある。
ここでは、シームズネットワークから出力される距離を付加して画像再分類を行い、他の分類モデルよりも高い性能を記録した。
(平均 \_f1 score YOLO+MobileNet 0.678->YOLO+SiameseNet 0.772)) データ不足とノイズロスのバランスを調整するために距離閾値を指定することができる。
著者らはまた,シームズネットワークで画像を処理する際に,収穫した画像が物体認識に使用されるため,より少ないリソースで高い性能を達成できることを示した。
(20級平均f1スコア、非crop+Siamese(MobileNetV3-Small)80.94-> 作物前処理+Siamese(MobileNetV3-Small)82.31)この方法では、2つの連続モデルを用いてエラーを減らし、ユーザの時間と労力を節約し、より優れた品質データをより早く、より少ないリソースで構築することができる。
関連論文リスト
- Optimizing YOLO Architectures for Optimal Road Damage Detection and Classification: A Comparative Study from YOLOv7 to YOLOv10 [0.0]
本稿では,ディープラーニングモデルを用いた道路損傷検出のための総合ワークフローを提案する。
ハードウェアの制約を満たすため、大きな画像が収穫され、軽量モデルが利用される。
提案手法では,コーディネートアテンションレイヤを備えたカスタムYOLOv7モデルや,Tiny YOLOv7モデルなど,複数のモデルアーキテクチャを採用している。
論文 参考訳(メタデータ) (2024-10-10T22:55:12Z) - Delving Deeper into Data Scaling in Masked Image Modeling [145.36501330782357]
視覚認識のためのマスク付き画像モデリング(MIM)手法のスケーリング能力に関する実証的研究を行った。
具体的には、Webで収集したCoyo-700Mデータセットを利用する。
我々のゴールは、データとモデルのサイズの異なるスケールでダウンストリームタスクのパフォーマンスがどのように変化するかを調べることです。
論文 参考訳(メタデータ) (2023-05-24T15:33:46Z) - A novel method for data augmentation: Nine Dot Moving Least Square
(ND-MLS) [19.902634947831125]
我々は9ドットMLS(ND-MLS)と呼ばれるデータ拡張のための新しいアプローチを提案する。
画像はND-MLSによって計算される制御点に基づいて変形される。
この方法では,既存のデータセット1つに対して,2000以上の画像を短時間で生成することができる。
論文 参考訳(メタデータ) (2022-08-24T13:26:53Z) - Portuguese Man-of-War Image Classification with Convolutional Neural
Networks [58.720142291102135]
ポルトガルマン・オブ・ウォー(ポルトガル語: Man-of-war、PMW)は、長い触手を持つゼラチン質の生物である。
本稿では,InstagramのソーシャルメディアからPMW画像を認識するための畳み込みニューラルネットワークの利用について報告する。
論文 参考訳(メタデータ) (2022-07-04T03:06:45Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - Effective Model Sparsification by Scheduled Grow-and-Prune Methods [73.03533268740605]
本稿では,高密度モデルの事前学習を伴わない新規なGrow-and-prune(GaP)手法を提案する。
実験により、そのようなモデルは様々なタスクにおいて80%の間隔で高度に最適化された高密度モデルの品質に適合または打ち勝つことができることが示された。
論文 参考訳(メタデータ) (2021-06-18T01:03:13Z) - Contemplating real-world object classification [53.10151901863263]
Barbuらが最近提案したObjectNetデータセットを再分析した。
日常の状況に物を含むこと。
分離されたオブジェクトにディープモデルを適用すると、元の論文のようにシーン全体ではなく、約20~30%の性能改善が得られます。
論文 参考訳(メタデータ) (2021-03-08T23:29:59Z) - EfficientPose: Efficient Human Pose Estimation with Neural Architecture
Search [47.30243595690131]
効率的なバックボーンと効率的なヘッドの2つの部分を含む、人間のポーズ推定を目的とした効率的なフレームワークを提案します。
我々の最小モデルは、MPIIで88.1%のPCKh@0.5の0.65 GFLOPしか持たず、我々の大モデルは2 GFLOPしか持たないが、その精度は最先端の大型モデルと競合する。
論文 参考訳(メタデータ) (2020-12-13T15:38:38Z) - Application of Facial Recognition using Convolutional Neural Networks
for Entry Access Control [0.0]
本論文は,画像中の人物を入力として捉え,その人物を著者の1人か否かを分類する,教師付き分類問題の解決に焦点をあてる。
提案手法は,(1)WoodNetと呼ばれるニューラルネットワークをスクラッチから構築し,トレーニングすること,(2)ImageNetデータベース上に事前トレーニングされたネットワークを利用することで,転送学習を活用すること,の2つである。
結果は、データセット内の個人を高い精度で分類し、保持されたテストデータに対して99%以上の精度で達成する2つのモデルである。
論文 参考訳(メタデータ) (2020-11-23T07:55:24Z) - Rethinking Recurrent Neural Networks and Other Improvements for Image
Classification [1.5990720051907859]
画像認識モデルの設計において,RNNを付加層として統合することを提案する。
また、複数のモデルを用いて専門家による予測を生成するエンド・ツー・エンドのマルチモデルアンサンブルも開発している。
私たちのモデルは、Surreyデータセットに新しいレコードを設定します。
論文 参考訳(メタデータ) (2020-07-30T00:40:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。