論文の概要: A Multispectral Automated Transfer Technique (MATT) for machine-driven
image labeling utilizing the Segment Anything Model (SAM)
- arxiv url: http://arxiv.org/abs/2402.11413v1
- Date: Sun, 18 Feb 2024 01:01:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 21:21:00.476532
- Title: A Multispectral Automated Transfer Technique (MATT) for machine-driven
image labeling utilizing the Segment Anything Model (SAM)
- Title(参考訳): Segment Anything Model(SAM)を用いた機械駆動画像ラベリングのためのマルチスペクトル自動転送技術(MATT)
- Authors: James E. Gallagher, Aryav Gogia, Edward J. Oughton
- Abstract要約: 本稿では,Multispectral Automated Transfer Technique (MATT) と呼ぶ手法について概説する。
RGB画像からSAMセグメンテーションマスクを変換することで、高精度で効率よくマルチスペクトル画像のセグメンテーションとラベルを自動で行うことができる。
本研究は,多スペクトル物体検出モデルを高速に分割,ラベル付け,訓練するための新しいオープンソース手法を提供することにより,多スペクトル物体検出の研究に大きく貢献する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Segment Anything Model (SAM) is drastically accelerating the speed and
accuracy of automatically segmenting and labeling large Red-Green-Blue (RGB)
imagery datasets. However, SAM is unable to segment and label images outside of
the visible light spectrum, for example, for multispectral or hyperspectral
imagery. Therefore, this paper outlines a method we call the Multispectral
Automated Transfer Technique (MATT). By transposing SAM segmentation masks from
RGB images we can automatically segment and label multispectral imagery with
high precision and efficiency. For example, the results demonstrate that
segmenting and labeling a 2,400-image dataset utilizing MATT achieves a time
reduction of 87.8% in developing a trained model, reducing roughly 20 hours of
manual labeling, to only 2.4 hours. This efficiency gain is associated with
only a 6.7% decrease in overall mean average precision (mAP) when training
multispectral models via MATT, compared to a manually labeled dataset. We
consider this an acceptable level of precision loss when considering the time
saved during training, especially for rapidly prototyping experimental modeling
methods. This research greatly contributes to the study of multispectral object
detection by providing a novel and open-source method to rapidly segment,
label, and train multispectral object detection models with minimal human
interaction. Future research needs to focus on applying these methods to (i)
space-based multispectral, and (ii) drone-based hyperspectral imagery.
- Abstract(参考訳): Segment Anything Model (SAM)は、大規模なRed-Green-Blue (RGB)イメージデータセットの自動セグメンテーションとラベル付けのスピードと正確性を大幅に加速している。
しかし、サムは、例えばマルチスペクトルやハイパースペクトル画像など、可視光スペクトルの外側の画像をセグメンテーションしたりラベル付けしたりできない。
そこで本稿では,MATT(Multispectral Automated Transfer Technique)と呼ぶ手法について概説する。
RGB画像からSAMセグメンテーションマスクを変換することで、高精度で効率よくマルチスペクトル画像のセグメンテーションとラベルを自動で行うことができる。
例えば、mattを用いた2,400画像データセットのセグメンテーションとラベリングは、トレーニングモデルの開発において87.8%の時間短縮を達成し、およそ20時間の手動ラベリングを2.4時間に短縮した。
この効率向上は、MATTによるマルチスペクトルモデルのトレーニングにおいて、手動でラベル付けされたデータセットと比較して、全体の平均平均精度(mAP)が6.7%減少することと関連付けられている。
本研究では,訓練中に省いた時間を考慮した場合の精度の低下を許容できるレベルとみなす。
本研究は,人間のインタラクションを最小限に抑えたマルチスペクトル物体検出モデルを高速に分割,ラベル付け,訓練するための,新しいオープンソース手法を提供することにより,マルチスペクトル物体検出の研究に大きく貢献する。
今後の研究はこれらの手法を応用することに集中する必要がある
(i)空間ベースのマルチスペクトル、及び
(ii) ドローンによるハイパースペクトル画像。
関連論文リスト
- SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - SAM-based instance segmentation models for the automation of structural
damage detection [0.0]
M1300と命名された1,300の注釈付き画像(640ピクセル×640ピクセル)で、レンガ、壊れたレンガ、ひび割れをカバーしている。
我々は、最新の大規模モデル、プロンプトベースのSegment Anything Model(SAM)など、ベンチマークのためのいくつかの主要なアルゴリズムをテストする。
本稿では,SAM実行を自動化する2つの新しい手法を提案する。第1の方法はプロンプトエンコーダを捨て,SAMエンコーダを他のデコーダに接続することであり,第2の方法は学習可能な自己生成プロンプトを導入する。
論文 参考訳(メタデータ) (2024-01-27T02:00:07Z) - Multimodal Industrial Anomaly Detection by Crossmodal Feature Mapping [12.442574943138794]
本稿では、点雲とRGB画像を利用して異常をローカライズする産業用マルチモーダル異常検出(AD)タスクについて検討する。
我々は,新しい軽量かつ高速なフレームワークを導入し,特徴を1つのモダリティからもう1つのモダリティへのマップを,名目標本上で学習する。
論文 参考訳(メタデータ) (2023-12-07T18:41:21Z) - A Dual Attentive Generative Adversarial Network for Remote Sensing Image
Change Detection [6.906936669510404]
本稿では,高分解能なリモートセンシング画像変化検出タスクを実現するために,二重注意生成対向ネットワークを提案する。
DAGANフレームワークは、85.01%がIoU、91.48%がF1スコアであり、LEVIRデータセットの先進的な手法よりもパフォーマンスが良い。
論文 参考訳(メタデータ) (2023-10-03T08:26:27Z) - PatchCT: Aligning Patch Set and Label Set with Conditional Transport for
Multi-Label Image Classification [48.929583521641526]
マルチラベル画像分類は、与えられた画像から複数のラベルを識別することを目的とした予測タスクである。
本稿では,このギャップを埋める条件輸送理論を紹介する。
複数ラベルの分類をCT問題として定式化することで,画像とラベルの相互作用を効率的に活用できることがわかった。
論文 参考訳(メタデータ) (2023-07-18T08:37:37Z) - Revisiting Consistency Regularization for Semi-supervised Change
Detection in Remote Sensing Images [60.89777029184023]
教師付きクロスエントロピー(CE)損失に加えて、教師なしCD損失を定式化する半教師付きCDモデルを提案する。
2つの公開CDデータセットを用いて実験を行った結果,提案手法は教師付きCDの性能に近づきやすいことがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:59:01Z) - Contrastive Multiview Coding with Electro-optics for SAR Semantic
Segmentation [0.6445605125467573]
SARセマンティックセグメンテーションのためのマルチモーダル表現学習を提案する。
従来の研究とは異なり,本手法ではEO画像,SAR画像,ラベルマスクを併用した。
いくつかの実験により,本手法はモデル性能,サンプル効率,収束速度において既存の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-08-31T23:55:41Z) - A Hierarchical Transformation-Discriminating Generative Model for Few
Shot Anomaly Detection [93.38607559281601]
各トレーニングイメージのマルチスケールパッチ分布をキャプチャする階層的生成モデルを開発した。
この異常スコアは、スケール及び画像領域にわたる正しい変換のパッチベースの投票を集約して得られる。
論文 参考訳(メタデータ) (2021-04-29T17:49:48Z) - A Comparison of Deep Learning Object Detection Models for Satellite
Imagery [0.0]
商用電気光学衛星画像における油・ガス破砕井・小型車検出のための最先端モデルの検出精度と速度を比較した。
フラッキングウェルパッド(50m~250m)の検出において, 単段検出器は予測速度に優れ, 2段検出器と多段検出器の検知性能は一致した。
小型車を検出するため、2段モデルと多段モデルでは、ある程度の速度で精度が大幅に向上する。
論文 参考訳(メタデータ) (2020-09-10T13:43:14Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。