Fugu-MT 論文翻訳(概要): Learning to "Segment Anything" in Thermal Infrared Images through Knowledge Distillation with a Large Scale Dataset SATIR

論文の概要: Learning to "Segment Anything" in Thermal Infrared Images through Knowledge Distillation with a Large Scale Dataset SATIR

arxiv url: http://arxiv.org/abs/2304.07969v1
Date: Mon, 17 Apr 2023 03:27:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-18 16:21:48.833052
Title: Learning to "Segment Anything" in Thermal Infrared Images through Knowledge Distillation with a Large Scale Dataset SATIR
Title（参考訳）: 大規模データセットsatirを用いた知識蒸留による熱赤外画像の「何か」の学習
Authors: Junzhang Chen and Xiangzhi Bai
Abstract要約: Segment Anything Model(SAM)は、Meta AIが最近導入した、プロンプト可能なセグメンテーションモデルである。熱赤外画像セグメンテーションタスクの事前訓練にSAMを用いて擬似ラベルを生成するフレームワークを提案する。我々のフレームワークはSAMのような大規模データで訓練されたモデルと協調して特殊分野の問題に対処するための新しいアプローチを提示している。
参考スコア（独自算出の注目度）: 15.198798677908615
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The Segment Anything Model (SAM) is a promptable segmentation model recently introduced by Meta AI that has demonstrated its prowess across various fields beyond just image segmentation. SAM can accurately segment images across diverse fields, and generating various masks. We discovered that this ability of SAM can be leveraged to pretrain models for specific fields. Accordingly, we have proposed a framework that utilizes SAM to generate pseudo labels for pretraining thermal infrared image segmentation tasks. Our proposed framework can effectively improve the accuracy of segmentation results of specific categories beyond the SOTA ImageNet pretrained model. Our framework presents a novel approach to collaborate with models trained with large data like SAM to address problems in special fields. Also, we generated a large scale thermal infrared segmentation dataset used for pretaining, which contains over 100,000 images with pixel-annotation labels. This approach offers an effective solution for working with large models in special fields where label annotation is challenging. Our code is available at https://github.com/chenjzBUAA/SATIR
Abstract（参考訳）: Segment Anything Model(SAM)は、Meta AIが最近導入した、画像セグメンテーション以外のさまざまな分野にまたがる、プロンプト可能なセグメンテーションモデルである。 SAMはさまざまなフィールドに画像を正確に分割し、さまざまなマスクを生成することができる。 SAMのこの能力は、特定のフィールドに対する事前訓練モデルに活用できることを発見した。そこで本研究では,SAMを用いて熱赤外画像分割作業の事前訓練を行うための擬似ラベルを生成するフレームワークを提案する。提案フレームワークは,SOTAイメージネット事前学習モデルを超えて,特定のカテゴリのセグメンテーション結果の精度を効果的に向上させることができる。我々のフレームワークはSAMのような大規模データで訓練されたモデルと協調して特殊分野の問題に対処するための新しいアプローチを提示している。また,画素アノテーションラベル付き10万枚以上の画像を含む大規模熱赤外セグメンテーションデータセットを作成した。このアプローチは、ラベルアノテーションが難しい特別な分野において、大きなモデルを扱うための効果的なソリューションを提供する。私たちのコードはhttps://github.com/chenjzBUAA/SATIRで利用可能です。

関連論文リスト

SAM 2: Segment Anything in Images and Videos [63.44869623822368]
本稿では,画像やビデオにおける迅速な視覚的セグメンテーションの解決に向けた基礎モデルであるセグメンション・エキシング・モデル2(SAM2)を提案する。ユーザインタラクションを通じてモデルとデータを改善するデータエンジンを構築し、これまでで最大のビデオセグメンテーションデータセットを収集します。我々のモデルは、リアルタイムビデオ処理のためのストリーミングメモリを備えたシンプルなトランスフォーマーアーキテクチャである。
論文参考訳（メタデータ） (2024-08-01T17:00:08Z)
IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection [55.554484379021524]
Infrared Small Target Detection (IRSTD) タスクは、自然画像と赤外線画像の間に顕著な領域ギャップがあるため、満足度の高い性能を達成するには不十分である。 IRSTDのためのIRSAMモデルを提案する。これはSAMのエンコーダデコーダアーキテクチャを改善し、赤外線小物体の特徴表現をより良く学習する。
論文参考訳（メタデータ） (2024-07-10T10:17:57Z)
MAS-SAM: Segment Any Marine Animal with Aggregated Features [55.91291540810978]
そこで本研究では,海洋生物のセグメンテーションのためのMAS-SAMという新しい特徴学習フレームワークを提案する。本手法により,グローバルな文脈的手がかりからよりリッチな海洋情報を抽出し,よりきめ細かな局部的詳細を抽出できる。
論文参考訳（メタデータ） (2024-04-24T07:38:14Z)
Performance Evaluation of Segment Anything Model with Variational Prompting for Application to Non-Visible Spectrum Imagery [15.748043194987075]
この研究は、X線/赤外線モダリティに関心のあるオブジェクトのセグメンテーションにおけるセグメンション・任意のモデル機能を評価する。提案手法は,ボックスプロンプトが与えられた場合,SAMはオブジェクトをX線モードで分割できるが,その性能は点プロンプトによって異なる。このモダリティの低コントラストの性質を考えると、赤外線オブジェクトもポイントプロンプトでセグメント化することが困難である。
論文参考訳（メタデータ） (2024-04-18T16:04:14Z)
Semantic-SAM: Segment and Recognize Anything at Any Granularity [83.64686655044765]
本稿では,任意の粒度でセグメンテーションと認識を可能にする汎用画像セグメンテーションモデルであるSemantic-SAMを紹介する。複数のデータセットを3つの粒度に集約し、オブジェクトとパーツの分離した分類を導入する。マルチグラニュラリティ機能を実現するために,各クリックで複数のレベルのマスクを生成できるマルチ選択学習方式を提案する。
論文参考訳（メタデータ） (2023-07-10T17:59:40Z)
Input Augmentation with SAM: Boosting Medical Image Segmentation with Segmentation Foundation Model [36.015065439244495]
Segment Anything Model (SAM) はコンピュータビジョンタスクのための汎用セグメンテーションのための大規模モデルである。 SAMは100万枚の画像と10億枚以上のマスクを使って訓練され、自然の風景画像に広範囲のオブジェクトのセグメンテーション結果を生成することができる。本報告では,SAMは医用画像データに高品質なセグメンテーションを提供していないが,その生成マスク,特徴,安定性スコアは,より優れた医用画像セグメンテーションモデルの構築と訓練に有用であることを示す。
論文参考訳（メタデータ） (2023-04-22T07:11:53Z)
SAM Fails to Segment Anything? -- SAM-Adapter: Adapting SAM in Underperformed Scenes: Camouflage, Shadow, Medical Image Segmentation, and More [13.047310918166762]
ドメイン固有の情報や視覚的プロンプトを,単純で効果的なアダプタを用いてセグメント化ネットワークに組み込んだtextbfSAM-Adapterを提案する。タスク固有のネットワークモデルよりも優れていて、テストしたタスクで最先端のパフォーマンスを実現できます。
論文参考訳（メタデータ） (2023-04-18T17:38:54Z)
Segment Anything [108.16489338211093]
私たちはこれまでで最大のセグメンテーションデータセットを構築し、1100万ライセンスのマスクを10億枚以上使用し、画像のプライバシーを尊重しています。このモデルは、高速に撮影できるように設計および訓練されており、ゼロショットを新しい画像配信やタスクに転送することができる。多数のタスクでその能力を評価した結果、ゼロショット性能は印象的であることが判明した。
論文参考訳（メタデータ） (2023-04-05T17:59:46Z)
Semantic Segmentation with Generative Models: Semi-Supervised Learning and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文参考訳（メタデータ） (2021-04-12T21:41:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。