Fugu-MT 論文翻訳(概要): Integrated Image-Text Based on Semi-supervised Learning for Small Sample Instance Segmentation

論文の概要: Integrated Image-Text Based on Semi-supervised Learning for Small Sample Instance Segmentation

arxiv url: http://arxiv.org/abs/2410.16063v1
Date: Mon, 21 Oct 2024 14:44:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:38.497983
Title: Integrated Image-Text Based on Semi-supervised Learning for Small Sample Instance Segmentation
Title（参考訳）: 小インスタンスセグメンテーションのための半教師付き学習に基づく統合画像テキスト
Authors: Ruting Chi, Zhiyi Huang, Yuexing Han,
Abstract要約: 本稿では,既存情報の利用を最大化する観点から,新しいサンプルインスタンス分割法を提案する。まず、ラベルのないデータを学習して擬似ラベルを生成し、利用可能なサンプルの数を増やすことで、モデルが完全に活用するのに役立つ。第二に、テキストと画像の特徴を統合することにより、より正確な分類結果を得ることができる。
参考スコア（独自算出の注目度）: 1.3157419797035321
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Small sample instance segmentation is a very challenging task, and many existing methods follow the training strategy of meta-learning which pre-train models on support set and fine-tune on query set. The pre-training phase, which is highly task related, requires a significant amount of additional training time and the selection of datasets with close proximity to ensure effectiveness. The article proposes a novel small sample instance segmentation solution from the perspective of maximizing the utilization of existing information without increasing annotation burden and training costs. The proposed method designs two modules to address the problems encountered in small sample instance segmentation. First, it helps the model fully utilize unlabeled data by learning to generate pseudo labels, increasing the number of available samples. Second, by integrating the features of text and image, more accurate classification results can be obtained. These two modules are suitable for box-free and box-dependent frameworks. In the way, the proposed method not only improves the performance of small sample instance segmentation, but also greatly reduce reliance on pre-training. We have conducted experiments in three datasets from different scenes: on land, underwater and under microscope. As evidenced by our experiments, integrated image-text corrects the confidence of classification, and pseudo labels help the model obtain preciser masks. All the results demonstrate the effectiveness and superiority of our method.
Abstract（参考訳）: 小サンプルのインスタンスセグメンテーションは非常に難しいタスクであり、既存の多くのメソッドは、サポートセットで事前トレーニングされたモデルとクエリセットで微調整されたメタラーニングのトレーニング戦略に従います。タスクと関連性の高い事前トレーニングフェーズでは、かなりの量のトレーニング時間と、有効性を確保するために近接したデータセットの選択が必要になる。本稿では、アノテーションの負担やトレーニングコストを増大させることなく、既存の情報の利用を最大化する観点から、新しい小さなサンプルインスタンス分割ソリューションを提案する。提案手法は,小サンプルのインスタンスセグメンテーションで発生する問題に対処する2つのモジュールを設計する。まず、ラベルのないデータを学習して擬似ラベルを生成し、利用可能なサンプルの数を増やすことで、モデルが完全に活用するのに役立つ。第二に、テキストと画像の特徴を統合することにより、より正確な分類結果を得ることができる。これら2つのモジュールは、ボックスフリーおよびボックス依存のフレームワークに適している。提案手法は,小サンプル分割の性能向上だけでなく,事前学習への依存を著しく低減する。地上, 水中, 顕微鏡下の3つの場面で実験を行った。我々の実験で証明されたように、統合画像テキストは分類の信頼性を補正し、擬似ラベルはモデルが正確なマスクを得るのに役立つ。これらの結果は,本手法の有効性と優位性を示すものである。

関連論文リスト

Partially Supervised Unpaired Multi-Modal Learning for Label-Efficient Medical Image Segmentation [53.723234136550055]
我々は、新しい学習パラダイムを部分教師付き無ペア型マルチモーダルラーニング(PSUMML)と呼ぶ。そこで我々は,DEST (Ensembled Self-Training) フレームワークを用いた新しい部分クラス適応法を提案する。我々のフレームワークは、部分的にラベル付けされていないマルチモーダルデータを用いて学習するためのモダリティ特定正規化層を持つコンパクトなセグメンテーションネットワークで構成されている。
論文参考訳（メタデータ） (2025-03-07T07:22:42Z)
Pre-Trained Vision-Language Models as Partial Annotators [40.89255396643592]
事前学習された視覚言語モデルは、画像と自然言語の統一表現をモデル化するために大量のデータを学習する。本稿では,事前学習型モデルアプリケーションのための「事前学習型-弱教師付き学習」パラダイムについて検討し,画像分類タスクの実験を行う。
論文参考訳（メタデータ） (2024-05-23T17:17:27Z)
Two-Step Active Learning for Instance Segmentation with Uncertainty and Diversity Sampling [20.982992381790034]
本研究では,不確実性に基づくサンプリングと多様性に基づくサンプリングを統合したポストホック能動学習アルゴリズムを提案する。提案アルゴリズムは単純で実装が容易なだけでなく,様々なデータセットに対して優れた性能を実現する。
論文参考訳（メタデータ） (2023-09-28T03:40:30Z)
Incremental Learning on Food Instance Segmentation [31.60448022949561]
本稿では,データラベリング予算に制限のあるモデル性能を最適化するインクリメンタル学習フレームワークを提案する。フレームワークのパワーは、最新のトレーニングされたインスタンスセグメンテーションモデルに対して、非ラベルのサンプルがいかに困難であるかを予測する、新しい困難評価モデルである。提案するフレームワークは,4つの大規模食品データセットにおいて,現在のインクリメンタルラーニングベンチマークより優れ,完全注釈付きサンプルでトレーニングしたモデルとの競合性能を実現している。
論文参考訳（メタデータ） (2023-06-28T04:17:16Z)
AdaSelection: Accelerating Deep Learning Training through Data Subsampling [27.46630703428186]
適応型サブサンプリング手法であるAdaSelectionを導入し,各ミニバッチ内の最も情報性の高いサブサンプルを同定する。業界標準のベースラインと比較すると、AdaSelectionは一貫して優れたパフォーマンスを示している。
論文参考訳（メタデータ） (2023-06-19T07:01:28Z)
Semi-Supervised Image Captioning by Adversarially Propagating Labeled Data [95.0476489266988]
本稿では、画像キャプションモデルの一般化を改善するための、新しいデータ効率半教師付きフレームワークを提案する。提案手法は,キャプタにペアデータから学習し,段階的に未ペアデータの関連付けを行うよう訓練する。 1)画像ベースと(2)高密度領域ベースキャプションデータセットの両方を総合的かつ包括的な実験結果とし,それに続いて,少ないペアリングデータセットの包括的分析を行った。
論文参考訳（メタデータ） (2023-01-26T15:25:43Z)
Style Curriculum Learning for Robust Medical Image Segmentation [62.02435329931057]
深部セグメンテーションモデルは、トレーニングデータセットとテストデータセットの間の画像強度の分散シフトによって、しばしば劣化する。本稿では,そのような分散シフトが存在する場合に,ロバストなセグメンテーションを確保するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2021-08-01T08:56:24Z)
Learning to Track Instances without Video Annotations [85.9865889886669]
本稿では,ラベル付き画像データセットとラベルなしビデオシーケンスのみを用いたインスタンス追跡ネットワークを学習する,新しい半教師付きフレームワークを提案する。画像のみを訓練しても,学習した特徴表現は出現の変動にロバストであることが判明した。さらに、このモジュールを単一ステージのインスタンスセグメンテーションとポーズ推定フレームワークに統合します。
論文参考訳（メタデータ） (2021-04-01T06:47:41Z)
Deep Semi-supervised Knowledge Distillation for Overlapping Cervical Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文参考訳（メタデータ） (2020-07-21T13:27:09Z)
UniT: Unified Knowledge Transfer for Any-shot Object Detection and Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文参考訳（メタデータ） (2020-06-12T22:45:47Z)
One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文参考訳（メタデータ） (2020-05-08T01:59:23Z)
Efficient Deep Representation Learning by Adaptive Latent Space Sampling [16.320898678521843]
監視されたディープラーニングには、アノテーションを備えた大量のトレーニングサンプルが必要です。本稿では,学習プロセスに供給される情報サンプルを適応的に選択する新しいトレーニングフレームワークを提案する。
論文参考訳（メタデータ） (2020-03-19T22:17:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。