論文の概要: OSTA: One-shot Task-adaptive Channel Selection for Semantic Segmentation
of Multichannel Images
- arxiv url: http://arxiv.org/abs/2305.04766v1
- Date: Mon, 8 May 2023 15:15:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 14:00:48.623797
- Title: OSTA: One-shot Task-adaptive Channel Selection for Semantic Segmentation
of Multichannel Images
- Title(参考訳): OSTA:マルチチャネル画像のセマンティックセグメンテーションのためのワンショットタスク適応チャネル選択
- Authors: Yuanzhi Cai, Jagannath Aryal, Yuan Fang, Hong Huang, Lei Fan
- Abstract要約: スーパーネットからのプルーニングの概念は、チャネルの組み合わせの選択とセマンティックセグメンテーションネットワークのトレーニングを統合するために初めて用いられる。
OSTAには、スーパーネットトレーニングステージ、プルーニングステージ、微調整ステージの3つのステージがある。
予測可能かつ比較的効率的な時間枠内で達成可能であり、セグメンテーションネットワークのトレーニングに要する時間の101.71%から298.1%までである。
- 参考スコア(独自算出の注目度): 13.982857189404216
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic segmentation of multichannel images is a fundamental task for many
applications. Selecting an appropriate channel combination from the original
multichannel image can improve the accuracy of semantic segmentation and reduce
the cost of data storage, processing and future acquisition. Existing channel
selection methods typically use a reasonable selection procedure to determine a
desirable channel combination, and then train a semantic segmentation network
using that combination. In this study, the concept of pruning from a supernet
is used for the first time to integrate the selection of channel combination
and the training of a semantic segmentation network. Based on this concept, a
One-Shot Task-Adaptive (OSTA) channel selection method is proposed for the
semantic segmentation of multichannel images. OSTA has three stages, namely the
supernet training stage, the pruning stage and the fine-tuning stage. The
outcomes of six groups of experiments (L7Irish3C, L7Irish2C, L8Biome3C,
L8Biome2C, RIT-18 and Semantic3D) demonstrated the effectiveness and efficiency
of OSTA. OSTA achieved the highest segmentation accuracies in all tests (62.49%
(mIoU), 75.40% (mIoU), 68.38% (mIoU), 87.63% (mIoU), 66.53% (mA) and 70.86%
(mIoU), respectively). It even exceeded the highest accuracies of exhaustive
tests (61.54% (mIoU), 74.91% (mIoU), 67.94% (mIoU), 87.32% (mIoU), 65.32% (mA)
and 70.27% (mIoU), respectively), where all possible channel combinations were
tested. All of this can be accomplished within a predictable and relatively
efficient timeframe, ranging from 101.71% to 298.1% times the time required to
train the segmentation network alone. In addition, there were interesting
findings that were deemed valuable for several fields.
- Abstract(参考訳): マルチチャネル画像のセマンティクスセグメンテーションは、多くのアプリケーションにとって基本的なタスクである。
元のマルチチャネル画像から適切なチャネルの組み合わせを選択することで、セマンティックセグメンテーションの精度が向上し、データストレージ、処理、将来の取得コストが削減される。
既存のチャネル選択法は通常、適切な選択手順を使用して望ましいチャネルの組み合わせを決定し、その組み合わせを使用してセマンティックセグメンテーションネットワークを訓練する。
本研究では,スーパーネットからプルーニング(pruning)という概念を初めて利用し,チャネルの組み合わせの選択とセマンティックセグメンテーションネットワークのトレーニングを統合する。
この概念に基づいて,マルチチャネル画像のセマンティックセグメンテーションのために,ワンショットタスク適応(OSTA)チャネル選択法を提案する。
OSTAには、スーパーネットトレーニングステージ、プルーニングステージ、微調整ステージの3つのステージがある。
6つの実験群(L7Irish3C,L7Irish2C,L8Biome3C,L8Biome2C,RIT-18,Semantic3D)の結果,OSTAの有効性と有効性を示した。
OSTAは全試験で62.49%(mIoU)、75.40%(mIoU)、68.38%(mIoU)、87.63%(mIoU)、66.53%(mA)、70.86%(mIoU)の最高セグメンテーション精度を達成した。
さらに61.54%(mIoU)、74.91%(mIoU)、67.94%(mIoU)、87.32%(mIoU)、65.32%(mA)、70.27%(mIoU)を超えた。
これら全ては予測可能かつ比較的効率的な時間枠内で達成でき、セグメンテーションネットワークをトレーニングするために必要な101.71%から298.1%の時間である。
加えて、いくつかの分野で価値のある興味深い発見があった。
関連論文リスト
- Multimodal Chaptering for Long-Form TV Newscast Video [0.0]
本手法は、凍結ニューラルネットワークと訓練されたLSTMネットワークを含む2段階のプロセスを通して、オーディオと視覚の両方を統合している。
提案手法は,フランスのテレビ放送局TF1から平均41分間の映像を500本以上収録した多種多様なデータセットを用いて評価した。
実験結果から, このイノベーティブ・フュージョン・ストラテジーは技術性能の状態を達成し, 90%のIoUでは82%の精度で高い精度が得られることがわかった。
論文 参考訳(メタデータ) (2024-03-20T08:39:41Z) - Collaborative Learning for Annotation-Efficient Volumetric MR Image
Segmentation [5.462792626065119]
本研究の目的は,各3次元訓練MR画像に対して,1つの2次元スライスラベルのみをスパースアノテーションとして探索する深層学習手法を構築することである。
半教師型・自己教師型学習スキームの強みを統合した協調学習法を開発した。
提案手法はセグメンテーション精度を大幅に向上させ, 前立腺セグメンテーションでは平均B-IoUを10.0%以上増加させた。
論文 参考訳(メタデータ) (2023-12-18T07:02:37Z) - 3rd Place Solution for PVUW2023 VSS Track: A Large Model for Semantic
Segmentation on VSPW [68.56017675820897]
本稿では,PVUW2023 VSSトラックの3位解について紹介する。
ビデオセマンティックセグメンテーションの課題を解決するために,様々な画像レベルの視覚的バックボーンとセグメンテーションヘッドを探索した。
論文 参考訳(メタデータ) (2023-06-04T07:50:38Z) - Prompt Tuning for Parameter-efficient Medical Image Segmentation [79.09285179181225]
2つの医用画像データセットのセマンティックセグメンテーションにパラメータ効率が良いが効果的な適応を実現するために,いくつかのコントリビューションを提案し,検討する。
我々はこのアーキテクチャを、オンライン生成プロトタイプへの割り当てに基づく専用密集型セルフスーパービジョンスキームで事前訓練する。
得られたニューラルネットワークモデルにより、完全に微調整されたモデルとパラメータに適応したモデルとのギャップを緩和できることを実証する。
論文 参考訳(メタデータ) (2022-11-16T21:55:05Z) - Scalable Classifier-Agnostic Channel Selection for MTSC [7.94957965474334]
現在の時系列分類アルゴリズムは、訓練と予測を完了するのに数百時間の計算時間を必要とする。
チャネル選択のための2つの方法を提案し,評価する。
チャネル選択は、最先端のMTSCアルゴリズムをトレーニングする前に前処理ステップとして適用される。
論文 参考訳(メタデータ) (2022-06-18T19:57:46Z) - Osteoporosis Prescreening using Panoramic Radiographs through a Deep
Convolutional Neural Network with Attention Mechanism [65.70943212672023]
注意モジュールを持つディープ畳み込みニューラルネットワーク(CNN)はパノラマX線写真上で骨粗しょう症を検出することができる。
49歳から60歳までの70種類のパノラマX線写真(PR)のデータセットを用いて検討した。
論文 参考訳(メタデータ) (2021-10-19T00:03:57Z) - CSC-Unet: A Novel Convolutional Sparse Coding Strategy Based Neural
Network for Semantic Segmentation [0.44289311505645573]
本稿では,一般的な畳み込み操作を多層畳み込み符号化ブロックに書き換える新しい戦略を提案する。
多層畳み込みスパース符号化ブロックは,セマンティックセグメンテーションモデルをより高速に収束させ,画像のより微細なセマンティックおよび外観情報を抽出し,空間的詳細情報を復元する能力を向上させることができることを示す。
論文 参考訳(メタデータ) (2021-08-01T09:16:31Z) - Channel-wise Knowledge Distillation for Dense Prediction [73.99057249472735]
本稿では,学生ネットワークと教師ネットワークのチャンネルワイズ機能について提案する。
様々なネットワーク構造を持つ3つのベンチマークにおいて、一貫して優れた性能を実現している。
論文 参考訳(メタデータ) (2020-11-26T12:00:38Z) - Attentive CutMix: An Enhanced Data Augmentation Approach for Deep
Learning Based Image Classification [58.20132466198622]
そこで我々は,CutMixに基づく自然拡張拡張戦略であるAttentive CutMixを提案する。
各トレーニングイテレーションにおいて、特徴抽出器から中間注意マップに基づいて最も記述性の高い領域を選択する。
提案手法は単純かつ有効であり,実装が容易であり,ベースラインを大幅に向上させることができる。
論文 参考訳(メタデータ) (2020-03-29T15:01:05Z) - Channel Interaction Networks for Fine-Grained Image Categorization [61.095320862647476]
微妙なクラス間差のため、きめ細かい画像分類は困難である。
本稿では,チャネル・インタラクション・ネットワーク(CIN)を提案する。
我々のモデルは、多段階のトレーニングやテストを必要とせずに、エンドツーエンドで効率的にトレーニングすることができる。
論文 参考訳(メタデータ) (2020-03-11T11:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。