論文の概要: DMSA: Dynamic Multi-scale Unsupervised Semantic Segmentation Based on
Adaptive Affinity
- arxiv url: http://arxiv.org/abs/2303.00199v1
- Date: Wed, 1 Mar 2023 03:08:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-02 16:10:41.912930
- Title: DMSA: Dynamic Multi-scale Unsupervised Semantic Segmentation Based on
Adaptive Affinity
- Title(参考訳): dmsa:適応親和性に基づく動的マルチスケール非教師なし意味セグメンテーション
- Authors: Kun Yang, Jun Lu
- Abstract要約: このフレームワークは、Atrous Spatial Pyramid Pooling (ASPP)モジュールを使用して特徴抽出を強化する。
Pixel-Adaptive Refinement (PAR)モジュールが導入され、初期擬似ラベルを適応的に洗練することができる。
実験の結果,提案するDSMAフレームワークは,サリエンシデータセット上の既存の手法よりも優れていることがわかった。
- 参考スコア(独自算出の注目度): 11.080515677051455
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The proposed method in this paper proposes an end-to-end unsupervised
semantic segmentation architecture DMSA based on four loss functions. The
framework uses Atrous Spatial Pyramid Pooling (ASPP) module to enhance feature
extraction. At the same time, a dynamic dilation strategy is designed to better
capture multi-scale context information. Secondly, a Pixel-Adaptive Refinement
(PAR) module is introduced, which can adaptively refine the initial pseudo
labels after feature fusion to obtain high quality pseudo labels. Experiments
show that the proposed DSMA framework is superior to the existing methods on
the saliency dataset. On the COCO 80 dataset, the MIoU is improved by 2.0, and
the accuracy is improved by 5.39. On the Pascal VOC 2012 Augmented dataset, the
MIoU is improved by 4.9, and the accuracy is improved by 3.4. In addition, the
convergence speed of the model is also greatly improved after the introduction
of the PAR module.
- Abstract(参考訳): 本稿では、4つの損失関数に基づくエンドツーエンドの教師なしセマンティックセマンティクスアーキテクチャDMSAを提案する。
このフレームワークは、Atrous Spatial Pyramid Pooling (ASPP)モジュールを使用して特徴抽出を強化する。
同時に、動的拡張戦略は、マルチスケールなコンテキスト情報をよりよく捉えるように設計されている。
次に,機能融合後の初期擬似ラベルを適応的に洗練し,高品質な擬似ラベルを得る,ピクセル適応改良(par)モジュールを導入する。
実験の結果,提案するDSMAフレームワークは,サリエンシデータセット上の既存の手法よりも優れていることがわかった。
COCO 80データセットでは、MIoUは2.0改善され、精度は5.39向上した。
Pascal VOC 2012 Augmentedデータセットでは、MIoUは4.9改善され、精度は3.4向上した。
さらに、parモジュールの導入後、モデルの収束速度も大幅に向上した。
関連論文リスト
- Structure-Based Molecule Optimization via Gradient-Guided Bayesian Update [16.743187639189976]
構造に基づく分子最適化(SBMO)は、タンパク質標的に対して連続座標と離散型の両方で分子を最適化することを目的としている。
MolJOは、様々なモードのジョイントガイダンス信号を容易にする最初の勾配ベースのSBMOフレームワークである。
MolJOはCrossDocked 2020ベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2024-11-20T12:48:29Z) - SZU-AFS Antispoofing System for the ASVspoof 5 Challenge [3.713577625357432]
SZU-AFSアンチスプーフィングシステムはオープン条件下でASVspoof 5 Challengeのトラック1のために設計された。
最終融合システムは、評価セットで0.115のminDCFと4.04%のEERを達成する。
論文 参考訳(メタデータ) (2024-08-19T12:12:29Z) - Binarized Diffusion Model for Image Super-Resolution [61.963833405167875]
超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する
既存の二項化法では性能が著しく低下する。
画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文 参考訳(メタデータ) (2024-06-09T10:30:25Z) - PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.24854366973794]
ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文 参考訳(メタデータ) (2023-10-18T02:59:57Z) - Multi-body SE(3) Equivariance for Unsupervised Rigid Segmentation and
Motion Estimation [49.56131393810713]
本稿では、SE(3)同変アーキテクチャと、この課題に教師なしで取り組むためのトレーニング戦略を提案する。
本手法は,0.25Mパラメータと0.92G FLOPを用いて,モデル性能と計算効率を両立させる。
論文 参考訳(メタデータ) (2023-06-08T22:55:32Z) - Self Correspondence Distillation for End-to-End Weakly-Supervised
Semantic Segmentation [13.623713806739271]
本稿では, 外部監視を導入することなく, 擬似ラベルを精製するための新しい自己対応蒸留法を提案する。
さらに,擬似ラベルの局所的一貫性を高めるために,変分対応リファインモジュールを設計する。
我々の手法は、他の最先端手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2023-02-27T13:46:40Z) - Squeezeformer: An Efficient Transformer for Automatic Speech Recognition [99.349598600887]
Conformerは、そのハイブリッドアテンション・コンボリューションアーキテクチャに基づいて、様々な下流音声タスクの事実上のバックボーンモデルである。
Squeezeformerモデルを提案する。これは、同じトレーニングスキームの下で、最先端のASRモデルよりも一貫して優れている。
論文 参考訳(メタデータ) (2022-06-02T06:06:29Z) - Deep Co-supervision and Attention Fusion Strategy for Automatic COVID-19
Lung Infection Segmentation on CT Images [1.898617934078969]
本稿では,CT画像上でのCOVID-19感染に対する新たなセグメンテーション手法を提案する。
エッジとセマンティクスの特徴をネットワークで学習する上での深い協調管理手法を提案する。
提案手法の有効性は, 新型コロナウイルスの4つのCTデータセットで実証された。
論文 参考訳(メタデータ) (2021-12-20T07:32:39Z) - PAENet: A Progressive Attention-Enhanced Network for 3D to 2D Retinal
Vessel Segmentation [0.0]
光コヒーレンス・トモグラフィー(OCTA)画像では3次元から2次元の網膜血管セグメンテーションは難しい問題である。
本稿では,多機能表現を抽出するアテンション機構に基づくプログレッシブ・アテンション・エンハンスメント・ネットワーク(PAENet)を提案する。
提案アルゴリズムは,従来の手法と比較して最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-26T10:27:25Z) - Polyp-PVT: Polyp Segmentation with Pyramid Vision Transformers [124.01928050651466]
本稿では,Polyp-PVTと呼ばれる新しいタイプのPolypセグメンテーション手法を提案する。
提案モデルであるPolyp-PVTは,特徴の雑音を効果的に抑制し,その表現能力を大幅に向上させる。
論文 参考訳(メタデータ) (2021-08-16T07:09:06Z) - Inception Convolution with Efficient Dilation Search [121.41030859447487]
拡散畳み込みは、効果的な受容場を制御し、オブジェクトの大規模な分散を処理するための標準的な畳み込みニューラルネットワークの重要な変異体である。
そこで我々は,異なる軸,チャネル,層間の独立な拡散を有する拡張畳み込みの新たな変異体,すなわち開始(拡張)畳み込みを提案する。
本稿では,データに複雑なインセプション・コンボリューションを適合させる実用的な手法を探索し,統計的最適化に基づく簡易かつ効果的な拡張探索アルゴリズム(EDO)を開発した。
論文 参考訳(メタデータ) (2020-12-25T14:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。