論文の概要: Combining Self-attention and Dilation Convolutional for Semantic Segmentation of Coal Maceral Groups
- arxiv url: http://arxiv.org/abs/2506.12712v1
- Date: Sun, 15 Jun 2025 04:01:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 17:28:46.714256
- Title: Combining Self-attention and Dilation Convolutional for Semantic Segmentation of Coal Maceral Groups
- Title(参考訳): 石炭マカラル群のセマンティックセグメンテーションにおける自己注意と拡張畳み込みの併用
- Authors: Zhenghao Xi, Zhengnan Lv, Yang Zheng, Xiang Liu, Zhuang Yu, Junran Chen, Jing Hu, Yaqi Liu,
- Abstract要約: 石炭母集団の既存のモデルでは、より高い精度を達成するためにパラメータを積み重ねる手法を用いている。
我々は,IoTベースのDA-VIT並列ネットワークモデルを開発した。
DA-VITのDCSA機構は、石炭顕微鏡画像の局所的特徴情報を強化するために導入された。
- 参考スコア(独自算出の注目度): 6.309752499322008
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The segmentation of coal maceral groups can be described as a semantic segmentation process of coal maceral group images, which is of great significance for studying the chemical properties of coal. Generally, existing semantic segmentation models of coal maceral groups use the method of stacking parameters to achieve higher accuracy. It leads to increased computational requirements and impacts model training efficiency. At the same time, due to the professionalism and diversity of coal maceral group images sampling, obtaining the number of samples for model training requires a long time and professional personnel operation. To address these issues, We have innovatively developed an IoT-based DA-VIT parallel network model. By utilizing this model, we can continuously broaden the dataset through IoT and achieving sustained improvement in the accuracy of coal maceral groups segmentation. Besides, we decouple the parallel network from the backbone network to ensure the normal using of the backbone network during model data updates. Secondly, DCSA mechanism of DA-VIT is introduced to enhance the local feature information of coal microscopic images. This DCSA can decompose the large kernels of convolutional attention into multiple scales and reduce 81.18% of parameters.Finally, we performed the contrast experiment and ablation experiment between DA-VIT and state-of-the-art methods at lots of evaluation metrics. Experimental results show that DA-VIT-Base achieves 92.14% pixel accuracy and 63.18% mIoU. Params and FLOPs of DA-VIT-Tiny are 4.95M and 8.99G, respectively. All of the evaluation metrics of the proposed DA-VIT are better than other state-of-the-art methods.
- Abstract(参考訳): 石炭母集団のセグメンテーションは,石炭母集団像のセグメンテーション過程として記述できるが,これは石炭の化学的性質を研究する上で非常に重要である。
一般に、石炭母集団の既存のセマンティックセグメンテーションモデルは、より高い精度を達成するためにパラメータを積み重ねる手法を用いる。
これにより、計算要求が増加し、モデルのトレーニング効率に影響を及ぼす。
同時に、石炭マセラルグループの画像サンプリングの専門性と多様性のため、モデルトレーニング用サンプルの入手には長い時間と専門職の運用が必要である。
これらの問題に対処するため、我々はIoTベースのDA-VIT並列ネットワークモデルを革新的に開発しました。
このモデルを利用することで、IoTを通じてデータセットを継続的に拡張し、石炭マサールグループのセグメンテーションの精度を継続的に改善することができる。
さらに、バックボーンネットワークから並列ネットワークを分離し、モデルデータ更新時のバックボーンネットワークの正常使用を保証する。
次に、DA-VITのDCSA機構を導入し、石炭顕微鏡画像の局所的特徴情報を強化する。
このDCSAは、畳み込み注意の大規模なカーネルを複数のスケールに分解し、パラメータの81.18%を削減し、DA-VITと最先端手法のコントラスト実験とアブレーション実験を、多くの評価指標で実施した。
実験の結果、DA-VIT-Baseは92.14%の精度と63.18%のmIoUを達成した。
DA-VIT-TinyのパラムとFLOPはそれぞれ4.95Mと8.99Gである。
提案したDA-VITの評価基準はすべて、他の最先端手法よりも優れている。
関連論文リスト
- Simple 2D Convolutional Neural Network-based Approach for COVID-19 Detection [8.215897530386343]
本研究では,肺CT画像解析におけるディープラーニング技術の利用について検討した。
我々は,CTスキャンに適した高度な空間スライス特徴学習(SSFL++)フレームワークを提案する。
本研究の目的は,CTスキャン全体のアウト・オブ・ディストリビューション(OOD)データをフィルタリングし,データ冗長性を70%削減して解析に不可欠な空間スライス特徴を選択することである。
論文 参考訳(メタデータ) (2024-03-17T14:34:51Z) - Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning [1.6889377382676625]
我々は、自由に利用可能な衛星画像について、個々の低木デラインの大規模なデータセットをリリースする。
我々は、すべてのジュニパーを、全生物圏保護区のツリーライン上にマッピングするために、インスタンスセグメンテーションモデルを使用します。
我々のモデルは、PIデータで87.87%、FWデータで76.86%の低木でF1スコアを達成した。
論文 参考訳(メタデータ) (2024-01-31T16:44:20Z) - Generating Images of the M87* Black Hole Using GANs [1.0532948482859532]
本研究では,様々なブラックホール画像を生成するためにCPGAN(Con Conditional Progressive Generative Adversarial Networks)を導入する。
GANは、ブラックホール画像生成のためのコスト効率の良いモデルとして利用でき、他のパラメータ化アルゴリズムのためのトレーニングデータセットを確実に増強することができる。
論文 参考訳(メタデータ) (2023-12-02T02:47:34Z) - Learning Energy-Based Models by Cooperative Diffusion Recovery Likelihood [64.95663299945171]
高次元データに基づくエネルギーベースモデル(EBM)の訓練は、困難かつ時間を要する可能性がある。
EBMと、GANや拡散モデルのような他の生成フレームワークとの間には、サンプル品質に顕著なギャップがある。
本研究では,協調拡散回復可能性 (CDRL) を提案する。
論文 参考訳(メタデータ) (2023-09-10T22:05:24Z) - Interpolation-Split: a data-centric deep learning approach with big interpolated data to boost airway segmentation performance [6.015272528297327]
気道のセグメンテーションは 気道全体の輪郭を作るのに 重要な役割を担っています
本研究では,気道木を分割するデータ中心の深層学習手法を提案する。
論文 参考訳(メタデータ) (2023-07-29T14:51:56Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - CEKD:Cross Ensemble Knowledge Distillation for Augmented Fine-grained
Data [7.012047150376948]
提案モデルはエンドツーエンドでトレーニング可能であり,イメージレベルのラベル管理のみを必要とする。
ResNet-101のバックボーンにより、CEKDは3つのデータセットでそれぞれ89.59%、95.96%、94.56%の精度を得る。
論文 参考訳(メタデータ) (2022-03-13T02:57:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。