Fugu-MT 論文翻訳(概要): Combining Self-attention and Dilation Convolutional for Semantic Segmentation of Coal Maceral Groups

論文の概要: Combining Self-attention and Dilation Convolutional for Semantic Segmentation of Coal Maceral Groups

arxiv url: http://arxiv.org/abs/2506.12712v1
Date: Sun, 15 Jun 2025 04:01:25 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-17 17:28:46.714256
Title: Combining Self-attention and Dilation Convolutional for Semantic Segmentation of Coal Maceral Groups
Title（参考訳）: 石炭マカラル群のセマンティックセグメンテーションにおける自己注意と拡張畳み込みの併用
Authors: Zhenghao Xi, Zhengnan Lv, Yang Zheng, Xiang Liu, Zhuang Yu, Junran Chen, Jing Hu, Yaqi Liu,
Abstract要約: 石炭母集団の既存のモデルでは、より高い精度を達成するためにパラメータを積み重ねる手法を用いている。我々は,IoTベースのDA-VIT並列ネットワークモデルを開発した。 DA-VITのDCSA機構は、石炭顕微鏡画像の局所的特徴情報を強化するために導入された。
参考スコア（独自算出の注目度）: 6.309752499322008
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The segmentation of coal maceral groups can be described as a semantic segmentation process of coal maceral group images, which is of great significance for studying the chemical properties of coal. Generally, existing semantic segmentation models of coal maceral groups use the method of stacking parameters to achieve higher accuracy. It leads to increased computational requirements and impacts model training efficiency. At the same time, due to the professionalism and diversity of coal maceral group images sampling, obtaining the number of samples for model training requires a long time and professional personnel operation. To address these issues, We have innovatively developed an IoT-based DA-VIT parallel network model. By utilizing this model, we can continuously broaden the dataset through IoT and achieving sustained improvement in the accuracy of coal maceral groups segmentation. Besides, we decouple the parallel network from the backbone network to ensure the normal using of the backbone network during model data updates. Secondly, DCSA mechanism of DA-VIT is introduced to enhance the local feature information of coal microscopic images. This DCSA can decompose the large kernels of convolutional attention into multiple scales and reduce 81.18% of parameters.Finally, we performed the contrast experiment and ablation experiment between DA-VIT and state-of-the-art methods at lots of evaluation metrics. Experimental results show that DA-VIT-Base achieves 92.14% pixel accuracy and 63.18% mIoU. Params and FLOPs of DA-VIT-Tiny are 4.95M and 8.99G, respectively. All of the evaluation metrics of the proposed DA-VIT are better than other state-of-the-art methods.
Abstract（参考訳）: 石炭母集団のセグメンテーションは,石炭母集団像のセグメンテーション過程として記述できるが,これは石炭の化学的性質を研究する上で非常に重要である。一般に、石炭母集団の既存のセマンティックセグメンテーションモデルは、より高い精度を達成するためにパラメータを積み重ねる手法を用いる。これにより、計算要求が増加し、モデルのトレーニング効率に影響を及ぼす。同時に、石炭マセラルグループの画像サンプリングの専門性と多様性のため、モデルトレーニング用サンプルの入手には長い時間と専門職の運用が必要である。これらの問題に対処するため、我々はIoTベースのDA-VIT並列ネットワークモデルを革新的に開発しました。このモデルを利用することで、IoTを通じてデータセットを継続的に拡張し、石炭マサールグループのセグメンテーションの精度を継続的に改善することができる。さらに、バックボーンネットワークから並列ネットワークを分離し、モデルデータ更新時のバックボーンネットワークの正常使用を保証する。次に、DA-VITのDCSA機構を導入し、石炭顕微鏡画像の局所的特徴情報を強化する。このDCSAは、畳み込み注意の大規模なカーネルを複数のスケールに分解し、パラメータの81.18%を削減し、DA-VITと最先端手法のコントラスト実験とアブレーション実験を、多くの評価指標で実施した。実験の結果、DA-VIT-Baseは92.14%の精度と63.18%のmIoUを達成した。 DA-VIT-TinyのパラムとFLOPはそれぞれ4.95Mと8.99Gである。提案したDA-VITの評価基準はすべて、他の最先端手法よりも優れている。

関連論文リスト

Multi Source COVID-19 Detection via Kernel-Density-based Slice Sampling [5.501560446935927]
4つの異なる医療センターから胸部CTスキャンを分類するMulti-Source COVID-19 Detection Challengeの解決策を提案する。我々の前処理パイプラインは肺領域抽出,品質管理,適応スライスサンプリングを組み合わせることで,スキャン毎に8つの代表スライスを選択する。
論文参考訳（メタデータ） (2025-07-02T10:27:59Z)
Taming Diffusion for Dataset Distillation with High Representativeness [49.3818035378669]
D3HRは、高い代表性を持つ蒸留データセットを生成する新しい拡散ベースのフレームワークである。我々の実験は、D3HRが異なるモデルアーキテクチャにわたって高い精度を達成できることを実証した。
論文参考訳（メタデータ） (2025-05-23T22:05:59Z)
Simple 2D Convolutional Neural Network-based Approach for COVID-19 Detection [8.215897530386343]
本研究では,肺CT画像解析におけるディープラーニング技術の利用について検討した。我々は,CTスキャンに適した高度な空間スライス特徴学習(SSFL++)フレームワークを提案する。本研究の目的は,CTスキャン全体のアウト・オブ・ディストリビューション(OOD)データをフィルタリングし,データ冗長性を70%削減して解析に不可欠な空間スライス特徴を選択することである。
論文参考訳（メタデータ） (2024-03-17T14:34:51Z)
Individual mapping of large polymorphic shrubs in high mountains using satellite images and deep learning [1.6889377382676625]
我々は、自由に利用可能な衛星画像について、個々の低木デラインの大規模なデータセットをリリースする。我々は、すべてのジュニパーを、全生物圏保護区のツリーライン上にマッピングするために、インスタンスセグメンテーションモデルを使用します。我々のモデルは、PIデータで87.87%、FWデータで76.86%の低木でF1スコアを達成した。
論文参考訳（メタデータ） (2024-01-31T16:44:20Z)
Generating Images of the M87* Black Hole Using GANs [1.0532948482859532]
本研究では,様々なブラックホール画像を生成するためにCPGAN(Con Conditional Progressive Generative Adversarial Networks)を導入する。 GANは、ブラックホール画像生成のためのコスト効率の良いモデルとして利用でき、他のパラメータ化アルゴリズムのためのトレーニングデータセットを確実に増強することができる。
論文参考訳（メタデータ） (2023-12-02T02:47:34Z)
Learning Energy-Based Models by Cooperative Diffusion Recovery Likelihood [64.95663299945171]
高次元データに基づくエネルギーベースモデル(EBM)の訓練は、困難かつ時間を要する可能性がある。 EBMと、GANや拡散モデルのような他の生成フレームワークとの間には、サンプル品質に顕著なギャップがある。本研究では,協調拡散回復可能性 (CDRL) を提案する。
論文参考訳（メタデータ） (2023-09-10T22:05:24Z)
Interpolation-Split: a data-centric deep learning approach with big interpolated data to boost airway segmentation performance [6.015272528297327]
気道のセグメンテーションは気道全体の輪郭を作るのに重要な役割を担っています本研究では,気道木を分割するデータ中心の深層学習手法を提案する。
論文参考訳（メタデータ） (2023-07-29T14:51:56Z)
Distill Gold from Massive Ores: Bi-level Data Pruning towards Efficient Dataset Distillation [96.92250565207017]
本研究では,データセット蒸留作業におけるデータ効率と選択について検討する。蒸留の力学を再現することにより、実際のデータセットに固有の冗長性についての洞察を提供する。蒸留における因果関係から最も寄与した試料を見出した。
論文参考訳（メタデータ） (2023-05-28T06:53:41Z)
Learning Better with Less: Effective Augmentation for Sample-Efficient Visual Reinforcement Learning [57.83232242068982]
データ拡張(DA)は、ビジュアル強化学習(RL)アルゴリズムのサンプル効率を高める重要な手法である。サンプル効率のよい視覚的RLを実現する上で, DAのどの属性が有効かは明らかになっていない。本研究は,DAの属性が有効性に与える影響を評価するための総合的な実験を行う。
論文参考訳（メタデータ） (2023-05-25T15:46:20Z)
Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文参考訳（メタデータ） (2023-04-04T17:54:32Z)
CEKD:Cross Ensemble Knowledge Distillation for Augmented Fine-grained Data [7.012047150376948]
提案モデルはエンドツーエンドでトレーニング可能であり,イメージレベルのラベル管理のみを必要とする。 ResNet-101のバックボーンにより、CEKDは3つのデータセットでそれぞれ89.59%、95.96%、94.56%の精度を得る。
論文参考訳（メタデータ） (2022-03-13T02:57:25Z)
A Multi-Stage Attentive Transfer Learning Framework for Improving COVID-19 Diagnosis [49.3704402041314]
新型コロナの診断を改善するための多段階集中移動学習フレームワークを提案する。提案するフレームワークは、複数のソースタスクと異なるドメインのデータから知識を学習し、正確な診断モデルを訓練する3つの段階からなる。本稿では,肺CT画像のマルチスケール表現を学習するための自己教師付き学習手法を提案する。
論文参考訳（メタデータ） (2021-01-14T01:39:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。