論文の概要: DE-KAN: A Kolmogorov Arnold Network with Dual Encoder for accurate 2D Teeth Segmentation
- arxiv url: http://arxiv.org/abs/2511.18533v1
- Date: Sun, 23 Nov 2025 16:56:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.886048
- Title: DE-KAN: A Kolmogorov Arnold Network with Dual Encoder for accurate 2D Teeth Segmentation
- Title(参考訳): DE-KAN: 正確な2次元歯分割のためのデュアルエンコーダ付きコルモゴロフアーノルドネットワーク
- Authors: Md Mizanur Rahman Mustakim, Jianwu Li, Sumya Bhuiyan, Mohammad Mehedi Hasan, Bing Han,
- Abstract要約: 本稿では,特徴表現とセグメンテーション精度を向上させる新しいDual Kolmogorov Arnold Networkを提案する。
このフレームワークは、拡張入力にResNet-18エンコーダ、オリジナル入力にカスタマイズされたCNNエンコーダを使用しており、グローバルおよびローカルな空間特徴を補完的に抽出することができる。
2つのベンチマーク歯科用X線データセットの実験により、DE-KANは最先端のセグメンテーションモデルより優れていることが示された。
- 参考スコア(独自算出の注目度): 6.540491857899706
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate segmentation of individual teeth from panoramic radiographs remains a challenging task due to anatomical variations, irregular tooth shapes, and overlapping structures. These complexities often limit the performance of conventional deep learning models. To address this, we propose DE-KAN, a novel Dual Encoder Kolmogorov Arnold Network, which enhances feature representation and segmentation precision. The framework employs a ResNet-18 encoder for augmented inputs and a customized CNN encoder for original inputs, enabling the complementary extraction of global and local spatial features. These features are fused through KAN-based bottleneck layers, incorporating nonlinear learnable activation functions derived from the Kolmogorov Arnold representation theorem to improve learning capacity and interpretability. Extensive experiments on two benchmark dental X-ray datasets demonstrate that DE-KAN outperforms state-of-the-art segmentation models, achieving mIoU of 94.5%, Dice coefficient of 97.1%, accuracy of 98.91%, and recall of 97.36%, representing up to +4.7% improvement in Dice compared to existing methods.
- Abstract(参考訳): パノラマ線写真からの個々の歯の正確なセグメンテーションは、解剖学的変異、不規則な歯形、重なり合う構造のために難しい課題である。
これらの複雑さは、しばしば従来のディープラーニングモデルの性能を制限する。
そこで我々は,D-KANを提案する。D-KAN,Dual Encoder Kolmogorov Arnold Networkは特徴表現とセグメンテーションの精度を向上させる。
このフレームワークは、拡張入力にResNet-18エンコーダ、オリジナル入力にカスタマイズされたCNNエンコーダを使用しており、グローバルおよびローカルな空間特徴を補完的に抽出することができる。
これらの特徴はkanベースのボトルネック層を通じて融合され、コルモゴロフ・アーノルドの表現定理から導かれる非線形学習可能なアクティベーション関数を取り入れて学習能力と解釈可能性を向上させる。
2つのベンチマーク歯科用X線データセットの大規模な実験により、D-KANは最先端のセグメンテーションモデルより優れており、94.5%のmIoU、97.1%のDice係数、98.91%の精度、97.36%のリコールを達成している。
関連論文リスト
- Kolmogorov-Arnold Network for Remote Sensing Image Semantic Segmentation [8.891804836416275]
本稿では,DeepKANSegという新しいセマンティックセグメンテーションネットワークを提案する。
まず,kanをベースとしたDeep機能改善モジュール,すなわちDeepKANを紹介する。
第2に、グローバルローカル複合デコーダにおける従来の多層パーセプトロン(MLP)層をKANベースの線形層、すなわちGLKANに置き換える。
論文 参考訳(メタデータ) (2025-01-13T15:06:51Z) - DPE-Net: Dual-Parallel Encoder Based Network for Semantic Segmentation of Polyps [0.0]
医用画像では大腸ポリープの効率的な分画は大腸癌に対する最小侵襲のソリューションにおいて重要な役割を担っている。
本研究では,ポリプセグメンテーションのためのネットワーク内の2つの並列エンコーダ分岐を用いた新しいアプローチを提案する。
エンコーダの1つのブランチには、2つの畳み込みブロックが組み込まれている。
他のブロックは、前のレイヤの機能の追加で単一の畳み込みブロックを受け入れ、エンコーダ内での機能抽出の多様性を提供する。
論文 参考訳(メタデータ) (2024-12-01T16:56:03Z) - An Effective UNet Using Feature Interaction and Fusion for Organ Segmentation in Medical Image [5.510679875888542]
3つのプラグ・アンド・プレイモジュールを含む,新しいU字型モデルを提案する。
チャネル空間相互作用モジュールを導入し、エンコーダとデコーダの段間相互作用をモデル化することにより、スキップ接続特性の品質を向上させる。
チャネルアテンションに基づくモジュールをデコーダブロックに組み込んで、重要な特徴の表現を強化するとともに、無関係な特徴の表現を抑える。
マルチレベル融合モジュールは、マルチスケールデコーダの特徴を集約し、最終的な予測における空間的詳細と一貫性を改善するように設計されている。
論文 参考訳(メタデータ) (2024-09-09T04:34:47Z) - Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.66644395272075]
本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T19:13:15Z) - U-KAN Makes Strong Backbone for Medical Image Segmentation and Generation [48.40120035775506]
Kolmogorov-Arnold Networks (KAN)は、非線形学習可能なアクティベーション関数のスタックを通じてニューラルネットワーク学習を再構築する。
トークン化中間表現であるU-KAN上に専用kan層を統合することにより,確立したU-Netパイプラインを検証,修正,再設計する。
さらに、拡散モデルにおける代替U-Netノイズ予測器としてのU-KANの可能性を探り、タスク指向モデルアーキテクチャの生成にその適用性を実証した。
論文 参考訳(メタデータ) (2024-06-05T04:13:03Z) - LHU-Net: a Lean Hybrid U-Net for Cost-efficient, High-performance Volumetric Segmentation [4.168081528698768]
ボリューム医療画像分割のためのリーンハイブリッドU-NetであるLHU-Netを提案する。
LHU-Netは、チャンネルの特徴を洗練する前に空間的特徴抽出を優先し、効率と精度の両方を最適化する。
Synapse、Left Atrial、BraTS-Decathlon、Lung-Decathlonの4つのベンチマークデータセットによる評価
論文 参考訳(メタデータ) (2024-04-07T22:58:18Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - Unite-Divide-Unite: Joint Boosting Trunk and Structure for High-accuracy
Dichotomous Image Segmentation [48.995367430746086]
Dichotomous Image rendering (DIS) は、自然の風景からカテゴリーに依存しない前景の物体をピンポイントすることを目的としている。
本稿では, トランクと構造同定の有効性を高めるために, 相補的特徴を再構成し, 分割的に配置する, UDUN (Unite-Divide-Unite Network) を提案する。
1024*1024入力を用いて、ResNet-18で65.3fpsのリアルタイム推論を可能にする。
論文 参考訳(メタデータ) (2023-07-26T09:04:35Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - Deep ensembles based on Stochastic Activation Selection for Polyp
Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。
イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。
我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文 参考訳(メタデータ) (2021-04-02T02:07:37Z) - SAR-U-Net: squeeze-and-excitation block and atrous spatial pyramid
pooling based residual U-Net for automatic liver CT segmentation [3.192503074844775]
Squeeze-and-Excitation(SE)ブロック,Atrous Space Pyramid Pooling(ASPP),Resternal Learningといったテクニックを活用した,U-Netベースのフレームワークが提案されている。
提案手法の有効性を2つの公開データセットLiTS17とSLiver07で検証した。
論文 参考訳(メタデータ) (2021-03-11T02:32:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。