論文の概要: ProKAN: Progressive Stacking of Kolmogorov-Arnold Networks for Efficient Liver Segmentation
- arxiv url: http://arxiv.org/abs/2412.19713v1
- Date: Fri, 27 Dec 2024 16:14:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:27:23.502845
- Title: ProKAN: Progressive Stacking of Kolmogorov-Arnold Networks for Efficient Liver Segmentation
- Title(参考訳): ProKAN: 効率的な肝切除のためのKolmogorov-Arnoldネットワークのプログレッシブ・スタック化
- Authors: Bhavesh Gyanchandani, Aditya Oza, Abhinav Roy,
- Abstract要約: proKAN は、これらの課題に対処するために設計された Kolmogorov-Arnold Networks (KAN) のプログレッシブなスタック手法である。
proKANは、過度に適合する振る舞いに基づいて、トレーニング中にkanブロックを徐々に追加することで、その複雑さを動的に調整する。
提案アーキテクチャは,肝セグメンテーションタスクにおける最先端性能,MLP(Multi-Layer Perceptrons)および固定kanアーキテクチャよりも優れた性能を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The growing need for accurate and efficient 3D identification of tumors, particularly in liver segmentation, has spurred considerable research into deep learning models. While many existing architectures offer strong performance, they often face challenges such as overfitting and excessive computational costs. An adjustable and flexible architecture that strikes a balance between time efficiency and model complexity remains an unmet requirement. In this paper, we introduce proKAN, a progressive stacking methodology for Kolmogorov-Arnold Networks (KANs) designed to address these challenges. Unlike traditional architectures, proKAN dynamically adjusts its complexity by progressively adding KAN blocks during training, based on overfitting behavior. This approach allows the network to stop growing when overfitting is detected, preventing unnecessary computational overhead while maintaining high accuracy. Additionally, proKAN utilizes KAN's learnable activation functions modeled through B-splines, which provide enhanced flexibility in learning complex relationships in 3D medical data. Our proposed architecture achieves state-of-the-art performance in liver segmentation tasks, outperforming standard Multi-Layer Perceptrons (MLPs) and fixed KAN architectures. The dynamic nature of proKAN ensures efficient training times and high accuracy without the risk of overfitting. Furthermore, proKAN provides better interpretability by allowing insight into the decision-making process through its learnable coefficients. The experimental results demonstrate a significant improvement in accuracy, Dice score, and time efficiency, making proKAN a compelling solution for 3D medical image segmentation tasks.
- Abstract(参考訳): 特に肝セグメンテーションにおける腫瘍の正確な3D識別の必要性が高まり、深層学習モデルの研究が盛んに進められている。
既存のアーキテクチャの多くは高いパフォーマンスを提供するが、過度な適合や過剰な計算コストといった課題に直面していることが多い。
時間効率とモデルの複雑さのバランスをとる、調整可能で柔軟なアーキテクチャは、まだ未完成の要件です。
本稿では,これらの課題に対処するために設計されたKAN(Kolmogorov-Arnold Networks)のプログレッシブ・スタックリング手法であるProKANを紹介する。
従来のアーキテクチャとは異なり、ProKANは過度に適合する振る舞いに基づいて、トレーニング中にkanブロックを徐々に追加することで、その複雑さを動的に調整する。
このアプローチにより、オーバーフィッティングを検出するとネットワークが成長しなくなり、高い精度を維持しながら不要な計算オーバーヘッドを防止できる。
さらに、ProKANはKanの学習可能なアクティベーション関数をBスプラインでモデル化し、3D医療データにおける複雑な関係の学習の柔軟性を向上させる。
提案アーキテクチャは,肝セグメンテーションタスクにおける最先端性能,MLP(Multi-Layer Perceptrons)および固定kanアーキテクチャよりも優れた性能を実現する。
ProKANのダイナミックな性質は、オーバーフィッティングのリスクを伴わずに、効率的なトレーニング時間と高い精度を保証する。
さらに、ProKANは、学習可能な係数を通じて意思決定プロセスに関する洞察を提供することで、より良い解釈可能性を提供します。
実験の結果,精度,Diceスコア,時間効率が有意に向上し,ProKANは3次元医用画像分割作業において魅力的なソリューションとなった。
関連論文リスト
- Exploring Kolmogorov-Arnold Networks for Interpretable Time Series Classification [0.17999333451993949]
Kolmogorov-Arnold Networks (KAN) は最先端モデルのより解釈可能な代替として提案されている。
本稿では,時系列分類のためのKANアーキテクチャの包括的かつ堅牢な探索を実現することを目的とする。
その結果,(1)効率の良いKANは,タスク分類タスクに適した性能を示し,性能と計算効率に優れていた。
論文 参考訳(メタデータ) (2024-11-22T13:01:36Z) - How Feature Learning Can Improve Neural Scaling Laws [86.9540615081759]
我々は,カーネル限界を超えたニューラルスケーリング法則の解法モデルを開発する。
モデルのサイズ、トレーニング時間、利用可能なデータの総量によるパフォーマンスのスケールアップ方法を示す。
論文 参考訳(メタデータ) (2024-09-26T14:05:32Z) - MambaClinix: Hierarchical Gated Convolution and Mamba-Based U-Net for Enhanced 3D Medical Image Segmentation [6.673169053236727]
医用画像分割のための新しいU字型アーキテクチャであるMambaClinixを提案する。
MambaClinixは、階層的なゲート畳み込みネットワークとMambaを適応的なステージワイドフレームワークに統合する。
以上の結果から,MambaClinixは低モデルの複雑さを維持しつつ高いセグメンテーション精度を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-09-19T07:51:14Z) - Faster Diffusion Action Segmentation [9.868244939496678]
時間的行動分類(TAS)はビデオ解析において不可欠な課題であり、連続したフレームを別のアクションセグメントに分割し分類することを目的としている。
拡散モデルの最近の進歩は、安定したトレーニングプロセスと高品質な生成能力により、TASタスクにおいて大きな成功を収めている。
本稿では,効率的かつ高性能なTASアルゴリズムであるEffiDiffActを提案する。
論文 参考訳(メタデータ) (2024-08-04T13:23:18Z) - Parameter-Efficient Fine-Tuning for Continual Learning: A Neural Tangent Kernel Perspective [125.00228936051657]
本稿では,タスク関連機能を適応的に生成しながら,タスク固有のパラメータ記憶を不要にする新しいフレームワークNTK-CLを紹介する。
最適化可能なパラメータを適切な正規化で微調整することにより、NTK-CLは確立されたPEFT-CLベンチマーク上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-07-24T09:30:04Z) - LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。
本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。
LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文 参考訳(メタデータ) (2024-07-13T16:09:45Z) - Leveraging Frequency Domain Learning in 3D Vessel Segmentation [50.54833091336862]
本研究では,Fourier領域学習を3次元階層分割モデルにおけるマルチスケール畳み込みカーネルの代用として活用する。
管状血管分割作業において,新しいネットワークは顕著なサイス性能(ASACA500が84.37%,ImageCASが80.32%)を示した。
論文 参考訳(メタデータ) (2024-01-11T19:07:58Z) - E2ENet: Dynamic Sparse Feature Fusion for Accurate and Efficient 3D Medical Image Segmentation [34.865695471451886]
E2ENet(Efficient to Efficient Network)と呼ばれる3次元医用画像分割モデルを提案する。
パラメトリックと計算効率の2つの設計が組み込まれている。
さまざまなリソース制約に対して、正確性と効率性のトレードオフを一貫して達成します。
論文 参考訳(メタデータ) (2023-12-07T22:13:37Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - UNETR++: Delving into Efficient and Accurate 3D Medical Image Segmentation [93.88170217725805]
本稿では,高画質なセグメンテーションマスクと,パラメータ,計算コスト,推論速度の両面での効率性を提供するUNETR++という3次元医用画像セグメンテーション手法を提案する。
我々の設計の核となるのは、空間的およびチャネル的な識別的特徴を効率的に学習する、新しい効率的な対注意ブロック(EPA)の導入である。
Synapse, BTCV, ACDC, BRaTs, Decathlon-Lungの5つのベンチマークで評価した結果, 効率と精度の両面で, コントリビューションの有効性が示された。
論文 参考訳(メタデータ) (2022-12-08T18:59:57Z) - Stronger, Faster and More Explainable: A Graph Convolutional Baseline
for Skeleton-based Action Recognition [22.90127409366107]
グラフ畳み込みネットワーク(GCN)に基づく効率的だが強力なベースラインを提案する。
畳み込みニューラルネットワーク(CNN)におけるResNetアーキテクチャの成功に触発されたResGCNモジュールがGCNで導入された。
PartAttブロックは、アクションシーケンス全体の上で最も重要な身体部分を発見するために提案される。
論文 参考訳(メタデータ) (2020-10-20T02:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。