論文の概要: DAS-SK: An Adaptive Model Integrating Dual Atrous Separable and Selective Kernel CNN for Agriculture Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2602.08168v1
- Date: Mon, 09 Feb 2026 00:14:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.008906
- Title: DAS-SK: An Adaptive Model Integrating Dual Atrous Separable and Selective Kernel CNN for Agriculture Semantic Segmentation
- Title(参考訳): 農業セマンティックセグメンテーションのためのDAS-SKと選択カーネルCNNを統合した適応モデル
- Authors: Mei Ling Chee, Thangarajah Akilan, Aparna Ravindra Phalke, Kanchan Keisham,
- Abstract要約: DAS-SKは、選択的なカーネル畳み込み(SK-Conv)をデュアルアラス分離型畳み込み(DAS-Conv)モジュールに再適合させる、新しい軽量アーキテクチャである。
DAS-SKは、CNNやトランスフォーマー、ハイブリッドベースの競合よりも効率的でありながら、最先端のパフォーマンスを一貫して達成している。
- 参考スコア(独自算出の注目度): 0.9204659134755793
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Semantic segmentation in high-resolution agricultural imagery demands models that strike a careful balance between accuracy and computational efficiency to enable deployment in practical systems. In this work, we propose DAS-SK, a novel lightweight architecture that retrofits selective kernel convolution (SK-Conv) into the dual atrous separable convolution (DAS-Conv) module to strengthen multi-scale feature learning. The model further enhances the atrous spatial pyramid pooling (ASPP) module, enabling the capture of fine-grained local structures alongside global contextual information. Built upon a modified DeepLabV3 framework with two complementary backbones - MobileNetV3-Large and EfficientNet-B3, the DAS-SK model mitigates limitations associated with large dataset requirements, limited spectral generalization, and the high computational cost that typically restricts deployment on UAVs and other edge devices. Comprehensive experiments across three benchmarks: LandCover.ai, VDD, and PhenoBench, demonstrate that DAS-SK consistently achieves state-of-the-art performance, while being more efficient than CNN-, transformer-, and hybrid-based competitors. Notably, DAS-SK requires up to 21x fewer parameters and 19x fewer GFLOPs than top-performing transformer models. These findings establish DAS-SK as a robust, efficient, and scalable solution for real-time agricultural robotics and high-resolution remote sensing, with strong potential for broader deployment in other vision domains.
- Abstract(参考訳): 高解像度農業画像におけるセマンティックセグメンテーションは、実用システムへの展開を可能にするために、精度と計算効率の注意深くバランスをとるモデルを要求する。
本研究では,選択的カーネル畳み込み(SK-Conv)を2つのアトラス分離型畳み込み(DAS-Conv)モジュールに適合させて,マルチスケールの特徴学習を強化する軽量アーキテクチャであるDAS-SKを提案する。
このモデルはさらに、アトラス空間ピラミッドプーリング(ASPP)モジュールを強化し、グローバルなコンテキスト情報と並行して、きめ細かい局所構造のキャプチャを可能にする。
MobileNetV3-LargeとEfficientNet-B3という2つの補完的なバックボーンを備えた、修正されたDeepLabV3フレームワークに基づいて構築されたDAS-SKモデルは、大規模なデータセット要求、スペクトルの一般化、UAVや他のエッジデバイスへのデプロイメントを制限する高い計算コストに関連する制限を緩和する。
LandCover.ai、VDD、PhenoBenchの3つのベンチマークによる総合的な実験は、DAS-SKが一貫して最先端のパフォーマンスを実現し、CNN-、Transformer-、ハイブリッドベースの競合よりも効率的であることを実証している。
特に、DAS-SKは最大21倍のパラメータと19倍のGFLOPを必要とする。
これらの結果から、DAS-SKはリアルタイム農業ロボットと高解像度リモートセンシングのための堅牢で効率的でスケーラブルなソリューションであり、他の視覚領域に広く展開する可能性が強い。
関連論文リスト
- Transolver-3: Scaling Up Transformer Solvers to Industrial-Scale Geometries [51.028432812178266]
Transolver-3は、高忠実度物理シミュレーションのために設計されたTransolverファミリーの新しいメンバーである。
Transolver-3は1億6000万以上のセルでメッシュを処理でき、3つの挑戦的なシミュレーションベンチマークで優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-02-04T16:52:44Z) - SC-Net: Robust Correspondence Learning via Spatial and Cross-Channel Context [19.20797236825297]
最近の研究は、共用学習のバックボーンとして畳み込みニューラルネットワーク(CNN)の使用に焦点を当てている。
本研究では,空間的・チャネル的両面的な文脈を効果的に統合するSC-Netというネットワークを提案する。
実験では、SC-Netは相対的なポーズ推定と外乱除去タスクにおいて最先端の手法より優れている。
論文 参考訳(メタデータ) (2025-12-29T13:56:10Z) - Adaptive Mesh-Quantization for Neural PDE Solvers [51.26961483962011]
グラフニューラルネットワークは複雑なジオメトリや境界条件に必要な不規則なメッシュを処理できるが、それでもすべてのノードで一様計算処理を適用できる。
適応メッシュ量子化(Adaptive Mesh Quantization): メッシュノード,エッジ,クラスタ特徴間の空間適応量子化であり,量子化モデルで使用されるビット幅を動的に調整する。
我々は,MP-PDEとGraphViTという2つの最先端モデルと統合して,複数のタスクのパフォーマンスを評価することで,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2025-11-23T14:47:24Z) - BasicAVSR: Arbitrary-Scale Video Super-Resolution via Image Priors and Enhanced Motion Compensation [70.27358326228399]
任意スケールビデオ超解像(AVSR)のためのベーシックAVSRを提案する。
AVSRは、ビデオフレームの解像度、潜在的に様々なスケーリング要素を強化することを目的としている。
超高分解能, 一般化能力, 推論速度の点で, BasicAVSR は既存手法よりも優れていた。
論文 参考訳(メタデータ) (2025-10-30T05:08:45Z) - MOBIUS: Big-to-Mobile Universal Instance Segmentation via Multi-modal Bottleneck Fusion and Calibrated Decoder Pruning [91.90342432541138]
モデルサイズとトレーニングデータのスケールアップには、インスタンスレベルの知覚のための高度な基盤モデルがある。
資源制約されたプラットフォームにおける高い計算コスト制限。
我々は,高性能コンピューティングプラットフォームとモバイルデバイスの両方において,効率的なセグメンテーションのための新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2025-10-16T18:00:00Z) - DFYP: A Dynamic Fusion Framework with Spectral Channel Attention and Adaptive Operator learning for Crop Yield Prediction [18.24061967822792]
DFYPは、作物収量予測のための新しい動的融合フレームワークである。
スペクトルチャネルアテンション、エッジ適応空間モデリング、学習可能な融合機構を組み合わせる。
DFYPはRMSE、MAE、R2の最先端ベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-07-08T10:24:04Z) - Dual Atrous Separable Convolution for Improving Agricultural Semantic Segmentation [2.3636539018632616]
本研究では, 精密農業における効率的な画像分割手法を提案する。
Dual Atrous Separable Convolution (DAS Conv)モジュールはDeepLabV3ベースのセグメンテーションフレームワークに統合されている。
モデルの複雑さとパフォーマンスのトレードオフを考慮すると、66%以上の効率改善が達成されます。
論文 参考訳(メタデータ) (2025-06-27T18:37:43Z) - COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation [21.35438761539206]
VLN(Vision-and-Language Navigation)タスクは、ホームアシスタントなどの分野に応用される可能性があるため、人工知能研究において注目されている。
本稿では,COSMO(Combination of Selective MemOrization)を組み込んだ新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-03-31T13:24:10Z) - ContextFormer: Redefining Efficiency in Semantic Segmentation [48.81126061219231]
畳み込み法は、局所的な依存関係をうまく捉えるが、長距離関係に苦慮する。
ビジョントランスフォーマー(ViT)は、グローバルなコンテキストキャプチャでは優れるが、高い計算要求によって妨げられる。
我々は,リアルタイムセマンティックセグメンテーションの効率,精度,堅牢性のバランスをとるために,CNN と ViT の強みを活用したハイブリッドフレームワーク ContextFormer を提案する。
論文 参考訳(メタデータ) (2025-01-31T16:11:04Z) - AA-RMVSNet: Adaptive Aggregation Recurrent Multi-view Stereo Network [8.127449025802436]
本稿では,AA-RMVSNetというアダプティブアグリゲーションを備えた長短期記憶(LSTM)に基づく,新しいマルチビューステレオネットワークを提案する。
まず、コンテキスト認識の畳み込みとマルチスケールアグリゲーションを用いて、画像の特徴を適応的に抽出するビュー内アグリゲーションモジュールを提案する。
本稿では,すべてのビューにおいて,より整合性のあるペアを保存可能な,適応的なピクセルワイドビューアグリゲーションのためのビュー間コストボリュームアグリゲーションモジュールを提案する。
論文 参考訳(メタデータ) (2021-08-09T06:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。