論文の概要: SCRWKV: Ultra-Compact Structure-Calibrated Vision-RWKV for Topological Crack Segmentation
- arxiv url: http://arxiv.org/abs/2605.14926v2
- Date: Thu, 21 May 2026 13:23:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.414875
- Title: SCRWKV: Ultra-Compact Structure-Calibrated Vision-RWKV for Topological Crack Segmentation
- Title(参考訳): SCRWKV: トポロジカルクラックセグメンテーションのための超コンパクト構造校正型ビジョンRWKV
- Authors: Hanxu Zhang, Chen Jia, Hui Liu, Xu Cheng, Fan Shi, Shengyong Chen,
- Abstract要約: SCRWKV(Ultra-Compact Structure-Calibrated Vision RWKV)を提案する。
このネットワークは、線形複雑性を維持しながら、新しいStructure-Fieldバックボーンを介して高精度なモデリングを実現する。
SCRWKVは1.22Mのパラメータしか持たないが,SOTA法では著しく優れていた。
- 参考スコア(独自算出の注目度): 36.61448234263959
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Achieving pixel-level accurate segmentation of structural cracks across diverse scenarios remains a formidable challenge. Existing methods face significant bottlenecks in balancing crack topology modeling with computational efficiency, often failing to reconcile high segmentation quality with low resource demands. To address these limitations, we propose the Ultra-Compact Structure-Calibrated Vision RWKV (SCRWKV), a network that achieves high-precision modeling via a novel Structure-Field Encoder (SFE) backbone while maintaining linear complexity. The SFE integrates the Adaptive Multi-scale Cascaded Modulator (AMCM) to enhance texture representation and utilizes the Structure-Calibrated Insight Unit (SCIU) as its core engine. Specifically, the SCIU employs the Geometry-guided Bidirectional Structure Transformation (GBST) to capture topological correlations and integrates the Dynamic Self-Calibrating Decay (DSCD) into Dy-WKV to suppress noise propagation. Furthermore, we introduce a lightweight Cross-Scale Harmonic Fusion (CSHF) decoder to achieve precise feature aggregation. Systematic evaluations on multiple benchmarks characterized by complex textures and severe interference demonstrate that SCRWKV, with only 1.22M parameters, significantly outperforms SOTA methods. Achieving an F1 score of 0.8428 and mIoU of 0.8512 on the TUT dataset, the model confirms its robust potential for efficient real-world deployment. The code is available at https://github.com/zhxhzy/SCRWKV.
- Abstract(参考訳): さまざまなシナリオにまたがる構造的ひび割れのピクセルレベルの正確なセグメンテーションを実現することは、依然として困難な課題である。
既存の手法は、クラックトポロジーモデリングと計算効率のバランスをとる上で重大なボトルネックに直面しており、しばしば高いセグメンテーション品質と低いリソース要求の調整に失敗する。
これらの制約に対処するため、線形複雑度を維持しつつ、新しい構造フィールドエンコーダ(SFE)のバックボーンを介して高精度なモデリングを実現するネットワークであるUltra-Compact Structure-Calibrated Vision RWKV (SCRWKV)を提案する。
SFEはアダプティブ・マルチスケールカスケード・モジュレータ(AMCM)を統合してテクスチャ表現を強化し、そのコアエンジンとしてStructure-Calibrated Insight Unit(SCIU)を使用している。
具体的には、幾何誘導二方向構造変換(GBST)を用いてトポロジ的相関を捉え、動的自己校正決定(DSCD)をDy-WKVに統合し、ノイズ伝搬を抑制する。
さらに,CSHF(Cross-Scale Harmonic Fusion)デコーダを導入し,正確な特徴集約を実現する。
複雑なテクスチャと厳密な干渉を特徴とする複数のベンチマークの体系的評価により、SCRWKVは1.22Mパラメータしか持たないが、SOTA法を著しく上回っていることが示された。
TUTデータセットのF1スコアは0.8428、mIoUは0.8512であり、このモデルは実世界の効率的な展開のための堅牢な可能性を確認する。
コードはhttps://github.com/zhxhzy/SCRWKVで公開されている。
関連論文リスト
- Alternating Gradient Flow Utility: A Unified Metric for Structural Pruning and Dynamic Routing in Deep Networks [52.153950303594684]
交互勾配流(Alternating Gradient Flow, AGF)に着想を得た非結合型運動パラダイムを提案する。
AGFはネットワークの構造的「運動ユーティリティ」を正確にキャプチャする
我々は、AGFに誘導されるオフライン構造探索を、ゼロコストの物理プリミティブを介してオンライン実行から切り離すハイブリッドルーティングフレームワークを設計する。
論文 参考訳(メタデータ) (2026-03-12T18:19:21Z) - StepVAR: Structure-Texture Guided Pruning for Visual Autoregressive Models [98.72926158261937]
本稿では,Visual AutoRegressive モデルのためのトレーニングフリートークン解析フレームワークを提案する。
我々は局所的なテクスチャの詳細を捉えるために軽量なハイパスフィルタを使用し、グローバルな構造情報を保存するために主成分分析(PCA)を活用している。
スパーストークンの下で有効な次世代の予測を維持するために,近接した特徴伝達戦略を導入する。
論文 参考訳(メタデータ) (2026-03-02T11:35:05Z) - SCEESR: Semantic-Control Edge Enhancement for Diffusion-Based Super-Resolution [0.8122270502556375]
現実世界の超解像は複雑な劣化と固有の再構成の曖昧さに対処しなければならない。
一段階拡散モデルは速度を提供するが、蒸留品による構造的不正確さをしばしば生み出す。
セマンティックエッジガイダンスのための制御ネット機構を用いて,一段階拡散モデルを強化する新しいSRフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-22T06:06:01Z) - Flow-Matching Guided Deep Unfolding for Hyperspectral Image Reconstruction [53.26903617819014]
Flow-Matching-Guided Unfolding Network (FMU)は、最初にフローマッチングをHSI再構成に統合する。
学習力学をさらに強化するために,平均速度損失を導入する。
シミュレーションと実データの両方の実験により、FMUは復元品質において既存のアプローチよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-10-02T11:32:00Z) - Large-Scale Model Enabled Semantic Communication Based on Robust Knowledge Distillation [45.347078403677216]
大規模モデル(LSM)は意味表現と理解に有効なフレームワークである。
しかしながら、それらの直接的なデプロイメントは、しばしば高い計算複雑性とリソース要求によって妨げられる。
本稿では,新しい知識蒸留に基づくセマンティックコミュニケーションフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-04T07:47:18Z) - RSRWKV: A Linear-Complexity 2D Attention Mechanism for Efficient Remote Sensing Vision Task [20.16344973940904]
高分解能リモートセンシング分析は、シーンの複雑さとスケールの多様性による課題に直面している。
逐次処理と2次元空間推論を橋渡しする新しい2D-WKVスキャン機構を特徴とするSRWKVを提案する。
論文 参考訳(メタデータ) (2025-03-26T10:03:46Z) - DSCformer: A Dual-Branch Network Integrating Enhanced Dynamic Snake Convolution and SegFormer for Crack Segmentation [6.898227391740093]
現在の畳み込みニューラルネットワーク(CNN)はクラックセグメンテーションタスクにおいて強い性能を示している。
トランスフォーマーは、グローバルコンテキストのキャプチャに優れるが、詳細な特徴抽出の精度に欠ける。
本稿では,DSConv(Dynamic Snake Convolution)とTransformerアーキテクチャを統合した新しいハイブリッドモデルであるDSCformerを紹介する。
論文 参考訳(メタデータ) (2024-11-14T11:25:32Z) - You Only Train Once: A Unified Framework for Both Full-Reference and No-Reference Image Quality Assessment [45.62136459502005]
本稿では,完全な参照 (FR) と非参照 (NR) IQA を行うネットワークを提案する。
まず、入力画像から多レベル特徴を抽出するためにエンコーダを用いる。
FRおよびNR入力のユニバーサルアダプタとして階層的注意(HA)モジュールを提案する。
エンコーダの浅い層と深い層との間の特徴相関を調べるために, セマンティック・ディストーション・アウェア (SDA) モジュールを提案する。
論文 参考訳(メタデータ) (2023-10-14T11:03:04Z) - HDNet: High-resolution Dual-domain Learning for Spectral Compressive
Imaging [138.04956118993934]
HSI再構成のための高分解能デュアルドメイン学習ネットワーク(HDNet)を提案する。
一方、高効率な特徴融合によるHR空間スペクトルアテンションモジュールは、連続的かつ微細な画素レベルの特徴を提供する。
一方、HSI再構成のために周波数領域学習(FDL)を導入し、周波数領域の差を狭める。
論文 参考訳(メタデータ) (2022-03-04T06:37:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。