論文の概要: Complex Wavelet Mutual Information Loss: A Multi-Scale Loss Function for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2502.00563v1
- Date: Sat, 01 Feb 2025 21:19:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:56:56.584567
- Title: Complex Wavelet Mutual Information Loss: A Multi-Scale Loss Function for Semantic Segmentation
- Title(参考訳): 複雑なウェーブレット相互情報損失:セマンティックセグメンテーションのためのマルチスケールロス関数
- Authors: Renhao Lu,
- Abstract要約: 複雑なステアブルピラミッドによって分解されたサブバンド画像からの相互情報を利用する新しい損失関数を提案する。
CWMIの損失は、最先端の手法と比較してピクセル単位の精度とトポロジカルな指標の両方で大幅に改善される。
- 参考スコア(独自算出の注目度): 0.4662017507844857
- License:
- Abstract: Recent advancements in deep neural networks have significantly enhanced the performance of semantic segmentation. However, class imbalance and instance imbalance remain persistent challenges, where smaller instances and thin boundaries are often overshadowed by larger structures. To address the multiscale nature of segmented objects, various models have incorporated mechanisms such as spatial attention and feature pyramid networks. Despite these advancements, most loss functions are still primarily pixel-wise, while regional and boundary-focused loss functions often incur high computational costs or are restricted to small-scale regions. To address this limitation, we propose complex wavelet mutual information (CWMI) loss, a novel loss function that leverages mutual information from subband images decomposed by a complex steerable pyramid. The complex steerable pyramid captures features across multiple orientations and preserves structural similarity across scales. Meanwhile, mutual information is well-suited for capturing high-dimensional directional features and exhibits greater noise robustness. Extensive experiments on diverse segmentation datasets demonstrate that CWMI loss achieves significant improvements in both pixel-wise accuracy and topological metrics compared to state-of-the-art methods, while introducing minimal computational overhead. The code is available at https://anonymous.4open.science/r/CWMI-83B7/
- Abstract(参考訳): 近年のディープニューラルネットワークの進歩はセマンティックセグメンテーションの性能を大幅に向上させた。
しかし、クラス不均衡とインスタンス不均衡は、小さなインスタンスと細い境界が大きな構造によって隠れていることが多い、永続的な課題のままである。
セグメント化されたオブジェクトのマルチスケールの性質に対処するために、空間的注意や特徴ピラミッドネットワークといった様々なモデルが組み込まれている。
これらの進歩にもかかわらず、ほとんどの損失関数は、主にピクセル単位で、一方、地域と境界に焦点を当てた損失関数は、しばしば高い計算コストを発生させるか、小規模の領域に制限される。
この制限に対処するため、複素ステアブルピラミッドによって分解されたサブバンド画像からの相互情報を利用する新しいロス関数である複素ウェーブレット相互情報損失(CWMI)を提案する。
複雑な操舵可能なピラミッドは、複数の向きにまたがる特徴を捉え、スケールにまたがる構造的類似性を保っている。
一方、相互情報は高次元指向性の特徴を捉えるのに適しており、より強い雑音耐性を示す。
多様なセグメンテーションデータセットに対する大規模な実験により、CWMIの損失は、最先端の手法と比較してピクセル単位の精度とトポロジカルな指標の両方において大幅に改善され、計算オーバーヘッドは最小限であることが示された。
コードはhttps://anonymous.4open.science/r/CWMI-83B7/で公開されている。
関連論文リスト
- Network scaling and scale-driven loss balancing for intelligent poroelastography [2.665036498336221]
フルウェーブフォームデータからポリ弾性媒体のマルチスケールキャラクタリゼーションのためのディープラーニングフレームワークを開発した。
2つの大きな課題は、この目的のために既存の最先端技術を直接適用することを妨げる。
本稿では, ニューラルネットワークをスケーリング層に構成した単位形状関数を用いて, ニューラルプロパティマップを構築する, エンフェネティックスケーリングの考え方を提案する。
論文 参考訳(メタデータ) (2024-10-27T23:06:29Z) - A topological description of loss surfaces based on Betti Numbers [8.539445673580252]
多層ニューラルネットワークの場合の損失複雑性を評価するためのトポロジカル尺度を提供する。
損失関数やモデルアーキテクチャの特定のバリエーション、例えば$ell$正規化項の追加やフィードフォワードネットワークでの接続のスキップは、特定のケースにおける損失には影響しない。
論文 参考訳(メタデータ) (2024-01-08T11:20:04Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Mutual Information-driven Triple Interaction Network for Efficient Image
Dehazing [54.168567276280505]
画像デハージングのための相互情報駆動型トリプルインタラクションネットワーク(MITNet)を提案する。
振幅誘導ヘイズ除去と呼ばれる第1段階は、ヘイズ除去のためのヘイズ画像の振幅スペクトルを復元することを目的としている。
第2段階は位相誘導構造が洗練され、位相スペクトルの変換と微細化を学ぶことに尽力した。
論文 参考訳(メタデータ) (2023-08-14T08:23:58Z) - InverseForm: A Loss Function for Structured Boundary-Aware Segmentation [80.39674800972182]
逆変換ネットワークを用いたセマンティックセグメンテーションのための新しい境界認識損失項を提案する。
このプラグイン損失項は境界変換の捕捉におけるクロスエントロピー損失を補完する。
室内および屋外のセグメンテーションベンチマークにおける損失関数の定量的および定性的効果を解析した。
論文 参考訳(メタデータ) (2021-04-06T18:52:45Z) - Topological obstructions in neural networks learning [67.8848058842671]
損失勾配関数フローのグローバル特性について検討する。
損失関数とそのモースコンプレックスの位相データ解析を用いて,損失面の大域的特性と勾配軌道に沿った局所的挙動を関連付ける。
論文 参考訳(メタデータ) (2020-12-31T18:53:25Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - An Elastic Interaction-Based Loss Function for Medical Image
Segmentation [10.851295591782538]
本稿では,医用画像セグメンテーションのための長距離弾性相互作用に基づくトレーニング戦略を提案する。
この戦略において、CNNは予測領域の境界と実際の物体の境界との間の弾性相互作用エネルギーの誘導の下で対象領域を学習する。
実験結果から,本手法は一般的に用いられている画素単位の損失関数と比較して,大幅な改善が可能であることが示された。
論文 参考訳(メタデータ) (2020-07-06T11:49:14Z) - Y-net: Multi-scale feature aggregation network with wavelet structure
similarity loss function for single image dehazing [18.479856828292935]
本稿では,その構造から命名されたY-netを提案する。
このネットワークは、マルチスケールの特徴マップを集約することで、鮮明な画像を再構成する。
また、トレーニングステップにおいてウェーブレット構造シミュラリティ(W-SSIM)損失関数を提案する。
論文 参考訳(メタデータ) (2020-03-31T02:07:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。