論文の概要: ICFRNet: Image Complexity Prior Guided Feature Refinement for Real-time Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2408.13771v1
- Date: Sun, 25 Aug 2024 08:42:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 18:00:02.865389
- Title: ICFRNet: Image Complexity Prior Guided Feature Refinement for Real-time Semantic Segmentation
- Title(参考訳): ICFRNet: リアルタイムセマンティックセグメンテーションに先立つ画像複雑度
- Authors: Xin Zhang, Teodor Boyadzhiev, Jinglei Shi, Jufeng Yang,
- Abstract要約: 我々は、画像の複雑さをセグメント化機能の改良の先行として活用し、正確なリアルタイムセマンティックセマンティックセマンティックセマンティクスを実現する。
画像複雑化事前誘導型特徴分極ネットワーク(ICFRNet)を提案する。
このネットワークは複雑さとセグメンテーション機能の両方を集約し、セグメンテーション機能を改善するためのアテンションマップを生成する。
- 参考スコア(独自算出の注目度): 21.292293903662927
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we leverage image complexity as a prior for refining segmentation features to achieve accurate real-time semantic segmentation. The design philosophy is based on the observation that different pixel regions within an image exhibit varying levels of complexity, with higher complexities posing a greater challenge for accurate segmentation. We thus introduce image complexity as prior guidance and propose the Image Complexity prior-guided Feature Refinement Network (ICFRNet). This network aggregates both complexity and segmentation features to produce an attention map for refining segmentation features within an Image Complexity Guided Attention (ICGA) module. We optimize the network in terms of both segmentation and image complexity prediction tasks with a combined loss function. Experimental results on the Cityscapes and CamViD datasets have shown that our ICFRNet achieves higher accuracy with a competitive efficiency for real-time segmentation.
- Abstract(参考訳): 本稿では,画像の複雑さをセグメント化の事前処理として活用し,正確なリアルタイムセマンティックセマンティックセマンティックセマンティクスを実現する。
デザイン哲学は、画像内の異なるピクセル領域が様々なレベルの複雑さを示すという観察に基づいている。
そこで我々は,画像複雑度を事前指導として導入し,画像複雑度事前誘導機能強化ネットワーク(ICFRNet)を提案する。
このネットワークは、複雑さとセグメンテーションの両方を集約し、画像複雑ガイド注意(ICGA)モジュール内のセグメンテーション機能を精細化するためのアテンションマップを生成する。
分割と画像複雑性予測の両面から,損失関数を組み合わせたネットワークを最適化する。
CityscapesとCamViDデータセットの実験結果から、ICFRNetはリアルタイムセグメンテーションの競争効率で高い精度を実現していることがわかった。
関連論文リスト
- Semi-supervised Semantic Segmentation for Remote Sensing Images via Multi-scale Uncertainty Consistency and Cross-Teacher-Student Attention [59.19580789952102]
本稿では,RS画像セマンティックセグメンテーションタスクのための,新しい半教師付きマルチスケール不確かさとクロスTeacher-Student Attention(MUCA)モデルを提案する。
MUCAは、マルチスケールの不確実性整合正則化を導入することにより、ネットワークの異なる層における特徴写像間の整合性を制限する。
MUCAは学生ネットワークの誘導にクロス教師・学生の注意機構を使用し、学生ネットワークにより差別的な特徴表現を構築するよう誘導する。
論文 参考訳(メタデータ) (2025-01-18T11:57:20Z) - Systematic review of image segmentation using complex networks [1.3053649021965603]
本稿では,複雑なネットワークを用いた画像分割手法について述べる。
コンピュータビジョンや画像処理の応用において、画像分割は複雑な画像の解析に不可欠である。
論文 参考訳(メタデータ) (2024-01-05T11:14:07Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Low-Resolution Self-Attention for Semantic Segmentation [93.30597515880079]
我々は,グローバルコンテキストを計算コストの大幅な削減で捉えるために,低解像度自己認識(LRSA)機構を導入する。
我々のアプローチは、入力画像の解像度に関わらず、固定された低解像度空間における自己注意を計算することである。
本稿では,エンコーダ・デコーダ構造を持つビジョントランスであるLRFormerを構築することで,LRSA手法の有効性を示す。
論文 参考訳(メタデータ) (2023-10-08T06:10:09Z) - Fully Complex-valued Fully Convolutional Multi-feature Fusion Network
(FC2MFN) for Building Segmentation of InSAR images [7.3045725197814875]
本稿では,InSAR画像上にセマンティックセグメンテーションを構築するための完全複素数値完全畳み込み多機能融合ネットワーク(FC2MFN)を提案する。
複素数値化InSARデータの特異性については、その大きさと位相を考慮した複素数を比較するための新しい複素数値化プーリング層が提案されている。
FC2MFNは、セグメンテーション性能とモデル複雑さの観点から、他の最先端手法と比較して、より良い結果が得られる。
論文 参考訳(メタデータ) (2022-12-14T08:17:39Z) - Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文 参考訳(メタデータ) (2022-05-16T17:47:44Z) - Leveraging Image Complexity in Macro-Level Neural Network Design for
Medical Image Segmentation [3.974175960216864]
画像の複雑さは、与えられたデータセットに最適なものを選択するためのガイドラインとして利用できることを示す。
高複雑性データセットの場合、元のイメージ上で実行される浅いネットワークは、ダウンサンプリングされたイメージ上で実行されるディープネットワークよりもセグメンテーション結果が優れている可能性がある。
論文 参考訳(メタデータ) (2021-12-21T09:49:47Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - Pairwise Relation Learning for Semi-supervised Gland Segmentation [90.45303394358493]
病理組織像における腺分節に対するPRS2モデルを提案する。
このモデルはセグメンテーションネットワーク(S-Net)とペア関係ネットワーク(PR-Net)から構成される。
我々は,GlaSデータセットの最近の5つの手法とCRAGデータセットの最近の3つの手法を比較した。
論文 参考訳(メタデータ) (2020-08-06T15:02:38Z) - Building Networks for Image Segmentation using Particle Competition and
Cooperation [0.0]
粒子競合と協調 (PCC) はグラフに基づく半教師あり学習手法である。
PCCを供給するための適切なネットワークの構築は、より良いセグメンテーション結果を達成するために不可欠である。
候補ネットワークを評価する指標を提案する。
論文 参考訳(メタデータ) (2020-02-14T12:45:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。