論文の概要: Fourier Boundary Features Network with Wider Catchers for Glass Segmentation
- arxiv url: http://arxiv.org/abs/2405.09459v1
- Date: Wed, 15 May 2024 15:52:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-16 13:06:44.687170
- Title: Fourier Boundary Features Network with Wider Catchers for Glass Segmentation
- Title(参考訳): ガラスセグメンテーションのためのより広いキャッチャーを有するフーリエ境界特徴ネットワーク
- Authors: Xiaolin Qin, Jiacen Liu, Qianlei Wang, Shaolin Zhang, Fei Zhu, Zhang Yi,
- Abstract要約: 反射面と透過ガラスのセグメンテーションを制約する新しい手法を提案する。
提案手法はガラス画像分割における最先端技術 (SOTA) 法と比較して, セグメンテーション性能が向上する。
- 参考スコア(独自算出の注目度): 12.465008923418406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Glass largely blurs the boundary between the real world and the reflection. The special transmittance and reflectance quality have confused the semantic tasks related to machine vision. Therefore, how to clear the boundary built by glass, and avoid over-capturing features as false positive information in deep structure, matters for constraining the segmentation of reflection surface and penetrating glass. We proposed the Fourier Boundary Features Network with Wider Catchers (FBWC), which might be the first attempt to utilize sufficiently wide horizontal shallow branches without vertical deepening for guiding the fine granularity segmentation boundary through primary glass semantic information. Specifically, we designed the Wider Coarse-Catchers (WCC) for anchoring large area segmentation and reducing excessive extraction from a structural perspective. We embed fine-grained features by Cross Transpose Attention (CTA), which is introduced to avoid the incomplete area within the boundary caused by reflection noise. For excavating glass features and balancing high-low layers context, a learnable Fourier Convolution Controller (FCC) is proposed to regulate information integration robustly. The proposed method has been validated on three different public glass segmentation datasets. Experimental results reveal that the proposed method yields better segmentation performance compared with the state-of-the-art (SOTA) methods in glass image segmentation.
- Abstract(参考訳): ガラスは現実世界と反射の境界を大きく曖昧にする。
特殊透過率と反射率の品質は、マシンビジョンに関連する意味的タスクを混乱させてきた。
したがって、ガラスによって構築された境界線をクリアし、深部構造における偽陽性情報、反射面のセグメンテーションと透過ガラスのセグメンテーションを制約する問題として、過剰に捕獲される特徴を回避できる。
ガラスのセグメンテーション境界を1次ガラスのセグメンテーション情報で導くため, 縦深化を伴わずに, 十分に広い水平な枝を十分に活用する試みとして, 広帯域キャッチャーを用いたフーリエ境界特徴ネットワーク(FBWC)を提案した。
具体的には,大面積のセグメンテーションを固定し,構造的観点からの過剰な抽出を削減できるワイドラー粗さキャッチャー (WCC) を設計した。
反射雑音による境界内の不完全領域を回避するために, クロストランスポーズ注意(CTA)により微細な特徴を埋め込む。
ガラスの特徴を抽出し,高層コンテキストのバランスをとるために,学習可能なフーリエ畳み込み制御器 (FCC) が提案され,情報統合を堅牢に制御する。
提案手法は3種類のガラスセグメンテーションデータセットで検証されている。
実験結果から, ガラス画像分割におけるSOTA法と比較して, 高いセグメンテーション性能が得られた。
関連論文リスト
- Glass Segmentation with Multi Scales and Primary Prediction Guiding [2.66512000865131]
ガラスのような物体は、日々の生活の中でどこにでも見えます。
本稿では,FineRescaling and Merging Module (FRM) から構成されるMGNetを提案する。
高信頼セグメンテーションマップを作成するために,不確実性を考慮した新たな損失関数を用いてモデルを監督する。
論文 参考訳(メタデータ) (2024-02-13T16:14:32Z) - Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection [57.646582245834324]
LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
より多様な偽の表現は、より一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
論文 参考訳(メタデータ) (2023-11-19T09:41:10Z) - RFENet: Towards Reciprocal Feature Evolution for Glass Segmentation [44.45402982171703]
本稿では,ガラス状オブジェクトセグメンテーションのためのReciprocal Feature Evolution Network (RFENet)を提案する。
RFENetは3つの人気のあるパブリックデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-07-12T11:45:22Z) - Edge-Aware Mirror Network for Camouflaged Object Detection [5.032585246295627]
エッジ検出と擬似オブジェクトセグメンテーションをモデル化する新しいエッジ対応ミラーネットワーク(EAMNet)を提案する。
EAMNetは2分岐アーキテクチャを持ち、セグメンテーションによるエッジアグリゲーションモジュールとエッジによる完全アグリゲーションモジュールがセグメンテーションブランチとエッジ検出ブランチをクロスガイドするように設計されている。
実験の結果,EAMNetは3つの広く使用されているCODデータセットにおいて,既存の最先端ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2023-07-08T08:14:49Z) - Temporal Perceiver: A General Architecture for Arbitrary Boundary
Detection [48.33132632418303]
ジェネリック境界検出(GBD)は、動画をセマンティック・コヒーレントと分類なしの単位に分割する一般的な境界を特定することを目的としている。
従来の研究では、単純なCNNからLSTMまでの複雑なディープネットワークの設計で、これらの異なるレベルの汎用境界を別々に扱っていた。
本稿では,Transformer を用いた汎用アーキテクチャである Temporal Perceiver について述べる。
論文 参考訳(メタデータ) (2022-03-01T09:31:30Z) - GlassNet: Label Decoupling-based Three-stream Neural Network for Robust
Image Glass Detection [1.1825946875790057]
我々はラベルデカップリングを利用してラベル付き接地トラス(GT)マップを内部拡散マップと境界拡散マップに分解する。
新たに生成された2つの地図と協調したGTマップは、オブジェクト境界の不均衡分布を破り、ガラス検出品質が向上する。
マルチモーダル情報を統合するために,アテンションベースの境界認識機能であるMosaicモジュールを開発した。
論文 参考訳(メタデータ) (2021-08-25T08:33:49Z) - BEFD: Boundary Enhancement and Feature Denoising for Vessel Segmentation [15.386077363312372]
セマンティックセグメンテーションにおける境界情報抽出のネットワーク機能を容易にするため,BEFD(Boundary Enhancement and Feature Denoising)モジュールを提案する。
ソベルエッジディテクタの導入により、ネットワークは追加のエッジを事前に取得できるため、医療画像セグメンテーションの監視されていない方法で境界を強化することができます。
論文 参考訳(メタデータ) (2021-04-08T13:44:47Z) - Enhanced Boundary Learning for Glass-like Object Segmentation [55.45473926510806]
本稿では,拡張境界学習によるガラス状物体分割問題を解くことを目的とする。
特に,より微細な境界キューを生成するための改良された微分モジュールを最初に提案する。
境界に沿った大域的な形状表現をモデル化するために,エッジ対応のグラフ畳み込みネットワークモジュールを提案する。
論文 参考訳(メタデータ) (2021-03-29T16:18:57Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。