論文の概要: Progressive Glass Segmentation
- arxiv url: http://arxiv.org/abs/2209.02280v1
- Date: Tue, 6 Sep 2022 08:11:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-07 14:14:12.017107
- Title: Progressive Glass Segmentation
- Title(参考訳): プログレッシブガラスセグメンテーション
- Authors: Letian Yu, Haiyang Mei, Wen Dong, Ziqi Wei, Li Zhu, Yuxin Wang, Xin
Yang
- Abstract要約: ガラスには独自の視覚的な外観はなく、周囲の外観を伝達・反射するだけである。
既存のメソッドは通常、ディープネットワークのさまざまなレベルの機能から有用なキューを探索し、組み合わせます。
本研究では,識別可能性向上 (DE) モジュールを開発した。
- 参考スコア(独自算出の注目度): 26.438341615170614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Glass is very common in the real world. Influenced by the uncertainty about
the glass region and the varying complex scenes behind the glass, the existence
of glass poses severe challenges to many computer vision tasks, making glass
segmentation as an important computer vision task. Glass does not have its own
visual appearances but only transmit/reflect the appearances of its
surroundings, making it fundamentally different from other common objects. To
address such a challenging task, existing methods typically explore and combine
useful cues from different levels of features in the deep network. As there
exists a characteristic gap between level-different features, i.e., deep layer
features embed more high-level semantics and are better at locating the target
objects while shallow layer features have larger spatial sizes and keep richer
and more detailed low-level information, fusing these features naively thus
would lead to a sub-optimal solution. In this paper, we approach the effective
features fusion towards accurate glass segmentation in two steps. First, we
attempt to bridge the characteristic gap between different levels of features
by developing a Discriminability Enhancement (DE) module which enables
level-specific features to be a more discriminative representation, alleviating
the features incompatibility for fusion. Second, we design a
Focus-and-Exploration Based Fusion (FEBF) module to richly excavate useful
information in the fusion process by highlighting the common and exploring the
difference between level-different features.
- Abstract(参考訳): ガラスは実世界では非常に一般的です。
ガラス領域とガラスの背後にある様々な複雑なシーンの不確実性の影響により、ガラスの存在は多くのコンピュータビジョンタスクに深刻な課題をもたらし、ガラスセグメンテーションは重要なコンピュータビジョンタスクとなる。
ガラスには独自の視覚的な外観はなく、周囲の外観を伝達・反射するだけであり、他の一般的な物体と根本的に異なる。
このような課題に対処するために、既存のメソッドは通常、ディープネットワークのさまざまなレベルの機能から有用なキューを探索し、組み合わせます。
層間特徴の間には特徴的ギャップがあり、すなわち、深層特徴がより高レベルなセマンティクスを埋め込み、対象物の位置を特定するのに優れている一方で、浅い層特徴はより大きく、より詳細な低レベル情報を保持し、これらの特徴が自然に融合することで、準最適解をもたらす。
本稿では,2段階の精度の高いガラスセグメンテーションに向けて,有効機能融合にアプローチする。
まず,識別性向上(de)モジュールの開発により,異なる特徴量間の特性ギャップを橋渡しし,レベル特異的な特徴をより識別的表現にし,融合の非互換性を緩和する。
第2に,Focus-and-Exploration Based Fusion (FEBF) モジュールを設計し,共通点を強調し,レベル差の特徴の違いを探索することにより,融合プロセスで有用な情報を豊富に探索する。
関連論文リスト
- Instruction-Guided Fusion of Multi-Layer Visual Features in Large Vision-Language Models [50.98559225639266]
6つのタスクカテゴリにまたがる18のベンチマークを用いて,異なるエンコーダ層からの視覚的特徴の寄与について検討した。
この結果から,多層構造はタスク依存性の相補的な長所を提供し,均一な融合が最適以下の性能をもたらすことが明らかとなった。
テキスト命令に基づいて動的に多層視覚特徴を統合する命令誘導型視覚アグリゲータを提案する。
論文 参考訳(メタデータ) (2024-12-26T05:41:31Z) - Glass Segmentation with Multi Scales and Primary Prediction Guiding [2.66512000865131]
ガラスのような物体は、日々の生活の中でどこにでも見えます。
本稿では,FineRescaling and Merging Module (FRM) から構成されるMGNetを提案する。
高信頼セグメンテーションマップを作成するために,不確実性を考慮した新たな損失関数を用いてモデルを監督する。
論文 参考訳(メタデータ) (2024-02-13T16:14:32Z) - RFENet: Towards Reciprocal Feature Evolution for Glass Segmentation [44.45402982171703]
本稿では,ガラス状オブジェクトセグメンテーションのためのReciprocal Feature Evolution Network (RFENet)を提案する。
RFENetは3つの人気のあるパブリックデータセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-07-12T11:45:22Z) - Progressive Multi-scale Consistent Network for Multi-class Fundus Lesion
Segmentation [28.58972084293778]
提案するプログレッシブ・フィーチャー・フュージョン(PFF)ブロックと動的アテンション・ブロック(DAB)を統合した,プログレッシブ・マルチスケール・一貫性ネットワーク(PMCNet)を提案する。
PFFブロックは、隣接するエンコーディング層からのマルチスケール機能を段階的に統合し、きめ細かい詳細と高レベルのセマンティクスを集約することで、各層の特徴学習を容易にする。
DABは、異なるスケールで融合した特徴から注意深い手がかりを動的に学習するように設計されているため、マルチスケール機能に存在する本質的な矛盾を円滑にすることを目的としている。
論文 参考訳(メタデータ) (2022-05-31T12:10:01Z) - AF$_2$: Adaptive Focus Framework for Aerial Imagery Segmentation [86.44683367028914]
航空画像のセグメンテーションにはいくつかの独特な課題があり、中でも最も重要なものは前景と背景のアンバランスにある。
本稿では,階層的なセグメンテーション手法を採用し,マルチスケール表現を適応的に活用するAdaptive Focus Framework (AF$)を提案する。
AF$は、広く使われている3つの航空ベンチマークの精度を大幅に改善した。
論文 参考訳(メタデータ) (2022-02-18T10:14:45Z) - Perception-and-Regulation Network for Salient Object Detection [8.026227647732792]
本稿では,特徴間の相互依存性を明示的にモデル化し,特徴融合プロセスを適応的に制御する新しいグローバルアテンションユニットを提案する。
知覚部は、分類網内の完全に接続された層の構造を用いて、物体のサイズと形状を学習する。
さらに、ネットワークのグローバルな認識能力向上のために、模倣眼観察モジュール(IEO)が使用される。
論文 参考訳(メタデータ) (2021-07-27T02:38:40Z) - Enhanced Boundary Learning for Glass-like Object Segmentation [55.45473926510806]
本稿では,拡張境界学習によるガラス状物体分割問題を解くことを目的とする。
特に,より微細な境界キューを生成するための改良された微分モジュールを最初に提案する。
境界に沿った大域的な形状表現をモデル化するために,エッジ対応のグラフ畳み込みネットワークモジュールを提案する。
論文 参考訳(メタデータ) (2021-03-29T16:18:57Z) - Salient Object Detection via Integrity Learning [104.13483971954233]
整合性とは、ある有能な対象に属するすべての部分を強調する概念である。
ICON(Inteinity Cognition Network)の設計により,高感度物体検出のための整合性学習を容易にする。
ICONは3つの重要なコンポーネントを探索し、強力な整合性機能を学びます。
論文 参考訳(メタデータ) (2021-01-19T14:53:12Z) - DFNet: Discriminative feature extraction and integration network for
salient object detection [6.959742268104327]
畳み込みニューラルネットワークを用いた唾液度検出における課題の2つの側面に焦点をあてる。
第一に、様々な大きさに有能な物体が現れるため、単一スケールの畳み込みは適切な大きさを捉えない。
第二に、マルチレベル機能の使用は、モデルがローカルコンテキストとグローバルコンテキストの両方を使用するのに役立つ。
論文 参考訳(メタデータ) (2020-04-03T13:56:41Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。