論文の概要: FoR-Net: Learning to Focus on Hard Regions for Efficient Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2605.02764v1
- Date: Mon, 04 May 2026 16:05:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.395868
- Title: FoR-Net: Learning to Focus on Hard Regions for Efficient Semantic Segmentation
- Title(参考訳): FoR-Net: 効率的なセマンティックセグメンテーションのためのハード領域の学習
- Authors: Hsin-Jui Pan, Sheng-Wei Chan, Meng-Qian Li, Chun-Po Shen,
- Abstract要約: FoR-Netはセマンティックセグメンテーションのための軽量なアーキテクチャで、ハード領域の識別と拡張に重点を置いている。
セレクタモジュールは、領域的な重要性を予測し、モデルが挑戦的な領域に集中できるようにする。
我々は,限られた計算資源の下で,Cityscapesベンチマーク上でFOR-Netを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present FoR-Net, a lightweight architecture for semantic segmentation that focuses on identifying and enhancing hard regions. Instead of relying on heavy global modeling, FoR-Net adopts an efficient strategy that selectively emphasizes informative regions through a learned importance map and a Top-K activation mechanism. Specifically, a selector module predicts region-wise importance, enabling the model to focus on challenging areas such as thin structures and object boundaries. Multi-scale reasoning is achieved using convolutional branches with different receptive fields, allowing diverse spatial context aggregation. We evaluate FoR-Net on the Cityscapes benchmark under limited computational resources. Despite its lightweight design and standard training configuration, FoR-Net achieves competitive performance and demonstrates improved consistency in challenging regions. These results suggest that region-focused reasoning provides a simple yet effective inductive bias for efficient semantic segmentation.
- Abstract(参考訳): 本稿では,硬質領域の識別と拡張に焦点を当てたセマンティックセグメンテーションのための軽量アーキテクチャであるFoR-Netを提案する。
FoR-Netは、重大なグローバルモデリングに頼る代わりに、学習された重要度マップとTop-Kアクティベーションメカニズムを通じて情報領域を選択的に強調する効率的な戦略を採用している。
具体的には、セレクタモジュールが領域的な重要性を予測し、モデルが細い構造やオブジェクト境界のような挑戦的な領域に集中できるようにする。
マルチスケール推論は、異なる受容場を持つ畳み込み枝を用いて達成され、多様な空間的コンテキストアグリゲーションを可能にする。
我々は,限られた計算資源の下で,Cityscapesベンチマーク上でFOR-Netを評価する。
軽量な設計と標準のトレーニング構成にもかかわらず、FoR-Netは競争力のあるパフォーマンスを実現し、挑戦するリージョンでの一貫性の向上を実証している。
これらの結果は、領域中心の推論が効率的セマンティックセグメンテーションに単純だが効果的な帰納的バイアスをもたらすことを示唆している。
関連論文リスト
- RegionReasoner: Region-Grounded Multi-Round Visual Reasoning [69.75509909581133]
RegionReasonerは視覚的推論のための強化学習フレームワークである。
これは、それぞれの推論トレースに対応する参照境界ボックスを明示的に引用することを要求することによって、根拠付き推論を強制する。
RegionReasonerは、基礎となる忠実さとグローバルなセマンティックアライメントを組み合わせた構造化された報酬で最適化されている。
論文 参考訳(メタデータ) (2026-02-03T16:52:16Z) - GCRPNet: Graph-Enhanced Contextual and Regional Perception Network for Salient Object Detection in Optical Remote Sensing Images [68.33481681452675]
本稿では,GCRPNet(Graph-enhanced contextual and Regional Recognition Network)を提案する。
これはMambaアーキテクチャの上に構築され、長距離依存関係を同時にキャプチャし、地域的特徴表現を強化する。
マルチスケールの畳み込みによって処理される特徴マップに対して適応的なパッチスキャンを行い、リッチなローカル領域情報をキャプチャする。
論文 参考訳(メタデータ) (2025-08-14T11:31:43Z) - Exploring Spatial Diversity for Region-based Active Learning [20.866022165099626]
セマンティックセグメンテーションの最先端の方法は、大規模ラベル付きデータセットに基づいてトレーニングされたディープニューラルネットワークに基づいている。
地域ベースのアクティブラーニングは、高い性能を維持しつつアノテーションコストを削減する戦略であると考えている。
論文 参考訳(メタデータ) (2025-07-23T10:04:25Z) - Region-Enhanced Feature Learning for Scene Semantic Segmentation [19.20735517821943]
計算負担を軽減するために,細粒度点やボクセルの代わりに点雲の中間表現として領域を用いることを提案する。
本研究では,セマンティック空間領域抽出段階と領域依存モデリング段階からなるRFEモジュールを設計する。
我々のREFL-NetはScanNetV2で1.8% mIoUゲイン、S3DISデータセットで1.7% mIoUゲインを無視可能な計算コストで達成している。
論文 参考訳(メタデータ) (2023-04-15T06:35:06Z) - Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。
適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。
様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-19T17:46:02Z) - PRA-Net: Point Relation-Aware Network for 3D Point Cloud Analysis [56.91758845045371]
我々はポイント関係認識ネットワーク(PRA-Net)という新しいフレームワークを提案する。
領域内構造学習(ISL)モジュールと領域間関係学習(IRL)モジュールで構成されている。
形状分類,キーポイント推定,部分セグメンテーションを含む複数の3次元ベンチマーク実験により,PRA-Netの有効性と性能が検証された。
論文 参考訳(メタデータ) (2021-12-09T13:24:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。