論文の概要: Freq-DP Net: A Dual-Branch Network for Fence Removal using Dual-Pixel and Fourier Priors
- arxiv url: http://arxiv.org/abs/2602.14226v1
- Date: Sun, 15 Feb 2026 16:43:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:49.751338
- Title: Freq-DP Net: A Dual-Branch Network for Fence Removal using Dual-Pixel and Fourier Priors
- Title(参考訳): Freq-DP Net:デュアルピクセルとフーリエプリミティブを用いたフェンス除去のためのデュアルブランチネットワーク
- Authors: Kunal Swami, Sudha Velusamy, Chandra Sekhar Seelamantula,
- Abstract要約: フェンス除去のためのデュアルピクセル(DP)センサを利用する最初のフレームワークを紹介する。
Freq-DP Netは2つの相補的前兆を融合させる新しいデュアルブランチネットワークである。
注意機構は、これらのキューを高度に正確なフェンスセグメンテーションのためにインテリジェントにマージする。
- 参考スコア(独自算出の注目度): 14.621855063994637
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Removing fence occlusions from single images is a challenging task that degrades visual quality and limits downstream computer vision applications. Existing methods often fail on static scenes or require motion cues from multiple frames. To overcome these limitations, we introduce the first framework to leverage dual-pixel (DP) sensors for this problem. We propose Freq-DP Net, a novel dual-branch network that fuses two complementary priors: a geometric prior from defocus disparity, modeled using an explicit cost volume, and a structural prior of the fence's global pattern, learned via Fast Fourier Convolution (FFC). An attention mechanism intelligently merges these cues for highly accurate fence segmentation. To validate our approach, we build and release a diverse benchmark with different fence varieties. Experiments demonstrate that our method significantly outperforms strong general-purpose baselines, establishing a new state-of-the-art for single-image, DP-based fence removal.
- Abstract(参考訳): 単一の画像からフェンスの閉塞を取り除くことは、視覚的品質を低下させ、下流のコンピュータビジョンアプリケーションを制限する難しい作業である。
既存のメソッドはしばしば静的なシーンで失敗するか、複数のフレームからのモーションキューを必要とする。
これらの制約を克服するために、この問題にデュアルピクセル(DP)センサーを利用するための最初のフレームワークを導入する。
本稿では,FFC(Fast Fourier Convolution)を用いて学習したFleq-DP NetとFFC(Freq-DP Net)という2つの相補的先行ネットワークを提案する。
注意機構は、これらのキューを高度に正確なフェンスセグメンテーションのためにインテリジェントにマージする。
このアプローチを検証するために、さまざまなフェンスのバリエーションを持つ多様なベンチマークを構築し、リリースします。
実験により,本手法は強い汎用ベースラインを著しく上回り,DPベースフェンス除去のための新たな最先端技術を確立した。
関連論文リスト
- DSwinIR: Rethinking Window-based Attention for Image Restoration [109.38288333994407]
画像復元のための基盤となるバックボーンアーキテクチャとしてデフォルマブルスライディングウィンドウ変換器(DSwinIR)を提案する。
DSwinIRの中心には、Deformable Sliding Window (DSwin) Attentionという小説がある。
大規模な実験により、DSwinIRは幅広い画像復元タスクに新しい最先端の技術を設定できることがわかった。
論文 参考訳(メタデータ) (2025-04-07T09:24:41Z) - ARNet: Self-Supervised FG-SBIR with Unified Sample Feature Alignment and Multi-Scale Token Recycling [11.129453244307369]
FG-SBIRは、埋め込み空間におけるスケッチと対応する画像の距離を最小化することを目的としている。
両領域間のギャップを狭める効果的なアプローチを提案する。
主に、イントラサンプルとインターサンプルの両方を共有する統一的な相互情報共有を促進する。
論文 参考訳(メタデータ) (2024-06-17T13:49:12Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Open-Vocabulary Semantic Segmentation with Decoupled One-Pass Network [26.97153244517095]
入力画像の視覚言語モデルに1つのパスしか必要としないネットワークを提案する。
本稿ではまず,事前学習した視覚エンコーダにおけるパッチ埋め込み間の有害な干渉を抑制するために,パッチ重大度と呼ばれる新しいネットワーク適応手法を提案する。
そこで我々は,ネットワークがより差別的な特徴に着目するよう促すために,分類アンカー学習を提案する。
論文 参考訳(メタデータ) (2023-04-03T17:59:21Z) - PC-GANs: Progressive Compensation Generative Adversarial Networks for
Pan-sharpening [50.943080184828524]
空間情報とスペクトル情報の漸進的補償によりMS画像のシャープ化を行うパンシャーピングの新しい2段階モデルを提案する。
モデル全体が三重GANで構成されており、特定のアーキテクチャに基づいて、三重GANを同時に訓練できるように、共同補償損失関数が設計されている。
論文 参考訳(メタデータ) (2022-07-29T03:09:21Z) - Learning to Estimate Hidden Motions with Global Motion Aggregation [71.12650817490318]
閉塞は、局所的な証拠に依存する光学フローアルゴリズムに重大な課題をもたらす。
最初の画像でピクセル間の長距離依存性を見つけるために,グローバルモーションアグリゲーションモジュールを導入する。
遮蔽領域における光流量推定が非遮蔽領域における性能を損なうことなく大幅に改善できることを実証した。
論文 参考訳(メタデータ) (2021-04-06T10:32:03Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Recurrent Multi-view Alignment Network for Unsupervised Surface
Registration [79.72086524370819]
非厳格な登録をエンドツーエンドで学習することは、本質的に高い自由度とラベル付きトレーニングデータの欠如により困難である。
我々は、いくつかの剛性変換のポイントワイドな組み合わせで、非剛性変換を表現することを提案する。
また,投影された多視点2次元深度画像上での3次元形状の類似度を計測する可微分損失関数も導入する。
論文 参考訳(メタデータ) (2020-11-24T14:22:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。