論文の概要: Revisiting Image Pyramid Structure for High Resolution Salient Object
Detection
- arxiv url: http://arxiv.org/abs/2209.09475v1
- Date: Tue, 20 Sep 2022 05:20:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-21 18:37:15.486012
- Title: Revisiting Image Pyramid Structure for High Resolution Salient Object
Detection
- Title(参考訳): 高分解能サルエント物体検出のための再訪像ピラミッド構造
- Authors: Taehun Kim, Kunhee Kim, Joonyeong Lee, Dongmin Cha, Jiho Lee, Daijin
Kim
- Abstract要約: InSPyReNet(Inverse Saliency Pyramid Restruction Network)という画像ピラミッドを用いたSODフレームワークを提案する。
HR予測のために、同じ画像から一対のLRとHRスケールから2つの異なる画像ピラミッドを合成し、有効受容場(ERF)の差を克服するピラミッドブレンディング法を設計する。
公開LRおよびHR SODベンチマークによる評価は、InSPyReNetが様々なSOD測定値と境界精度でState-of-the-Art(SotA)法を上回ることを示した。
- 参考スコア(独自算出の注目度): 8.290455986932848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Salient object detection (SOD) has been in the spotlight recently, yet has
been studied less for high-resolution (HR) images. Unfortunately, HR images and
their pixel-level annotations are certainly more labor-intensive and
time-consuming compared to low-resolution (LR) images and annotations.
Therefore, we propose an image pyramid-based SOD framework, Inverse Saliency
Pyramid Reconstruction Network (InSPyReNet), for HR prediction without any of
HR datasets. We design InSPyReNet to produce a strict image pyramid structure
of saliency map, which enables to ensemble multiple results with pyramid-based
image blending. For HR prediction, we design a pyramid blending method which
synthesizes two different image pyramids from a pair of LR and HR scale from
the same image to overcome effective receptive field (ERF) discrepancy. Our
extensive evaluations on public LR and HR SOD benchmarks demonstrate that
InSPyReNet surpasses the State-of-the-Art (SotA) methods on various SOD metrics
and boundary accuracy.
- Abstract(参考訳): 局所物体検出(SOD)は近年注目されているが,高分解能(HR)画像では研究が進んでいない。
残念なことに、HR画像とそのピクセルレベルのアノテーションは、低解像度(LR)画像やアノテーションに比べて、明らかに労働集約的で時間を要する。
そこで我々は,画像ピラミッドを用いたSODフレームワークInSPyReNetを提案し,HRデータセットを使わずにHR予測を行う。
そこで我々は,inspyrenetをデザインし,saliency mapの厳密な画像ピラミッド構造を作成する。
HR予測のために、同じ画像から一対のLRとHRスケールから2つの異なる画像ピラミッドを合成し、有効受容場(ERF)の差を克服するピラミッドブレンディング法を設計する。
公開LRおよびHR SODベンチマークの広範な評価は、InSPyReNetが様々なSOD測定値と境界精度でState-of-the-Art(SotA)法を上回ることを示した。
関連論文リスト
- Multi-Head Attention Residual Unfolded Network for Model-Based Pansharpening [2.874893537471256]
展開融合法は、ディープラーニングの強力な表現能力とモデルベースアプローチの堅牢性を統合する。
本稿では,衛星画像融合のためのモデルに基づく深部展開手法を提案する。
PRISMA、Quickbird、WorldView2データセットの実験結果から、本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2024-09-04T13:05:00Z) - PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Variational Zero-shot Multispectral Pansharpening [43.881891055500496]
Pansharpeningは、低空間分解能マルチスペクトル画像(LRMS)とパンクロマチック画像(PAN)を融合させて高空間分解能マルチスペクトル画像(HRMS)を生成することを目的としている。
既存のディープラーニングベースの手法は、多くのトレーニングペアに依存するため、適していない。
最適化対象にニューラルネットワークを導入することにより,ゼロショットパンスハーペン方式を提案する。
論文 参考訳(メタデータ) (2024-07-09T07:59:34Z) - Blind Image Super-resolution with Rich Texture-Aware Codebooks [12.608418657067947]
近年,高解像度 (HR) 再構成符号ブックに基づくブラインド超解像 (BSR) 法が有望な成果を上げている。
HR再構成に基づくコードブックは,低分解能(LR)画像とHR画像との複雑な相関を効果的に捉えることができない。
本稿では, 分解汚損防止用テクスチャ事前モジュール (DTPM) とパッチ対応テクスチャ先行モジュール (PTPM) から構成されるリッチテクスチャ対応コードブックベースネットワーク (RTCNet) を提案する。
論文 参考訳(メタデータ) (2023-10-26T07:00:18Z) - Recurrent Multi-scale Transformer for High-Resolution Salient Object
Detection [68.65338791283298]
Salient Object Detection (SOD) は、画像やビデオの中で最も顕著なオブジェクトを識別し、セグメント化することを目的としている。
従来のSOD法は主に解像度の低い画像に限られており、高分解能SODの開発に適応することが困難である。
本研究ではまず,2K-8K解像度で10,500個の高品質なアノテート画像を含む新しいHRS10Kデータセットを提案する。
論文 参考訳(メタデータ) (2023-08-07T17:49:04Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Deep Posterior Distribution-based Embedding for Hyperspectral Image
Super-resolution [75.24345439401166]
本稿では,高スペクトル画像の高次元空間スペクトル情報を効率的に効率的に埋め込む方法について述べる。
我々は,HS埋め込みを,慎重に定義されたHS埋め込みイベントの集合の後方分布の近似として定式化する。
そして,提案手法を物理的に解釈可能なソース一貫性超解像フレームワークに組み込む。
3つの一般的なベンチマークデータセットに対する実験により、PDE-Netは最先端の手法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2022-05-30T06:59:01Z) - Memory-augmented Deep Unfolding Network for Guided Image
Super-resolution [67.83489239124557]
誘導画像超解像(GISR)は、HR画像の誘導の下で低解像度(LR)目標画像の空間分解能を高めて高解像度(HR)目標画像を得る。
従来のモデルベース手法は主に画像全体を取り、HR目標画像とHRガイダンス画像との事前分布を仮定する。
HR目標画像上で2種類の事前性を持つGISRの最大後部(MAP)推定モデルを提案する。
論文 参考訳(メタデータ) (2022-02-12T15:37:13Z) - High-resolution Depth Maps Imaging via Attention-based Hierarchical
Multi-modal Fusion [84.24973877109181]
誘導DSRのための新しい注意に基づく階層型マルチモーダル融合ネットワークを提案する。
本手法は,再現精度,動作速度,メモリ効率の点で最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:28:33Z) - 3D Human Pose and Shape Regression with Pyramidal Mesh Alignment
Feedback Loop [128.07841893637337]
回帰に基づく手法は最近、単眼画像からヒトのメッシュを再構成する有望な結果を示した。
パラメータの小さな偏差は、推定メッシュと画像のエビデンスの間に顕著な不一致を引き起こす可能性がある。
本稿では,特徴ピラミッドを活用し,予測パラメータを補正するために,ピラミッドメッシュアライメントフィードバック(pymaf)ループを提案する。
論文 参考訳(メタデータ) (2021-03-30T17:07:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。