Fugu-MT 論文翻訳(概要): WavShadow: Wavelet Based Shadow Segmentation and Removal

論文の概要: WavShadow: Wavelet Based Shadow Segmentation and Removal

arxiv url: http://arxiv.org/abs/2411.05747v1
Date: Fri, 08 Nov 2024 18:08:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:45.836995
Title: WavShadow: Wavelet Based Shadow Segmentation and Removal
Title（参考訳）: WavShadow: Waveletベースのシャドウセグメンテーションと削除
Authors: Shreyans Jain, Aadya Arora, Viraj Vekaria, Karan Gandhi,
Abstract要約: 本研究では,Masked Autoencoder(MAE)とFast Fourier Convolution(FFC)ブロックを組み込むことで,ShadowFormerモデルを改善する新しい手法を提案する。 1)Places2データセットでトレーニングされたMAE事前情報の統合によるコンテキスト理解,(2)エッジ検出とマルチスケール解析のためのハールウェーブレット機能の導入,(3)ロバストシャドーセグメンテーションのための改良SAMアダプタの実装。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Shadow removal and segmentation remain challenging tasks in computer vision, particularly in complex real-world scenarios. This study presents a novel approach that enhances the ShadowFormer model by incorporating Masked Autoencoder (MAE) priors and Fast Fourier Convolution (FFC) blocks, leading to significantly faster convergence and improved performance. We introduce key innovations: (1) integration of MAE priors trained on Places2 dataset for better context understanding, (2) adoption of Haar wavelet features for enhanced edge detection and multi-scale analysis, and (3) implementation of a modified SAM Adapter for robust shadow segmentation. Extensive experiments on the challenging DESOBA dataset demonstrate that our approach achieves state-of-the-art results, with notable improvements in both convergence speed and shadow removal quality.
Abstract（参考訳）: シャドウ除去とセグメンテーションはコンピュータビジョン、特に複雑な現実世界のシナリオにおいて難しい課題である。本研究では,Masked Autoencoder (MAE) とFFC (Fast Fourier Convolution) ブロックを組み込んだシャドウホルダーモデルを提案する。 1)Places2データセットでトレーニングされたMAE事前情報の統合によるコンテキスト理解,(2)エッジ検出とマルチスケール解析のためのハールウェーブレット機能の導入,(3)ロバストシャドーセグメンテーションのための改良SAMアダプタの実装。挑戦的なDESOBAデータセットに関する大規模な実験により、我々のアプローチは、収束速度とシャドウ除去品質の両方において顕著に改善され、最先端の結果が得られることを示した。

関連論文リスト

RobustSplat++: Decoupling Densification, Dynamics, and Illumination for In-the-Wild 3DGS [85.90134051583368]
3D Gaussian Splatting (3DGS)は、新しいビュー合成と3Dモデリングにおけるリアルタイム、フォトリアリスティックレンダリングにおいて大きな注目を集めている。既存の手法は、過渡的な物体や照度の影響を受けやすいシーンを正確にモデル化するのに苦労する。いくつかの重要な設計に基づく堅牢なソリューションであるRobustSplat++を提案する。
論文参考訳（メタデータ） (2025-12-04T14:05:09Z)
EGSA-PT:Edge-Guided Spatial Attention with Progressive Training for Monocular Depth Estimation and Segmentation of Transparent Objects [3.6327828943194937]
本稿では,破壊的相互作用を緩和する融合機構であるエッジガイド空間注意(EGSA)を紹介する。 Syn-TODDとClearPoseのベンチマークでは、EGSAはアートメソッドの現在の状態よりも深度精度を一貫して改善した。第2のコントリビューションはマルチモーダルなプログレッシブトレーニング戦略であり,RGB画像から得られたエッジから予測深度画像からのエッジへの学習移行を行う。
論文参考訳（メタデータ） (2025-11-18T23:29:20Z)
RobustSplat: Decoupling Densification and Dynamics for Transient-Free 3DGS [79.15416002879239]
3D Gaussian Splattingは、ノベルビュー合成と3Dモデリングにおけるリアルタイム、フォトリアリスティックレンダリングにおいて大きな注目を集めている。既存の手法は、過渡的なオブジェクトに影響されたシーンを正確にモデル化するのに苦労し、描画された画像のアーティファクトに繋がる。 2つの重要な設計に基づく堅牢なソリューションであるRobustSplatを提案する。
論文参考訳（メタデータ） (2025-06-03T11:13:48Z)
Retinex-guided Histogram Transformer for Mask-free Shadow Removal [12.962534359029103]
ReHiTは、Retinex理論でガイドされたハイブリッドCNN-Transformerアーキテクチャに基づく、効率的なマスクフリーのシャドウ除去フレームワークである。提案手法は,最少パラメータの1つと最上位エントリ間の高速推論速度で競合する結果を提供する。
論文参考訳（メタデータ） (2025-04-18T22:19:40Z)
CFMD: Dynamic Cross-layer Feature Fusion for Salient Object Detection [7.262250906929891]
クロス層機能ピラミッドネットワーク(CFPN)は,多層機能融合と境界詳細保存において顕著な進歩を遂げている。これらの課題に対処するために,CFMDという,2つの重要なイノベーションを取り入れた,新しいクロスレイヤ機能ピラミッドネットワークを提案する。まず,現在最先端のMambaアーキテクチャを組み込んで動的重み分布機構を構築するコンテキスト認識機能集約モジュール(CFLMA)を設計する。第2に,分解能回復時に空間的詳細を保存する適応動的アップサンプリングユニット(CFLMD)を導入する。
論文参考訳（メタデータ） (2025-04-02T03:22:36Z)
Hybrid Multi-Stage Learning Framework for Edge Detection: A Survey [0.0]
本稿では,CNN(Convolutional Neural Network)機能抽出とSVM(Support Vector Machine)を統合したハイブリッド多段階学習フレームワークを提案する。提案手法は特徴表現と分類段階を分離し,堅牢性と解釈可能性を向上させる。
論文参考訳（メタデータ） (2025-03-26T13:06:31Z)
ShadowMamba: State-Space Model with Boundary-Region Selective Scan for Shadow Removal [3.5734732877967392]
本稿では,シャドウ除去用に設計された最初のマンバモデルであるShadowMambaを提案する。実験の結果,提案手法はAISTD, ISTD, SRDデータセットにおいて, 従来の主流手法よりも優れていることがわかった。
論文参考訳（メタデータ） (2024-11-05T16:59:06Z)
MCGS: Multiview Consistency Enhancement for Sparse-View 3D Gaussian Radiance Fields [73.49548565633123]
3Dガウシアンによって表現される放射場は、高いトレーニング効率と高速レンダリングの両方を提供する、新しいビューの合成に優れている。既存の手法では、高密度推定ネットワークからの奥行き先を組み込むことが多いが、入力画像に固有の多視点一貫性を見落としている。本稿では,3次元ガウス・スプレイティング(MCGS)に基づくビュー・フレームワークを提案し,スパークス・インプット・ビューからシーンを再構築する。
論文参考訳（メタデータ） (2024-10-15T08:39:05Z)
SwinShadow: Shifted Window for Ambiguous Adjacent Shadow Detection [90.4751446041017]
スウィンシャドウ(SwinShadow)は、隣接する影を検出するための強力なシフトウインドウ機構をフル活用したトランスフォーマーベースのアーキテクチャである。プロセス全体は、エンコーダ、デコーダ、機能統合の3つの部分に分けられる。 SBU, UCF, ISTDの3つのシャドウ検出ベンチマークデータセットの実験により, ネットワークがバランスエラー率(BER)の点で優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2024-08-07T03:16:33Z)
A Two-Stage Progressive Pre-training using Multi-Modal Contrastive Masked Autoencoders [5.069884983892437]
本稿では,RGB-Dデータセットを利用した画像理解タスクのプログレッシブ事前学習手法を提案する。第一段階では、コントラスト学習を用いてモデルを事前学習し、クロスモーダル表現を学習する。第2段階では、マスク付きオートエンコーディングと雑音予測を用いてモデルをさらに事前訓練する。我々のアプローチはスケーラブルで堅牢で、RGB-Dデータセットを事前学習するのに適しています。
論文参考訳（メタデータ） (2024-08-05T05:33:59Z)
S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠であるこれまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-22T11:40:49Z)
Progressive Recurrent Network for Shadow Removal [99.1928825224358]
シングルイメージのシャドー削除は、まだ解決されていない重要なタスクである。既存のディープラーニングベースのアプローチのほとんどは、シャドウを直接削除しようとするが、シャドウをうまく扱えない。本稿では,影を段階的に除去する簡易かつ効果的なプログレッシブ・リカレント・ネットワーク(PRNet)を提案する。
論文参考訳（メタデータ） (2023-11-01T11:42:45Z)
Deshadow-Anything: When Segment Anything Model Meets Zero-shot shadow removal [8.555176637147648]
画像シャドー除去を実現するために,大規模データセットの一般化を考慮したDeshadow-Anythingを開発した。拡散モデルは画像の端やテクスチャに沿って拡散し、画像の詳細を保存しながら影を取り除くのに役立つ。シャドウ除去タスクの実験では、これらの手法が画像復元性能を効果的に向上できることが示されている。
論文参考訳（メタデータ） (2023-09-21T01:35:13Z)
Revisiting the Encoding of Satellite Image Time Series [2.5874041837241304]
画像時系列(SITS)時間学習は、高時間分解能と不規則な取得時間のために複雑である。我々は、クエリベースのトランスフォーマーデコーダを採用する最近のトレンドに触発されて、直接セット予測問題としてSITS処理の新たな視点を開発する。衛星PASTISベンチマークデータセットを用いて,SOTA(State-of-the-art)の新たな結果を得た。
論文参考訳（メタデータ） (2023-05-03T12:44:20Z)
SatMAE: Pre-training Transformers for Temporal and Multi-Spectral Satellite Imagery [74.82821342249039]
Masked Autoencoder(MAE)に基づく時間・マルチスペクトル衛星画像の事前学習フレームワークであるSatMAEについて述べる。時間的情報を活用するために、時間にわたって画像パッチを個別にマスキングする時間的埋め込みを含む。
論文参考訳（メタデータ） (2022-07-17T01:35:29Z)
Synthetic Convolutional Features for Improved Semantic Segmentation [139.5772851285601]
本稿では、中間畳み込み特徴を生成することを提案し、そのような中間畳み込み特徴に対応する最初の合成手法を提案する。これにより、ラベルマスクから新機能を生成し、トレーニング手順にうまく組み込むことができます。 Cityscapes と ADE20K の2つの挑戦的なデータセットに関する実験結果と分析により,生成した特徴がセグメンテーションタスクのパフォーマンスを向上させることが示された。
論文参考訳（メタデータ） (2020-09-18T14:12:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。