論文の概要: SDI-Net: Toward Sufficient Dual-View Interaction for Low-light Stereo Image Enhancement
- arxiv url: http://arxiv.org/abs/2408.10934v1
- Date: Tue, 20 Aug 2024 15:17:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-21 13:05:41.890046
- Title: SDI-Net: Toward Sufficient Dual-View Interaction for Low-light Stereo Image Enhancement
- Title(参考訳): SDI-Net:低照度ステレオ画像強調のための効果的なデュアルビューインタラクションを目指して
- Authors: Linlin Hu, Ao Sun, Shijie Hao, Richang Hong, Meng Wang,
- Abstract要約: たいていの低照度画像強調法は、単一の視点からの情報しか考慮しない。
低照度ステレオ画像強調のための2次元2次元対話モデルを提案する。
我々は、注意機構を介して両眼の視線間の相関を完全に活用することを目的とした、CSIM(Cross-View Sufficient Interaction Module)と呼ばれるモジュールを設計する。
- 参考スコア(独自算出の注目度): 38.66838623890922
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Currently, most low-light image enhancement methods only consider information from a single view, neglecting the correlation between cross-view information. Therefore, the enhancement results produced by these methods are often unsatisfactory. In this context, there have been efforts to develop methods specifically for low-light stereo image enhancement. These methods take into account the cross-view disparities and enable interaction between the left and right views, leading to improved performance. However, these methods still do not fully exploit the interaction between left and right view information. To address this issue, we propose a model called Toward Sufficient Dual-View Interaction for Low-light Stereo Image Enhancement (SDI-Net). The backbone structure of SDI-Net is two encoder-decoder pairs, which are used to learn the mapping function from low-light images to normal-light images. Among the encoders and the decoders, we design a module named Cross-View Sufficient Interaction Module (CSIM), aiming to fully exploit the correlations between the binocular views via the attention mechanism. The quantitative and visual results on public datasets validate the superiority of our method over other related methods. Ablation studies also demonstrate the effectiveness of the key elements in our model.
- Abstract(参考訳): 現在、ほとんどの低照度画像強調法は、視線情報の相互関係を無視して、単一の視点からの情報のみを考慮している。
したがって、これらの手法による強化結果は、しばしば不満足である。
この文脈では、低照度ステレオ画像強調のための方法の開発が試みられている。
これらのメソッドは、ビュー間の格差を考慮して、左右のビュー間の相互作用を可能にし、パフォーマンスを向上させる。
しかし、これらの手法はいまだに、左右のビュー情報間の相互作用を完全に活用していない。
この問題に対処するため,低照度ステレオ画像強調(SDI-Net)のための2次元対話のためのモデルを提案する。
SDI-Netのバックボーン構造は2つのエンコーダとデコーダのペアであり、低照度画像から通常照度画像へのマッピング関数の学習に使用される。
エンコーダとデコーダのうち,注目機構を介して両眼視の相関関係をフル活用することを目的として,クロスビュー・サフィシエント・インタラクション・モジュール (CSIM) というモジュールを設計した。
公開データセットの定量的および視覚的結果は,他の関連手法に比べて,本手法の優位性を検証した。
アブレーション研究は、我々のモデルにおける重要な要素の有効性も示している。
関連論文リスト
- RCNet: Deep Recurrent Collaborative Network for Multi-View Low-Light Image Enhancement [19.751696790765635]
マルチビュー低照度画像の高精細化について検討する。
Recurrent Collaborative Network (RCNet) に基づく深層多視点化フレームワークを提案する。
実験の結果,我々のRCNetは,他の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-09-06T15:49:49Z) - Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - Chain-of-Spot: Interactive Reasoning Improves Large Vision-Language Models [81.71651422951074]
CoS(Chain-of-Spot)法は,注目領域に着目して特徴抽出を強化する手法である。
この技術により、LVLMは元の画像解像度を変更することなく、より詳細な視覚情報にアクセスすることができる。
実験の結果,LVLMの視覚的内容の理解と推論能力は著しく改善した。
論文 参考訳(メタデータ) (2024-03-19T17:59:52Z) - Low-light Stereo Image Enhancement and De-noising in the Low-frequency
Information Enhanced Image Space [5.1569866461097185]
同時に高音化・低音化を行う手法が提案されている。
低周波情報拡張モジュール (IEM) は雑音を抑え, 新たな画像空間を創出するために提案される。
長距離空間依存を符号化するために,チャネル間および空間コンテキスト情報マイニングモジュール(CSM)を提案する。
エンコーダ-デコーダ構造が構築され、クロスビューとクロススケールな特徴相互作用が組み込まれている。
論文 参考訳(メタデータ) (2024-01-15T15:03:32Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - Cross-View Hierarchy Network for Stereo Image Super-Resolution [14.574538513341277]
ステレオ画像スーパーレゾリューションは、ビュー間の相補的な情報を活用することにより、高解像度ステレオ画像ペアの品質を向上させることを目的としている。
ステレオ画像超解法(CVHSSR)のためのクロスビュー階層ネットワーク(Cross-View-Hierarchy Network)という新しい手法を提案する。
CVHSSRは、パラメータを減らしながら、他の最先端手法よりも最高のステレオ画像超解像性能を達成する。
論文 参考訳(メタデータ) (2023-04-13T03:11:30Z) - SufrinNet: Toward Sufficient Cross-View Interaction for Stereo Image
Enhancement in The Dark [119.01585302856103]
低照度ステレオ画像強調(LLSIE)は、暗黒環境で撮影された視覚的に不快なステレオ画像の品質を高めるための比較的新しいタスクである。
1)クロスビューの相互作用が不十分なこと,2)ビュー内学習に長距離依存が欠如していること,である。
SufrinNet(SufrinNet)を用いた新しいLLSIEモデルを提案する。
論文 参考訳(メタデータ) (2022-11-02T04:01:30Z) - COTS: Collaborative Two-Stream Vision-Language Pre-Training Model for
Cross-Modal Retrieval [59.15034487974549]
画像テキスト検索のための新しいコラボレーティブな2ストリームビジョン言語事前学習モデルCOTSを提案する。
我々のCOTSは,2ストリーム方式の中で最も高い性能を達成し,推論の速度は10,800倍に向上した。
重要なことは、我々のCOTSはテキストからビデオへの検索にも適用でき、広く使われているMSR-VTTデータセットに新たな最先端技術をもたらすことである。
論文 参考訳(メタデータ) (2022-04-15T12:34:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。