論文の概要: Multi-scale interaction network for stereo image super-resolution
- arxiv url: http://arxiv.org/abs/2605.21913v1
- Date: Thu, 21 May 2026 02:35:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.060294
- Title: Multi-scale interaction network for stereo image super-resolution
- Title(参考訳): ステレオ画像超解像のためのマルチスケールインタラクションネットワーク
- Authors: Liyi Xu, Lin Qi,
- Abstract要約: ステレオ画像超解像は、双眼鏡システムからの補完情報を活用することで高解像度画像を生成することを目的としている。
これまでの研究は目覚ましい成果を上げてきたが、ビュー内情報やクロスビュー情報の可能性は十分に活用されていない。
ステレオ画像超解像のための新しいマルチスケールインタラクションネットワークを提案する。
- 参考スコア(独自算出の注目度): 3.1862263114265694
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stereo image super-resolution aims to generate high-resolution images by leveraging complementary information from binocular systems. Although previous studies have achieved impressive results, the potential of intra-view and cross-view information has not been fully exploited. To address this issue, we propose a novel multi-scale interaction network for stereo image super-resolution. Specifically, we design a Multi-scale Spatial-Channel Attention Module that utilizes multi-scale large separable kernel attention and simple channel attention to improve intra-view feature extraction. Additionally, we propose a Dual-View Epipolar Attention Module, utilizing an optimal transport algorithm to achieve more accurate matching along the epipolar line. Extensive experimental and ablation studies show that our method achieves competitive results that outperform most SOTA methods.
- Abstract(参考訳): ステレオ画像超解像は、双眼鏡システムからの補完情報を活用することで高解像度画像を生成することを目的としている。
これまでの研究は目覚ましい成果を上げてきたが、ビュー内情報やクロスビュー情報の可能性は完全には活用されていない。
この問題に対処するために,ステレオ画像超解像のための新しいマルチスケールインタラクションネットワークを提案する。
具体的には,マルチスケールの大規模分離可能なカーネルアテンションと簡易なチャネルアテンションを利用して,ビュー内特徴抽出を改善するマルチスケール空間チャネルアテンションモジュールを設計する。
さらに, 最適輸送アルゴリズムを用いて, エピポーラ線に沿ったより正確なマッチングを実現するDual-View Epipolar Attention Moduleを提案する。
大規模な実験およびアブレーション研究により,SOTA法よりも優れた競争結果が得られた。
関連論文リスト
- StereoINR: Cross-View Geometry Consistent Stereo Super Resolution with Implicit Neural Representation [15.167871410210353]
ステレオ・イメージ・スーパーレゾリューション(SSR)はステレオ・イメージ・ペアからの情報を活用することで高解像度の細部を強化することを目的としている。
従来のアップサンプリング手法では、コンボリューションを使用して異なるビューの深い特徴を独立に処理し、クロスビューや非ローカルな情報知覚を欠いている。
本稿ではステレオ画像対を連続的な暗黙的表現として革新的にモデル化するステレオインプリシットニューラル表現(StereoINR)を提案する。
この連続表現はスケールの制限を突破し、任意のスケールのステレオ超解像再構成のための統一的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-05-07T08:30:45Z) - MEAT: Multiview Diffusion Model for Human Generation on Megapixels with Mesh Attention [83.56588173102594]
1024x1024解像度でのトレーニングを可能にするメッシュアテンションというソリューションを導入しました。
このアプローチは、クロスビュー一貫性を維持しながら、マルチビューアテンションの複雑さを著しく低減します。
この基盤の上にメッシュアテンションブロックを設計し、キーポイント条件付けと組み合わせて、人間固有のマルチビュー拡散モデルMEATを作成します。
論文 参考訳(メタデータ) (2025-03-11T17:50:59Z) - Era3D: High-Resolution Multiview Diffusion using Efficient Row-wise Attention [87.02613021058484]
単一視点画像から高解像度のマルチビュー画像を生成する新しい多視点拡散法であるEra3Dを紹介する。
Era3Dは、最大512*512の解像度で高品質なマルチビュー画像を生成し、複雑さを12倍に削減する。
論文 参考訳(メタデータ) (2024-05-19T17:13:16Z) - Multi-view Aggregation Network for Dichotomous Image Segmentation [76.75904424539543]
Dichotomous Image (DIS) は近年,高解像度自然画像からの高精度物体分割に向けて出現している。
既存の手法は、グローバルなローカライゼーションと局所的な洗練を徐々に完了させるために、退屈な複数のエンコーダ・デコーダストリームとステージに依存している。
これに触発されて、我々は多視点オブジェクト認識問題としてdisをモデル化し、擬似多視点アグリゲーションネットワーク(MVANet)を提供する。
一般的なdis-5Kデータセットの実験では、我々のMVANetは精度と速度の両方で最先端の手法を大きく上回っている。
論文 参考訳(メタデータ) (2024-04-11T03:00:00Z) - Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.110544509099526]
ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。
ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。
主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文 参考訳(メタデータ) (2024-03-15T07:18:43Z) - Multi-Spectral Image Stitching via Spatial Graph Reasoning [52.27796682972484]
空間グラフ推論に基づくマルチスペクトル画像縫合法を提案する。
同一のビュー位置から複数スケールの補完機能をノードに埋め込む。
空間的・チャネル的次元に沿った長距離コヒーレンスを導入することにより、画素関係の相補性とチャネル相互依存性は、整列したマルチビュー特徴の再構築に寄与する。
論文 参考訳(メタデータ) (2023-07-31T15:04:52Z) - Cross-View Hierarchy Network for Stereo Image Super-Resolution [14.574538513341277]
ステレオ画像スーパーレゾリューションは、ビュー間の相補的な情報を活用することにより、高解像度ステレオ画像ペアの品質を向上させることを目的としている。
ステレオ画像超解法(CVHSSR)のためのクロスビュー階層ネットワーク(Cross-View-Hierarchy Network)という新しい手法を提案する。
CVHSSRは、パラメータを減らしながら、他の最先端手法よりも最高のステレオ画像超解像性能を達成する。
論文 参考訳(メタデータ) (2023-04-13T03:11:30Z) - Cross-MPI: Cross-scale Stereo for Image Super-Resolution using
Multiplane Images [44.85260985973405]
Cross-MPIは、新しい平面対応MPI機構、マルチスケールガイドアップサンプリングモジュール、超高分解能合成・融合モジュールからなるエンドツーエンドのRefSRネットワークである。
デジタル合成および光ズームクロススケールデータによる実験結果から,Cross-MPIフレームワークは既存のRefSR手法よりも優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2020-11-30T09:14:07Z) - Multi-image Super Resolution of Remotely Sensed Images using Residual
Feature Attention Deep Neural Networks [1.3764085113103222]
本研究は,マルチイメージ超解像課題に効果的に取り組む新しい残像注意モデル(RAMS)を提案する。
本研究では,3次元畳み込みによる視覚特徴の注意機構を導入し,意識的なデータ融合と情報抽出を実現する。
我々の表現学習ネットワークは、冗長な低周波信号を流すためにネストした残差接続を広範囲に利用している。
論文 参考訳(メタデータ) (2020-07-06T22:54:02Z) - Learning Enriched Features for Real Image Restoration and Enhancement [166.17296369600774]
畳み込みニューラルネットワーク(CNN)は、画像復元作業における従来のアプローチよりも劇的に改善されている。
ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とした,新しいアーキテクチャを提案する。
提案手法は,高解像度の空間的詳細を同時に保存しながら,複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
論文 参考訳(メタデータ) (2020-03-15T11:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。