論文の概要: Self-Gated Memory Recurrent Network for Efficient Scalable HDR
Deghosting
- arxiv url: http://arxiv.org/abs/2112.13050v1
- Date: Fri, 24 Dec 2021 12:36:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-12-29 13:54:52.691704
- Title: Self-Gated Memory Recurrent Network for Efficient Scalable HDR
Deghosting
- Title(参考訳): 高速スケーラブルHDRデゴーストリングのための自己ゲートメモリリカレントネットワーク
- Authors: K. Ram Prabhakar, Susmit Agrawal, R. Venkatesh Babu
- Abstract要約: 本稿では,任意の長さの動的シーケンスを浮き彫りにする新しいネットワーク型HDRデゴースト法を提案する。
本稿では,SGM(Self-Gated Memory)セルという新たなリカレントセルアーキテクチャを導入する。
提案手法は,既存の3つの公開データセットを定量的に比較して,最先端の性能を実現する。
- 参考スコア(独自算出の注目度): 59.04604001936661
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel recurrent network-based HDR deghosting method for fusing
arbitrary length dynamic sequences. The proposed method uses convolutional and
recurrent architectures to generate visually pleasing, ghosting-free HDR
images. We introduce a new recurrent cell architecture, namely Self-Gated
Memory (SGM) cell, that outperforms the standard LSTM cell while containing
fewer parameters and having faster running times. In the SGM cell, the
information flow through a gate is controlled by multiplying the gate's output
by a function of itself. Additionally, we use two SGM cells in a bidirectional
setting to improve output quality. The proposed approach achieves
state-of-the-art performance compared to existing HDR deghosting methods
quantitatively across three publicly available datasets while simultaneously
achieving scalability to fuse variable-length input sequence without
necessitating re-training. Through extensive ablations, we demonstrate the
importance of individual components in our proposed approach. The code is
available at https://val.cds.iisc.ac.in/HDR/HDRRNN/index.html.
- Abstract(参考訳): 任意の長さの動的シーケンスを融合する新しいリカレントネットワーク型hdrデガホスト方式を提案する。
提案手法は畳み込み型および再帰型アーキテクチャを用いて視覚的にゴーストフリーなhdr画像を生成する。
我々は,標準lstmセルよりも少ないパラメータを持ち,高速な実行時間を有する新しいリカレントセルアーキテクチャ,すなわち自己制御メモリ(sgm)セルを導入する。
sgmセルでは、ゲートを流れる情報の流れは、ゲートの出力に自身の関数を乗じることで制御される。
さらに、2つのSGMセルを双方向設定で使用し、出力品質を向上する。
提案手法は,既存のhdrデガホスト法と比較して,3つの公開データセットを定量的に分離すると同時に,可変長入力シーケンスを再トレーニングすることなく融合する拡張性を実現する。
広範なアブレーションにより,提案手法における個々の成分の重要性を実証する。
コードはhttps://val.cds.iisc.ac.in/hdr/hdrrnn/index.htmlで入手できる。
関連論文リスト
- Pixel to Gaussian: Ultra-Fast Continuous Super-Resolution with 2D Gaussian Modeling [50.34513854725803]
Arbitrary-scale Super- resolution (ASSR) は、低解像度(LR)入力から任意のアップサンプリング係数で高解像度(HR)イメージを再構成することを目的としている。
本稿では,Gaussian Splattingを用いたLR画像から2次元連続HR信号を明示的に再構成する,Pixel-to-Gaussianパラダイムを用いた新しいContinuousSRフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-09T13:43:57Z) - Parallel Sequence Modeling via Generalized Spatial Propagation Network [80.66202109995726]
Generalized Spatial Propagation Network (GSPN)は、2次元空間構造を本質的にキャプチャする最適化された視覚タスクのための新しいアテンションメカニズムである。
GSPNは、空間的コヒーレントな画像データを直接操作し、ラインスキャンアプローチを通じて高密度なペアワイズ接続を形成することにより、制限を克服する。
GSPNは、ImageNet分類、クラス誘導画像生成、テキスト・ツー・イメージ生成などの視覚タスクにおいて、より優れた空間忠実性と最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-01-21T18:56:19Z) - SL$^{2}$A-INR: Single-Layer Learnable Activation for Implicit Neural Representation [6.572456394600755]
Inlicit Neural Representation (INR)は、ニューラルネットワークを利用して、座標入力を対応する属性に変換することで、視覚関連領域において大きな進歩をもたらした。
我々は,INRアーキテクチャに新しいアプローチを導入することで,これらの課題を緩和できることを示す。
具体的には,シングルレイヤの学習可能なアクティベーション関数と従来のReLUアクティベーションを用いた合成を組み合わせたハイブリッドネットワークSL$2$A-INRを提案する。
論文 参考訳(メタデータ) (2024-09-17T02:02:15Z) - SelfDRSC++: Self-Supervised Learning for Dual Reversed Rolling Shutter Correction [72.05587640928879]
二重反転RS歪み補正(SelfDRSC++)のための自己教師付き学習フレームワークを提案する。
双方向相関マッチングブロックを組み込んだ軽量DRSCネットワークを導入し,光学流の結合最適化とRS特性の補正を行う。
DRSCネットワークを効果的に訓練するために、入力と再構成された二重逆RS画像間のサイクル整合性を保証する自己教師付き学習戦略を提案する。
論文 参考訳(メタデータ) (2024-08-21T08:17:22Z) - MF-NeRF: Memory Efficient NeRF with Mixed-Feature Hash Table [62.164549651134465]
MF-NeRFは,Mixed-Featureハッシュテーブルを用いてメモリ効率を向上し,再構成品質を維持しながらトレーニング時間を短縮するメモリ効率の高いNeRFフレームワークである。
最新技術であるInstant-NGP、TensoRF、DVGOによる実験は、MF-NeRFが同じGPUハードウェア上で、同様のあるいはそれ以上のリコンストラクション品質で最速のトレーニング時間を達成できることを示唆している。
論文 参考訳(メタデータ) (2023-04-25T05:44:50Z) - Raising The Limit Of Image Rescaling Using Auxiliary Encoding [7.9700865143145485]
近年、IRNのような画像再スケーリングモデルは、INNの双方向性を利用して、画像アップスケーリングのパフォーマンス限界を押し上げている。
本稿では,画像再スケーリング性能の限界をさらに押し上げるために,補助符号化モジュールを提案する。
論文 参考訳(メタデータ) (2023-03-12T20:49:07Z) - Super-Resolution Neural Operator [5.018040244860608]
本稿では,低分解能(LR)画像から任意のスケールで高分解能(HR)画像を分解できるフレームワークを提案する。
LR-HR画像対を異なる格子サイズで近似した連続関数として扱うことにより、SRNOは対応する関数空間間のマッピングを学習する。
実験により、SRNOは既存の連続SR法よりも精度と実行時間の両方で優れていることが示された。
論文 参考訳(メタデータ) (2023-03-05T06:17:43Z) - GLEAM: Greedy Learning for Large-Scale Accelerated MRI Reconstruction [50.248694764703714]
アンロールされたニューラルネットワークは、最近最先端の加速MRI再構成を達成した。
これらのネットワークは、物理ベースの一貫性とニューラルネットワークベースの正規化を交互に組み合わせることで、反復最適化アルゴリズムをアンロールする。
我々は,高次元画像設定のための効率的なトレーニング戦略である加速度MRI再構成のためのグレディ・ラーニングを提案する。
論文 参考訳(メタデータ) (2022-07-18T06:01:29Z) - Hypercomplex Image-to-Image Translation [13.483068375377362]
画像から画像への変換(I2I)は、コンテンツ表現を入力ドメインから出力ドメインに転送することを目的としている。
この課題で卓越した結果を得た最近のI2I生成モデルは、それぞれ数千万のパラメータを持つ多様な深層ネットワークで構成されている。
画像次元間の既往の関係を保存できる軽量I2I生成モデルを定義するために,超複素代数特性を活用することを提案する。
論文 参考訳(メタデータ) (2022-05-04T14:28:50Z) - Efficient Re-parameterization Residual Attention Network For
Nonhomogeneous Image Dehazing [4.723586858098229]
ERRA-Netは1200x1600のHD画質の画像を平均166.11 fpsで処理する。
我々は, ステップ毎に高周波特徴を抽出するために, カスケードMAブロックを用い, 多層アテンション融合テールは, モデルの浅部と深部を結合してクリーン画像の残像を得る。
論文 参考訳(メタデータ) (2021-09-12T10:03:44Z) - MFGNet: Dynamic Modality-Aware Filter Generation for RGB-T Tracking [72.65494220685525]
可視データと熱データ間のメッセージ通信を促進するために,新しい動的モダリティ対応フィルタ生成モジュール(MFGNet)を提案する。
我々は、2つの独立ネットワークを持つ動的モダリティ対応フィルタを生成し、その可視フィルタとサーマルフィルタをそれぞれ、対応する入力特徴写像上で動的畳み込み演算を行う。
重閉塞,高速移動,外見による問題に対処するため,新たな方向認識型目標誘導型アテンション機構を活用することで,共同で局所的・グローバル検索を行うことを提案する。
論文 参考訳(メタデータ) (2021-07-22T03:10:51Z) - Efficient Two-Stream Network for Violence Detection Using Separable
Convolutional LSTM [0.0]
Separable Convolutional LSTM(SepConvLSTM)と予め訓練されたMobileNetを活用した効率的な2ストリームディープラーニングアーキテクチャを提案する。
SepConvLSTMは、ConvLSTMの各ゲートの畳み込み操作を深さ方向に分離可能な畳み込みに置き換えて構築されます。
我々のモデルは、大きくて挑戦的なrwf-2000データセットの精度を2%以上上回っている。
論文 参考訳(メタデータ) (2021-02-21T12:01:48Z) - Self Sparse Generative Adversarial Networks [73.590634413751]
GAN(Generative Adversarial Networks)は、敵対的トレーニングを通じてデータ分布を学習する監視されていない生成モデルである。
本論文では,パラメータ空間を小さくし,ゼロ勾配問題を軽減するSelf Sparse Generative Adversarial Network (Self-Sparse GAN)を提案する。
論文 参考訳(メタデータ) (2021-01-26T04:49:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。