Fugu-MT 論文翻訳(概要): Local-Global Temporal Difference Learning for Satellite Video Super-Resolution

論文の概要: Local-Global Temporal Difference Learning for Satellite Video Super-Resolution

arxiv url: http://arxiv.org/abs/2304.04421v3
Date: Sat, 26 Apr 2025 13:45:12 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-02 19:15:51.481098
Title: Local-Global Temporal Difference Learning for Satellite Video Super-Resolution
Title（参考訳）: 衛星ビデオ超解像のための局所的時間差学習
Authors: Yi Xiao, Qiangqiang Yuan, Kui Jiang, Xianyu Jin, Jiang He, Liangpei Zhang, Chia-Wen Lin,
Abstract要約: 本稿では,時間的差分を効果的かつ効果的な時間的補償に利用することを提案する。フレーム内における局所的・大域的時間的情報を完全に活用するために,短期・長期的時間的相違を体系的にモデル化した。 5つの主流ビデオ衛星に対して行われた厳密な客観的および主観的評価は、我々の手法が最先端のアプローチに対して好適に機能することを実証している。
参考スコア（独自算出の注目度）: 53.03380679343968
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Optical-flow-based and kernel-based approaches have been extensively explored for temporal compensation in satellite Video Super-Resolution (VSR). However, these techniques are less generalized in large-scale or complex scenarios, especially in satellite videos. In this paper, we propose to exploit the well-defined temporal difference for efficient and effective temporal compensation. To fully utilize the local and global temporal information within frames, we systematically modeled the short-term and long-term temporal discrepancies since we observed that these discrepancies offer distinct and mutually complementary properties. Specifically, we devise a Short-term Temporal Difference Module (S-TDM) to extract local motion representations from RGB difference maps between adjacent frames, which yields more clues for accurate texture representation. To explore the global dependency in the entire frame sequence, a Long-term Temporal Difference Module (L-TDM) is proposed, where the differences between forward and backward segments are incorporated and activated to guide the modulation of the temporal feature, leading to a holistic global compensation. Moreover, we further propose a Difference Compensation Unit (DCU) to enrich the interaction between the spatial distribution of the target frame and temporal compensated results, which helps maintain spatial consistency while refining the features to avoid misalignment. Rigorous objective and subjective evaluations conducted across five mainstream video satellites demonstrate that our method performs favorably against state-of-the-art approaches. Code will be available at https://github.com/XY-boy/LGTD
Abstract（参考訳）: 光フローベースおよびカーネルベースのアプローチは、衛星ビデオ超解法(VSR)における時間的補償のために広く研究されている。しかし、これらの手法は大規模または複雑なシナリオ、特に衛星ビデオでは一般化されていない。本稿では,時間的差分を効果的かつ効果的な時間的補償に利用することを提案する。フレーム内における局所的・大域的時間的情報を完全に活用するために,これらの相違が相互に相補的な特性をもたらすことを観察し,短期・長期的時間的相違を体系的にモデル化した。具体的には、隣接フレーム間のRGB差分マップから局所的な動き表現を抽出するための短期時間差分モジュール(S-TDM)を考案し、より正確なテクスチャ表現の手がかりを得る。フレームシーケンス全体におけるグローバルな依存性を探索するため,L-TDM(Long-term Temporal Difference Module)を提案する。さらに,目標フレームの空間分布と時間補償結果との相互作用を増強する差分補償ユニット(DCU)を提案する。 5つの主流ビデオ衛星に対して行われた厳密な客観的および主観的評価は、我々の手法が最先端のアプローチに対して好適に機能することを実証している。コードはhttps://github.com/XY-boy/LGTDで入手できる。

関連論文リスト

Rethinking Diffusion Model-Based Video Super-Resolution: Leveraging Dense Guidance from Aligned Features [51.5076190312734]
ビデオ超解法アプローチは、エラーの蓄積、空間的アーティファクト、知覚的品質と忠実さのトレードオフに悩まされる。ビデオ超解像(DGAF-VSR)に適した特徴を持つ新しい誘導拡散モデルを提案する。合成および実世界のデータセットの実験では、DGAF-VSRがVSRの重要な側面において最先端の手法を超越していることが示されている。
論文参考訳（メタデータ） (2025-11-21T03:40:45Z)
Towards Robust and Generalizable Continuous Space-Time Video Super-Resolution with Events [71.2439653098351]
連続時空ビデオスーパーSTVSRは、高解像度で高フレームのビデオを任意の時間スケールで再構成する能力への関心が高まっている。 EvEnhancerは、イベントストリームにカプセル化された高時間および高ダイナミックレンジのユニークな特性を結合する新しいアプローチである。提案手法は,OODスケールでの一般化性を維持しつつ,合成および実世界の両方のデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2025-10-04T15:23:07Z)
LiDAR-BIND-T: Improved and Temporally Consistent Sensor Modality Translation and Fusion for Robotic Applications [2.112132378217468]
本稿では,多元性センサ(レーダー,ソナー)をLiDAR定義潜在空間に結合するモジュール型マルチモーダル融合フレームワークLiDAR-BINDを拡張した。 i)連続的な潜伏表現を整列する時間的埋め込み類似性、(ii)予測と地上の真実のLiDARの変位に一致する動きに沿った変換損失、(iii)特別な時間的加群を用いた窓付き時間的融合、の3つの貢献を紹介する。
論文参考訳（メタデータ） (2025-09-06T14:21:27Z)
SpatioTemporal Difference Network for Video Depth Super-Resolution [21.706092326422255]
ビデオ深度超解像は、明らかに長い尾の分布の影響を受けている。本研究では,空間差分枝と時間差分枝の2つのコア分岐からなる新しい時空間差分ネットワーク(STDNet)を提案する。空間差分枝では,空間非平滑領域における長い尾の問題を緩和する空間差分機構を導入する。時間差分枝では、隣接するRGBおよび深度フレームから現在の深度フレームへの時間差情報を優先的に伝播する時間差分戦略を設計する。
論文参考訳（メタデータ） (2025-08-02T08:18:38Z)
OptiCorNet: Optimizing Sequence-Based Context Correlation for Visual Place Recognition [2.3093110834423616]
本稿では,新しいシーケンスモデリングフレームワークOptiCorNetを提案する。空間的特徴抽出と時間的差分を微分可能でエンドツーエンドのトレーニング可能なモジュールに統一する。本手法は,季節的・視点的な変化に挑戦し,最先端のベースラインよりも優れる。
論文参考訳（メタデータ） (2025-07-19T04:29:43Z)
Multi-Modality Driven LoRA for Adverse Condition Depth Estimation [61.525312117638116]
逆条件深さ推定のためのMulti-Modality Driven LoRA(MMD-LoRA)を提案する。 Prompt Driven Domain Alignment (PDDA) と Visual-Text Consistent Contrastive Learning (VTCCL) の2つのコアコンポーネントで構成されている。 nuScenesとOxford RobotCarデータセットの最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2024-12-28T14:23:58Z)
Surgformer: Surgical Transformer with Hierarchical Temporal Attention for Surgical Phase Recognition [7.682613953680041]
本稿では,空間時間モデルと冗長性の問題に終末的に対処する手術用トランスフォーマー(サージフォーマー)を提案する。提案するサージフォーマーは,最先端の手法に対して良好に機能することを示す。
論文参考訳（メタデータ） (2024-08-07T16:16:31Z)
Collaborative Feedback Discriminative Propagation for Video Super-Resolution [66.61201445650323]
ビデオ超解像法(VSR)の主な成功は、主に空間情報と時間情報を探索することに由来する。不正確なアライメントは通常、重要なアーティファクトを備えたアライメント機能につながる。伝搬モジュールは同じタイムステップ機能のみを前方または後方に伝播する。
論文参考訳（メタデータ） (2024-04-06T22:08:20Z)
Continuous Space-Time Video Super-Resolution Utilizing Long-Range Temporal Information [48.20843501171717]
本稿では,任意のフレームレートと空間解像度に変換可能な連続ST-VSR(CSTVSR)手法を提案する。本稿では,提案アルゴリズムの柔軟性が向上し,各種データセットの性能が向上することを示す。
論文参考訳（メタデータ） (2023-02-26T08:02:39Z)
Temporal Consistency Learning of inter-frames for Video Super-Resolution [38.26035126565062]
ビデオ超解像(VSR)は、低解像度(LR)参照フレームと複数の隣接フレームから高解像度(HR)フレームを再構成することを目的としたタスクである。既存の手法は一般に情報伝達とフレームアライメントを探求し、VSRの性能を向上させる。本稿では,再建されたビデオの一貫性を高めるため,VSRのための時間一貫性学習ネットワーク(TCNet)を提案する。
論文参考訳（メタデータ） (2022-11-03T08:23:57Z)
Enhancing Space-time Video Super-resolution via Spatial-temporal Feature Interaction [9.456643513690633]
時空ビデオ超解像(STVSR)の目的は、ビデオのフレームレートと空間解像度の両方を増加させることである。近年のアプローチでは、エンドツーエンドのディープニューラルネットワークを用いてSTVSRを解く。本研究では,空間的・時間的相関を利用してSTVSRを強化する空間的・時間的特徴相互作用ネットワークを提案する。
論文参考訳（メタデータ） (2022-07-18T22:10:57Z)
Distortion-Aware Network Pruning and Feature Reuse for Real-time Video Segmentation [49.17930380106643]
本稿では,リアルタイム視覚タスクのスキップ接続によるアーキテクチャの高速化を目的とした新しいフレームワークを提案する。具体的には、各フレームの到着時に、前のフレームから特徴を変換し、特定の空間的ビンで再利用する。次に、現在のフレームの領域におけるバックボーンネットワークの部分計算を行い、現在のフレームと前のフレームの時間差をキャプチャする。
論文参考訳（メタデータ） (2022-06-20T07:20:02Z)
Look Back and Forth: Video Super-Resolution with Explicit Temporal Difference Modeling [105.69197687940505]
本稿では,LR空間とHR空間における時間差の明示的モデル化の役割について検討する。超解像結果をさらに高めるために、空間残留特徴を抽出するだけでなく、高周波領域における連続フレーム間の差も計算する。
論文参考訳（メタデータ） (2022-04-14T17:07:33Z)
Confidence-guided Adaptive Gate and Dual Differential Enhancement for Video Salient Object Detection [47.68968739917077]
ビデオサルエント物体検出(VSOD)は、ビデオシーケンスに隠された空間的手がかりと時間的手がかりの両方を活用することにより、最も魅力的な物体の探索と分割を目的としている。信頼性誘導適応ゲート(CAG)モジュールとデュアルディファレンシャルエンハンスメント(DDE)モジュールを含む空間的および時間的キューから利用可能な情報を適応的にキャプチャする新しいフレームワークを提案する。
論文参考訳（メタデータ） (2021-05-14T08:49:37Z)
Exploring Rich and Efficient Spatial Temporal Interactions for Real Time Video Salient Object Detection [87.32774157186412]
メインストリーム方式は、主に2つの独立した場所、すなわち空間的分岐と時間的分岐からビデオ・サリエンシを定式化する。本稿では,このような改善を実現するための時間的ネットワークを提案する。提案手法は実装が簡単で,50FPSで高精細度をリアルタイムに検出できる。
論文参考訳（メタデータ） (2020-08-07T03:24:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。