論文の概要: Permutation invariance and uncertainty in multitemporal image
super-resolution
- arxiv url: http://arxiv.org/abs/2105.12409v1
- Date: Wed, 26 May 2021 09:03:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 21:58:32.062267
- Title: Permutation invariance and uncertainty in multitemporal image
super-resolution
- Title(参考訳): 多時間画像超解像における置換不変性と不確かさ
- Authors: Diego Valsesia, Enrico Magli
- Abstract要約: 時間的置換に完全に不変なモデルの構築は、パフォーマンスとデータ効率を著しく向上させることを示す。
本研究では,不確実性が時系列の時間的変動とどのように相関するかを示し,その定量化によってモデル性能がさらに向上することを示す。
- 参考スコア(独自算出の注目度): 37.651800198412886
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances have shown how deep neural networks can be extremely
effective at super-resolving remote sensing imagery, starting from a
multitemporal collection of low-resolution images. However, existing models
have neglected the issue of temporal permutation, whereby the temporal ordering
of the input images does not carry any relevant information for the
super-resolution task and causes such models to be inefficient with the, often
scarce, ground truth data that available for training. Thus, models ought not
to learn feature extractors that rely on temporal ordering. In this paper, we
show how building a model that is fully invariant to temporal permutation
significantly improves performance and data efficiency. Moreover, we study how
to quantify the uncertainty of the super-resolved image so that the final user
is informed on the local quality of the product. We show how uncertainty
correlates with temporal variation in the series, and how quantifying it
further improves model performance. Experiments on the Proba-V challenge
dataset show significant improvements over the state of the art without the
need for self-ensembling, as well as improved data efficiency, reaching the
performance of the challenge winner with just 25% of the training data.
- Abstract(参考訳): 近年の進歩は、低解像度画像の多時間収集から始まり、深層ニューラルネットワークがリモートセンシング画像の超解像に極めて効果的であることを示している。
しかし、既存のモデルは時間的置換の問題を無視しており、入力画像の時間的順序付けはスーパーレゾリューションタスクに関連する情報を持ち合わせておらず、訓練で利用可能な(しばしば不足している)基礎的真理データと非効率に陥る。
したがって、モデルは時間的順序に依存する特徴抽出器を学ぶべきではない。
本稿では,時間的置換に完全不変なモデルの構築が性能とデータ効率を著しく改善することを示す。
さらに,超解像の不確かさを定量化して,最終ユーザが製品の局所的な品質を知らせる方法について検討する。
本研究では,不確実性が時系列の時間的変動とどのように相関するかを示す。
proba-vチャレンジデータセットにおける実験は、自己センシングを必要とせず、技術の状況よりも大幅に改善され、データ効率が向上し、トレーニングデータのわずか25%でチャレンジ勝者のパフォーマンスに到達した。
関連論文リスト
- Time Step Generating: A Universal Synthesized Deepfake Image Detector [0.4488895231267077]
汎用合成画像検出器 Time Step Generating (TSG) を提案する。
TSGは、事前訓練されたモデルの再構築能力、特定のデータセット、サンプリングアルゴリズムに依存していない。
我々は,提案したTSGを大規模GenImageベンチマークで検証し,精度と一般化性の両方において大幅な改善を実現した。
論文 参考訳(メタデータ) (2024-11-17T09:39:50Z) - Training-Free Time-Series Anomaly Detection: Leveraging Image Foundation Models [0.0]
画像ベースでトレーニング不要な時系列異常検出(ITF-TAD)手法を提案する。
ITF-TADは、時系列データをウェーブレット変換を用いて画像に変換し、それらを単一の表現に圧縮し、画像基礎モデルを利用して異常検出を行う。
論文 参考訳(メタデータ) (2024-08-27T03:12:08Z) - TimeSieve: Extracting Temporal Dynamics through Information Bottlenecks [31.10683149519954]
本稿では,時系列予測モデルTimeSieveを提案する。
提案手法では、ウェーブレット変換を用いて時系列データを前処理し、マルチスケールの特徴を効果的にキャプチャする。
本研究は,時系列予測における課題に対処するためのアプローチの有効性を検証した。
論文 参考訳(メタデータ) (2024-06-07T15:58:12Z) - Combating Missing Modalities in Egocentric Videos at Test Time [92.38662956154256]
現実のアプリケーションは、プライバシの懸念、効率性の必要性、ハードウェアの問題により、不完全なモダリティを伴う問題に直面することが多い。
再トレーニングを必要とせずに,テスト時にこの問題に対処する新しい手法を提案する。
MiDlは、欠落したモダリティをテスト時にのみ扱う、自己管理型のオンラインソリューションとしては初めてのものだ。
論文 参考訳(メタデータ) (2024-04-23T16:01:33Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - AdaDiff: Accelerating Diffusion Models through Step-Wise Adaptive Computation [32.74923906921339]
拡散モデルは多彩で高忠実な画像を生成する上で大きな成功を収めるが、それらの応用は本質的に遅い生成速度によって妨げられる。
本稿では,拡散モデルの生成効率を向上させるために,各サンプリングステップで動的に計算資源を割り当てる適応フレームワークであるAdaDiffを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:10:04Z) - Uncovering the Over-smoothing Challenge in Image Super-Resolution: Entropy-based Quantification and Contrastive Optimization [67.99082021804145]
我々はDetail Enhanced Contrastive Loss (DECLoss)と呼ばれるCOO問題に対する明確な解決策を提案する。
DECLossはコントラスト学習のクラスタリング特性を利用して、潜在的な高分解能分布の分散を直接的に低減する。
我々は複数の超高解像度ベンチマーク上でDECLosを評価し,PSNR指向モデルの知覚品質を向上させることを実証した。
論文 参考訳(メタデータ) (2022-01-04T08:30:09Z) - Closed-form Continuous-Depth Models [99.40335716948101]
連続深度ニューラルモデルは高度な数値微分方程式解法に依存している。
我々は,CfCネットワークと呼ばれる,記述が簡単で,少なくとも1桁高速な新しいモデル群を提示する。
論文 参考訳(メタデータ) (2021-06-25T22:08:51Z) - PSEUDo: Interactive Pattern Search in Multivariate Time Series with
Locality-Sensitive Hashing and Relevance Feedback [3.347485580830609]
PSEUDoは、マルチトラックシーケンシャルデータにおける視覚パターンを探索するための適応的機能学習技術である。
提案アルゴリズムは,サブ線形学習と推論時間を特徴とする。
我々は,PSEUDoの効率,精度,操縦性において優位性を示す。
論文 参考訳(メタデータ) (2021-04-30T13:00:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。