Fugu-MT 論文翻訳(概要): DTR: A Unified Deep Tensor Representation Framework for Multimedia Data Recovery

論文の概要: DTR: A Unified Deep Tensor Representation Framework for Multimedia Data Recovery

arxiv url: http://arxiv.org/abs/2407.05267v1
Date: Sun, 7 Jul 2024 05:44:40 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-09 20:27:05.599316
Title: DTR: A Unified Deep Tensor Representation Framework for Multimedia Data Recovery
Title（参考訳）: DTR: マルチメディアデータ復元のための統合深部テンソル表現フレームワーク
Authors: Ting-Wei Zhou, Xi-Le Zhao, Jian-Li Wang, Yi-Si Luo, Min Wang, Xiao-Xuan Bai, Hong Yan,
Abstract要約: 本稿では,Deep Latent生成モジュールとDeep Transformモジュールを組み合わせた統合Deep Representationフレームワークを提案する。提案手法は, 定量化と定性化の両面において, 特に細部回復において, 最先端の手法と比較して優れた性能を実現する。
参考スコア（独自算出の注目度）: 20.341866262005677
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recently, the transform-based tensor representation has attracted increasing attention in multimedia data (e.g., images and videos) recovery problems, which consists of two indispensable components, i.e., transform and characterization. Previously, the development of transform-based tensor representation mainly focuses on the transform aspect. Although several attempts consider using shallow matrix factorization (e.g., singular value decomposition and negative matrix factorization) to characterize the frontal slices of transformed tensor (termed as latent tensor), the faithful characterization aspect is underexplored. To address this issue, we propose a unified Deep Tensor Representation (termed as DTR) framework by synergistically combining the deep latent generative module and the deep transform module. Especially, the deep latent generative module can faithfully generate the latent tensor as compared with shallow matrix factorization. The new DTR framework not only allows us to better understand the classic shallow representations, but also leads us to explore new representation. To examine the representation ability of the proposed DTR, we consider the representative multi-dimensional data recovery task and suggest an unsupervised DTR-based multi-dimensional data recovery model. Extensive experiments demonstrate that DTR achieves superior performance compared to state-of-the-art methods in both quantitative and qualitative aspects, especially for fine details recovery.
Abstract（参考訳）: 近年、変換に基づくテンソル表現は、2つの必須成分、すなわち変換とキャラクタリゼーションからなるマルチメディアデータ(例えば画像やビデオ)の回復問題に注目が集まっている。以前は、変換に基づくテンソル表現の開発は主に変換の側面に焦点を当てていた。いくつかの試みでは、浅い行列分解(例:特異値分解、負行列分解)を用いて変換テンソル(潜時テンソル)の正面スライスを特徴づけるが、忠実な特徴的側面は過小評価される。この問題に対処するために,ディープラーニング生成モジュールと深部変換モジュールを相乗的に組み合わせ,統合された深部テンソル表現(DTR)フレームワークを提案する。特に、深い潜伏生成モジュールは、浅い行列因子化と比較して潜伏テンソルを忠実に生成することができる。新しいDTRフレームワークは、従来の浅い表現をよりよく理解するだけでなく、新しい表現を探求する上でも役立ちます。提案したDTRの表現能力を検討するために,代表的多次元データ復元タスクを検討し,教師なしDTRに基づく多次元データ復元モデルを提案する。大規模実験により、DTRは定量化と定性化の両面において、特に細部回復において最先端の手法と比較して優れた性能を発揮することが示された。

関連論文リスト

Rotation Equivariant Arbitrary-scale Image Super-Resolution [62.41329042683779]
任意のスケールの超解像(ASISR)は、低解像度の入力画像から任意のスケールの高分解能回復を実現することを目的としている。本研究では, 回転同変ASISR法の構築に尽力する。
論文参考訳（メタデータ） (2025-08-07T08:51:03Z)
Tensor Dynamic Mode Decomposition [7.9882756082182675]
動的モード分解(DMD)は複雑な高次元システムの力学を解析するための強力なデータ駆動手法となっている。本稿では,最近開発されたT-productフレームワークに基づく3階テンソルへのDMDの拡張であるテンソル動的モード分解(TDMD)を提案する。合成と実世界の両方のデータセットにおけるTDMDの有効性を実証する。
論文参考訳（メタデータ） (2025-08-04T17:15:57Z)
Low-Rank Implicit Neural Representation via Schatten-p Quasi-Norm and Jacobian Regularization [49.158601255093416]
暗黙的神経表現のためのニューラルネットワークによりパラメータ化されたCPベースの低ランクテンソル関数を提案する。滑らか性のために、ヤコビアンとハッチンソンのトレース推定器のスペクトルノルムに基づく正規化項を提案する。提案した滑らか度正規化はSVDフリーであり、明示的な連鎖規則の導出を避ける。
論文参考訳（メタデータ） (2025-06-27T11:23:10Z)
OTLRM: Orthogonal Learning-based Low-Rank Metric for Multi-Dimensional Inverse Problems [14.893020063373022]
学習可能な直交変換に基づく新しいデータ駆動型低ランクt-SVDモデルを提案する。また、生成ネットワークの効率的な表現を利用して低ランク構造を得るSVTの一般化として低ランク解法を提案する。
論文参考訳（メタデータ） (2024-12-15T12:28:57Z)
Causal Transformer for Fusion and Pose Estimation in Deep Visual Inertial Odometry [1.2289361708127877]
深部視覚-慣性眼振におけるポーズ推定のための因果的視覚-慣性融合変換器 (VIFT) を提案する。提案手法はエンドツーエンドのトレーニングが可能であり,単眼カメラとIMUのみを必要とする。
論文参考訳（メタデータ） (2024-09-13T12:21:25Z)
Reti-Diff: Illumination Degradation Image Restoration with Retinex-based Latent Diffusion Model [59.08821399652483]
照明劣化画像復元(IDIR)技術は、劣化した画像の視認性を改善し、劣化した照明の悪影響を軽減することを目的としている。これらのアルゴリズムのうち、拡散モデル(DM)に基づく手法は期待できる性能を示しているが、画像レベルの分布を予測する際に、重い計算要求や画素の不一致の問題に悩まされることが多い。我々は、コンパクトな潜在空間内でDMを活用して、簡潔な指導先を生成することを提案し、IDIRタスクのためのReti-Diffと呼ばれる新しいソリューションを提案する。 Reti-Diff は Retinex-based Latent DM (RLDM) と Retinex-Guided Transformer (RG) の2つの鍵成分からなる。
論文参考訳（メタデータ） (2023-11-20T09:55:06Z)
Contrastive Learning for Multi-Object Tracking with Transformers [79.61791059432558]
我々は、DETRをインスタンスレベルのコントラスト損失を用いてMOTモデルに変換する方法を示す。本手法では,検出能力を維持しながらオブジェクトの外観を学習し,オーバーヘッドを少なく抑える。そのパフォーマンスは、BDD100Kデータセットにおいて、以前の最先端の+2.6 mMOTAを上回っている。
論文参考訳（メタデータ） (2023-11-14T10:07:52Z)
TFormer: A throughout fusion transformer for multi-modal skin lesion diagnosis [6.899641625551976]
我々は,MSLDで十分な情報干渉を行うために,純粋なトランスフォーマーベースのTFormer(スルーアウト・フュージョン・トランスフォーマー)を提案する。そこで我々は,2分岐階層型マルチモーダルトランス (HMT) ブロックのスタックを慎重に設計し,ステージバイステージ方式で異なる画像モダリティ間で情報を融合する。我々のTFormerは、他の最先端メソッドよりも優れています。
論文参考訳（メタデータ） (2022-11-21T12:07:05Z)
f-DM: A Multi-stage Diffusion Model via Progressive Signal Transformation [56.04628143914542]
拡散モデル(DM)は、最近、様々な領域で生成モデリングを行うためのSoTAツールとして登場した。本稿では、プログレッシブ信号変換が可能なDMの一般化されたファミリであるf-DMを提案する。我々は、ダウンサンプリング、ぼやけ、学習された変換を含む様々な機能を持つ画像生成タスクにf-DMを適用した。
論文参考訳（メタデータ） (2022-10-10T18:49:25Z)
Dynamic MRI using Learned Transform-based Deep Tensor Low-Rank Network (DTLR-Net) [9.658908705889777]
心臓のダイナミックMR画像に先行するテンソルローランクを学習することで,モデルに基づくディープラーニングネットワークを導入する。提案したフレームワークは,最先端のアルゴリズムと比較して,回復率の向上を実現している。
論文参考訳（メタデータ） (2022-06-02T02:55:41Z)
DFTR: Depth-supervised Hierarchical Feature Fusion Transformer for Salient Object Detection [44.94166578314837]
我々は、純粋なトランスフォーマーベースのSODフレームワーク、すなわち、Depth-supervised Hierarchical Feature Fusion TRansformer (DFTR)を提案する。我々は,提案したDFTRを10個のベンチマークデータセット上で広範囲に評価し,実験結果から,既存のRGBおよびRGB-D SODタスクにおいて,DFTRが従来手法よりも一貫して優れていることが示された。
論文参考訳（メタデータ） (2022-03-12T12:59:12Z)
Reference-based Magnetic Resonance Image Reconstruction Using Texture Transforme [86.6394254676369]
高速MRI再構成のための新しいテクスチャトランスフォーマーモジュール(TTM)を提案する。変換器のクエリやキーとしてアンダーサンプルのデータと参照データを定式化する。提案したTTMは、MRIの再構成手法に積み重ねることで、その性能をさらに向上させることができる。
論文参考訳（メタデータ） (2021-11-18T03:06:25Z)
Invariant Deep Compressible Covariance Pooling for Aerial Scene Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文参考訳（メタデータ） (2020-11-11T11:13:07Z)
Learned Multi-layer Residual Sparsifying Transform Model for Low-dose CT Reconstruction [11.470070927586017]
スパース変換学習は、高度に効率的なスパースコーディングとオペレータ更新ステップを含む。本稿では,変換領域残基を層上で共分散したMRST学習モデルを提案する。
論文参考訳（メタデータ） (2020-05-08T02:36:50Z)
Monocular Human Pose and Shape Reconstruction using Part Differentiable Rendering [53.16864661460889]
近年の研究では、3次元基底真理によって教師されるディープニューラルネットワークを介してパラメトリックモデルを直接推定する回帰に基づく手法が成功している。本稿では,ボディセグメンテーションを重要な監視対象として紹介する。部分分割による再構成を改善するために,部分分割により部分ベースモデルを制御可能な部分レベル微分可能部を提案する。
論文参考訳（メタデータ） (2020-03-24T14:25:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。