論文の概要: Low-complexity Multidimensional DCT Approximations
- arxiv url: http://arxiv.org/abs/2306.11724v1
- Date: Tue, 20 Jun 2023 17:55:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-21 13:06:51.023817
- Title: Low-complexity Multidimensional DCT Approximations
- Title(参考訳): 低複素多次元dct近似
- Authors: V. A. Coutinho, R. J. Cintra, F. M. Bayer
- Abstract要約: 数個の乗算8時間8時間8$近似法が提案され、一般多次元の場合の計算複雑性が議論される。
提案手法は3次元DCTに基づくビデオ符号化方式に組み込まれ,量子化のステップが変更された。
シミュレーションの結果, 近似3次元DCT符号化法は, 正確な3次元DCT方式と比較すると, ほぼ同一の視覚的品質が得られることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce low-complexity multidimensional discrete cosine
transform (DCT) approximations. Three dimensional DCT (3D DCT) approximations
are formalized in terms of high-order tensor theory. The formulation is
extended to higher dimensions with arbitrary lengths. Several multiplierless
$8\times 8\times 8$ approximate methods are proposed and the computational
complexity is discussed for the general multidimensional case. The proposed
methods complexity cost was assessed, presenting considerably lower arithmetic
operations when compared with the exact 3D DCT. The proposed approximations
were embedded into 3D DCT-based video coding scheme and a modified quantization
step was introduced. The simulation results showed that the approximate 3D DCT
coding methods offer almost identical output visual quality when compared with
exact 3D DCT scheme. The proposed 3D approximations were also employed as a
tool for visual tracking. The approximate 3D DCT-based proposed system performs
similarly to the original exact 3D DCT-based method. In general, the suggested
methods showed competitive performance at a considerably lower computational
cost.
- Abstract(参考訳): 本稿では,低複素多次元離散コサイン変換(dct)近似を提案する。
3次元DCT(3次元DCT)近似は高次テンソル理論で定式化される。
この定式化は任意の長さの高次元に拡張される。
8\times 8\times 8$ 近似法を複数提案し, 一般多次元の場合の計算複雑性について考察した。
提案手法の複雑性を評価した結果,正確な3次元dctと比較して算術演算の精度が有意に低下した。
提案手法は3次元DCTに基づくビデオ符号化方式に組み込まれ,量子化のステップが変更された。
シミュレーションの結果, 近似3次元DCT符号化法は, 正確な3次元DCT方式と比較してほぼ同一の視覚的品質が得られることがわかった。
提案する3次元近似は視覚追跡のためのツールとしても用いられた。
近似3次元DCTに基づく提案システムは、元の正確な3次元DCTに基づく手法と同様に動作する。
一般に,提案手法は計算コストがかなり低い競争性能を示した。
関連論文リスト
- Extensions on low-complexity DCT approximations for larger blocklengths based on minimal angle similarity [0.0]
離散コサイン変換(DCT)は、KLT(Karhunen-Loeve transform)に関連があるため、画像とビデオの符号化の中心的なツールである。
16点, 32点, 64点のDCT近似を導入し, 精度の高いDCT行列列と近似変換によって誘導される行列との角度を最小化する。
高速アルゴリズムは低複雑さ変換のためにも開発され、性能と計算コストのバランスが良いと主張した。
論文 参考訳(メタデータ) (2024-10-20T01:20:35Z) - 3D Photon Counting CT Image Super-Resolution Using Conditional Diffusion Model [6.75361442343724]
本研究の目的は、拡散確率モデル(DDPM)を用いた光子計数CT(PCCT)画像分解能の向上である。
私たちはまずCatSimを利用して,高分解能CTスキャンから現実的な低分解能PCCT画像をシミュレートする。
DDPM性能の最大化は推論とトレーニングの両方に時間を要するため,条件付きDDPMのための2次元ネットワークと3次元ネットワークを探索する。
論文 参考訳(メタデータ) (2024-08-22T02:25:21Z) - MVD-Fusion: Single-view 3D via Depth-consistent Multi-view Generation [54.27399121779011]
本稿では,多視点RGB-D画像の生成モデルを用いて,単視点3次元推論を行うMVD-Fusionを提案する。
提案手法は,蒸留に基づく3D推論や先行多視点生成手法など,最近の最先端技術と比較して,より正確な合成を実現することができることを示す。
論文 参考訳(メタデータ) (2024-04-04T17:59:57Z) - Integer Optimization of CT Trajectories using a Discrete Data
Completeness Formulation [3.924235219960689]
X線CTは、幅広い医療・産業用途のために3次元構造をデジタル化する上で重要な役割を果たしている。
従来のCTシステムは、しばしば標準的な円形およびヘリカルスキャンの軌跡に依存しており、大きな物体、複雑な構造、資源の制約を含む挑戦的なシナリオには最適ではないかもしれない。
我々は、対象物に関する任意の視点から投影を得る柔軟性を提供する双対ロボットCTシステムの可能性を探っている。
論文 参考訳(メタデータ) (2024-01-29T10:38:58Z) - Low-Complexity Loeffler DCT Approximations for Image and Video Coding [0.0]
本稿では,ローフラー離散コサイン変換(DCT)アルゴリズムに基づく行列パラメトリゼーション手法を提案する。
数個の8点DCT近似の数学的形式を統一する8点DCT近似の新しいクラスが提案された。
論文 参考訳(メタデータ) (2022-07-29T03:56:18Z) - Deep Marching Tetrahedra: a Hybrid Representation for High-Resolution 3D
Shape Synthesis [90.26556260531707]
DMTetは粗いボクセルのような単純なユーザーガイドを用いて高解像度の3次元形状を合成できる条件付き生成モデルである。
メッシュなどの明示的な表現を直接生成する深部3次元生成モデルとは異なり、我々のモデルは任意の位相で形状を合成することができる。
論文 参考訳(メタデータ) (2021-11-08T05:29:35Z) - Asymmetric 3D Context Fusion for Universal Lesion Detection [55.61873234187917]
3Dネットワークは、3Dコンテキストでは強いが、教師付き事前トレーニングがない。
既存の3Dコンテキスト融合演算子は空間対称に設計されており、畳み込みのように各2Dスライス上で同一の操作を行う。
本研究では, 異なる重みを持つ非対称な3次元コンテキスト融合演算子 (A3D) を提案し, 異なる2次元スライスから3次元コンテキストを融合させる。
論文 参考訳(メタデータ) (2021-09-17T16:25:10Z) - Improving 3D Object Detection with Channel-wise Transformer [58.668922561622466]
我々は手作りの最小限の設計で2段階の3Dオブジェクト検出フレームワーク(CT3D)を提案する。
CT3Dは、提案対応の埋め込みとチャンネルワイドコンテキストアグリゲーションを同時に行う。
これはKITTIテスト3D検出ベンチマークで中等車カテゴリーで81.77%のAPを達成した。
論文 参考訳(メタデータ) (2021-08-23T02:03:40Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。