論文の概要: Improved Positional Encoding for Implicit Neural Representation based
Compact Data Representation
- arxiv url: http://arxiv.org/abs/2311.06059v1
- Date: Fri, 10 Nov 2023 13:47:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-11-13 15:06:31.157367
- Title: Improved Positional Encoding for Implicit Neural Representation based
Compact Data Representation
- Title(参考訳): 入射ニューラル表現に基づくコンパクトデータ表現のための位置符号化の改良
- Authors: Bharath Bhushan Damodaran, Francois Schnitzler, Anne Lambert, Pierre
Hellier
- Abstract要約: 暗黙的ニューラル表現(INR)の再構成品質を向上させる新しい位置符号化法を提案する。
提案手法は, 圧縮作業の複雑さや新規ビュー合成の再現性の向上を伴わずに, 速度歪み性能を著しく向上することを示す。
- 参考スコア(独自算出の注目度): 4.506099292980221
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Positional encodings are employed to capture the high frequency information
of the encoded signals in implicit neural representation (INR). In this paper,
we propose a novel positional encoding method which improves the reconstruction
quality of the INR. The proposed embedding method is more advantageous for the
compact data representation because it has a greater number of frequency basis
than the existing methods. Our experiments shows that the proposed method
achieves significant gain in the rate-distortion performance without
introducing any additional complexity in the compression task and higher
reconstruction quality in novel view synthesis.
- Abstract(参考訳): 位置符号化を用いて、暗黙の神経表現(INR)において符号化された信号の高周波情報をキャプチャする。
本稿では,INRの再構成品質を向上させる新しい位置符号化手法を提案する。
提案手法は,従来の手法よりも周波数ベースが大きいため,コンパクトなデータ表現に有利である。
提案手法は, 圧縮作業の複雑さや新規ビュー合成の再現性の向上を伴わずに, 速度歪み性能を著しく向上することを示す。
関連論文リスト
- SR-NeRV: Improving Embedding Efficiency of Neural Video Representation via Super-Resolution [0.0]
Inlicit Neural Representations (INR)は、様々な領域にまたがる複雑な信号をモデル化する能力において、大きな注目を集めている。
汎用超解像(SR)ネットワークを統合したINRに基づく映像表現手法を提案する。
論文 参考訳(メタデータ) (2025-04-30T03:31:40Z) - SING: Semantic Image Communications using Null-Space and INN-Guided Diffusion Models [52.40011613324083]
近年, 無線画像伝送において, 共用音源チャネル符号化システム (DeepJSCC) が顕著な性能を発揮している。
既存の手法では、送信された画像とレシーバーの再構成されたバージョンとの間の歪みを最小限に抑えることに重点を置いており、しばしば知覚的品質を見落としている。
逆問題として,破損した再構成画像から高品質な画像の復元を定式化する新しいフレームワークであるSINGを提案する。
論文 参考訳(メタデータ) (2025-03-16T12:32:11Z) - Exploring Position Encoding in Diffusion U-Net for Training-free High-resolution Image Generation [12.46680249926721]
事前トレーニングされたU-Netを介して高分解能潜伏剤をノイズ化すると、反復的および乱れたイメージパターンが生じる。
本稿では,プログレッシブ・バウンダリ・コンプリメント (PBC) 法を導入し,新しい学習自由な手法を提案する。
本手法は,特徴マップ内の動的仮想画像境界を作成し,位置情報の伝搬を向上させる。
論文 参考訳(メタデータ) (2025-03-12T20:51:17Z) - Spatially-Adaptive Hash Encodings For Neural Surface Reconstruction [30.561368257031393]
本研究では,ネットワークが空間の関数として符号化ベースを選択することができる学習手法を提案する。
その結果、空間適応的なアプローチにより、ネットワークはノイズを発生させることなくより広い周波数域に適合できる。
論文 参考訳(メタデータ) (2024-12-06T16:54:55Z) - High-Frequency Enhanced Hybrid Neural Representation for Video Compression [32.38933743785333]
本稿では,高周波拡張型ハイブリッドニューラル表現ネットワークを提案する。
本手法は,ネットワークによる細部合成を改善するために,高周波情報を活用することに焦点を当てている。
BunnyおよびUVGデータセットの実験は、我々の手法が他の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-11-11T03:04:46Z) - $ε$-VAE: Denoising as Visual Decoding [61.29255979767292]
生成モデリングにおいて、トークン化は複雑なデータをコンパクトで構造化された表現に単純化し、より効率的で学習可能な空間を作り出す。
現在の視覚的トークン化手法は従来のオートエンコーダフレームワークに依存しており、エンコーダはデータを潜在表現に圧縮し、デコーダは元の入力を再構築する。
具体的には,デコーダを拡散処理に置き換え,ノイズを反復的に除去して元のイメージを復元し,エンコーダが提供する潜伏者によって誘導される。
再建(rFID)と生成品質(ジェネレーション品質)の両面からアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-05T08:27:53Z) - Improving Transformers using Faithful Positional Encoding [55.30212768657544]
本稿では,Transformerと呼ばれるニューラルネットワークアーキテクチャのための新しい位置符号化手法を提案する。
標準的な正弦波位置符号化とは違って,本手法では入力シーケンスの位置次数に関する情報が失われないようにしている。
論文 参考訳(メタデータ) (2024-05-15T03:17:30Z) - NeRF-VPT: Learning Novel View Representations with Neural Radiance
Fields via View Prompt Tuning [63.39461847093663]
本研究では,これらの課題に対処するための新しいビュー合成手法であるNeRF-VPTを提案する。
提案するNeRF-VPTは、先行レンダリング結果から得られたRGB情報を、その後のレンダリングステージのインストラクティブな視覚的プロンプトとして機能するカスケーディングビュープロンプトチューニングパラダイムを用いている。
NeRF-VPTは、追加のガイダンスや複雑なテクニックに頼ることなく、トレーニングステージ毎に前のステージレンダリングからRGBデータをサンプリングするだけである。
論文 参考訳(メタデータ) (2024-03-02T22:08:10Z) - Learned layered coding for Successive Refinement in the Wyner-Ziv
Problem [18.134147308944446]
本稿では,連続したソースのプログレッシブエンコーディングを明示的に学習するためのデータ駆動型アプローチを提案する。
この設定は、Wyner-Ziv符号問題の連続的な改善を指す。
我々は、RNNがスケーラブルなネスト量子化と同様の層状ビニングソリューションを明示的に検索できることを実証した。
論文 参考訳(メタデータ) (2023-11-06T12:45:32Z) - Modality-Agnostic Variational Compression of Implicit Neural
Representations [96.35492043867104]
Inlicit Neural Representation (INR) としてパラメータ化されたデータの関数的ビューに基づくモーダリティ非依存型ニューラル圧縮アルゴリズムを提案する。
潜時符号化と疎性の間のギャップを埋めて、ソフトゲーティング機構に非直線的にマッピングされたコンパクト潜時表現を得る。
このような潜在表現のデータセットを得た後、ニューラル圧縮を用いてモーダリティ非依存空間におけるレート/歪みトレードオフを直接最適化する。
論文 参考訳(メタデータ) (2023-01-23T15:22:42Z) - Learned Image Compression with Generalized Octave Convolution and
Cross-Resolution Parameter Estimation [5.238765582868391]
本稿では,オクターブの畳み込みを利用して,遅延表現を高分解能 (HR) と低分解能 (LR) に分解する多分解能画像圧縮フレームワークを提案する。
実験結果から,本手法は,最先端の学習画像圧縮法と比較して,復号時間を約73.35 %,93.44 %削減できることがわかった。
論文 参考訳(メタデータ) (2022-09-07T08:21:52Z) - Implicit Neural Representations for Image Compression [103.78615661013623]
Inlicit Neural Representations (INRs) は、様々なデータ型の新規かつ効果的な表現として注目されている。
量子化、量子化を考慮した再学習、エントロピー符号化を含むINRに基づく最初の包括的圧縮パイプラインを提案する。
我々は、INRによるソース圧縮に対する我々のアプローチが、同様の以前の作業よりも大幅に優れていることに気付きました。
論文 参考訳(メタデータ) (2021-12-08T13:02:53Z) - Over-and-Under Complete Convolutional RNN for MRI Reconstruction [57.95363471940937]
MR画像再構成のための最近のディープラーニングに基づく手法は、通常、汎用的なオートエンコーダアーキテクチャを利用する。
OUCR(Over-and-Under Complete Convolu?tional Recurrent Neural Network)を提案する。
提案手法は, トレーニング可能なパラメータの少ない圧縮されたセンシングと, 一般的なディープラーニングに基づく手法に対して, 大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-06-16T15:56:34Z) - Generalized Octave Convolutions for Learned Multi-Frequency Image
Compression [20.504561050200365]
本稿では,初めて学習されたマルチ周波数画像圧縮とエントロピー符号化手法を提案する。
これは最近開発されたオクターブの畳み込みに基づいて、潜水剤を高周波(高分解能)成分に分解する。
提案した一般化オクターブ畳み込みは、他のオートエンコーダベースのコンピュータビジョンタスクの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2020-02-24T01:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。