論文の概要: HashEncoding: Autoencoding with Multiscale Coordinate Hashing
- arxiv url: http://arxiv.org/abs/2211.15894v1
- Date: Tue, 29 Nov 2022 03:22:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 16:21:46.816738
- Title: HashEncoding: Autoencoding with Multiscale Coordinate Hashing
- Title(参考訳): HashEncoding: マルチスケールのコーディネートハッシュによる自動エンコーディング
- Authors: Lukas Zhornyak, Zhengjie Xu, Haoran Tang, Jianbo Shi
- Abstract要約: 非パラメトリックなマルチスケール座標ハッシュ関数を利用する新しい自動符号化アーキテクチャであるHashを提案する。
Hashは、もともとのイメージよりもはるかに小さな、本質的にはマルチスケールな埋め込みスペースを可能にする。
- 参考スコア(独自算出の注目度): 13.709920889278505
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present HashEncoding, a novel autoencoding architecture that leverages a
non-parametric multiscale coordinate hash function to facilitate a per-pixel
decoder without convolutions. By leveraging the space-folding behaviour of
hashing functions, HashEncoding allows for an inherently multiscale embedding
space that remains much smaller than the original image. As a result, the
decoder requires very few parameters compared with decoders in traditional
autoencoders, approaching a non-parametric reconstruction of the original image
and allowing for greater generalizability. Finally, by allowing backpropagation
directly to the coordinate space, we show that HashEncoding can be exploited
for geometric tasks such as optical flow.
- Abstract(参考訳): 我々は、非パラメトリックなマルチスケール座標ハッシュ関数を利用して、畳み込みのない画素単位のデコーダを容易にする新しい自動符号化アーキテクチャであるHashEncodingを提案する。
ハッシュ関数の空間フォールディング挙動を利用することで、hashencodingは本質的には元の画像よりもずっと小さいマルチスケールの埋め込み空間を可能にする。
結果として、デコーダは従来のオートエンコーダのデコーダと比較して非常に少ないパラメータを必要とし、元のイメージの非パラメトリックな再構成に近づき、より一般化可能となる。
最後に、座標空間に直接バックプロパゲーションを許すことで、ハゼンコーディングを光学フローなどの幾何学的タスクに活用できることを示す。
関連論文リスト
- $ε$-VAE: Denoising as Visual Decoding [61.29255979767292]
生成モデリングにおいて、トークン化は複雑なデータをコンパクトで構造化された表現に単純化し、より効率的で学習可能な空間を作り出す。
現在の視覚的トークン化手法は従来のオートエンコーダフレームワークに依存しており、エンコーダはデータを潜在表現に圧縮し、デコーダは元の入力を再構築する。
具体的には,デコーダを拡散処理に置き換え,ノイズを反復的に除去して元のイメージを復元し,エンコーダが提供する潜伏者によって誘導される。
再建(rFID)と生成品質(ジェネレーション品質)の両面からアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-05T08:27:53Z) - Triple-Encoders: Representations That Fire Together, Wire Together [51.15206713482718]
コントラスト学習(Contrastive Learning)は、バイエンコーダを介して発話間の相対距離を埋め込み空間に符号化する表現学習法である。
本研究では,これら独立に符号化された発話から分散発話混合物を効率よく計算する三重エンコーダを提案する。
トリプルエンコーダはバイエンコーダよりも大幅に改善され、シングルベクトル表現モデルよりもゼロショットの一般化が向上することがわかった。
論文 参考訳(メタデータ) (2024-02-19T18:06:02Z) - Differentiable VQ-VAE's for Robust White Matter Streamline Encodings [33.936125620525]
オートエンコーダは、低次元ラテント空間における解析の合理性を簡素化する次元還元ツールとして提案されている。
本稿では,単一のデータポイントとしてストリームラインの全バンドルを取り込み,可変ベクトル量子化変分自動エンコーダを提案する。
論文 参考訳(メタデータ) (2023-11-10T17:59:43Z) - Neural Image Compression Using Masked Sparse Visual Representation [17.229601298529825]
本研究では,Sparse Visual Representation (SVR) に基づくニューラル画像圧縮について検討し,学習されたビジュアルコードブックにまたがる離散潜在空間に画像が埋め込まれた。
コードブックをデコーダと共有することにより、エンコーダは効率的でクロスプラットフォームなコードワードインデックスを転送する。
本稿では,マスクを潜在機能部分空間に適用して品質のバランスと再構築を行うMasked Adaptive Codebook Learning (M-AdaCode)法を提案する。
論文 参考訳(メタデータ) (2023-09-20T21:59:23Z) - Small Lesion Segmentation in Brain MRIs with Subpixel Embedding [105.1223735549524]
ヒト脳のMRIスキャンを虚血性脳梗塞と正常組織に分割する方法を提案する。
本稿では,空間展開埋め込みネットワークによって予測を導出する標準エンコーダデコーダの形式でニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-18T00:21:17Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Cascade Decoders-Based Autoencoders for Image Reconstruction [2.924868086534434]
本稿では,カスケードデコーダを用いたオートエンコーダの画像再構成を目的とする。
提案したシリアルデコーダベースのオートエンコーダは、マルチレベルデコーダのアーキテクチャと関連する最適化アルゴリズムを含む。
提案するオートエンコーダは,画像再構成の性能において,従来のオートエンコーダよりも優れていた。
論文 参考訳(メタデータ) (2021-06-29T23:40:54Z) - Less is More: Pre-training a Strong Siamese Encoder Using a Weak Decoder [75.84152924972462]
多くの実世界のアプリケーションはSiameseネットワークを使用して、テキストシーケンスを大規模に効率的にマッチングします。
本稿では,シームズアーキテクチャにおけるシーケンスマッチング専用の言語モデルを事前学習する。
論文 参考訳(メタデータ) (2021-02-18T08:08:17Z) - How to Exploit the Transferability of Learned Image Compression to
Conventional Codecs [25.622863999901874]
本稿では,学習した画像の符号化をサロゲートとして利用して,画像の符号化を最適化する方法を示す。
提案手法は,MS-SSIM歪みをデコードオーバーヘッドを伴わずに20%以上の速度改善で補正するために,従来の画像を再構成することができる。
論文 参考訳(メタデータ) (2020-12-03T12:34:51Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。