論文の概要: Residual-Recursion Autoencoder for Shape Illustration Images
- arxiv url: http://arxiv.org/abs/2002.02063v1
- Date: Thu, 6 Feb 2020 01:51:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 13:06:10.650193
- Title: Residual-Recursion Autoencoder for Shape Illustration Images
- Title(参考訳): 形状画像用残差再帰オートエンコーダ
- Authors: Qianwei Zhou, Peng Tao, Xiaoxin Li, Shengyong Chen, Fan Zhang, Haigen
Hu
- Abstract要約: 形状図形画像(SII)は工業製品の断面を記述する上で一般的で重要なものである。
本研究では,SIIから低次元特徴を抽出するためにResidual-Recursion Autoencoder (RRAE) を提案する。
ある種のニューラルネットワークトレーニングフレームワークとして、RRAEは他のオートエンコーダをラップし、パフォーマンスを向上させることができる。
- 参考スコア(独自算出の注目度): 16.29123499978077
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shape illustration images (SIIs) are common and important in describing the
cross-sections of industrial products. Same as MNIST, the handwritten digit
images, SIIs are gray or binary and containing shapes that are surrounded by
large areas of blanks. In this work, Residual-Recursion Autoencoder (RRAE) has
been proposed to extract low-dimensional features from SIIs while maintaining
reconstruction accuracy as high as possible. RRAE will try to reconstruct the
original image several times and recursively fill the latest residual image to
the reserved channel of the encoder's input before the next trial of
reconstruction. As a kind of neural network training framework, RRAE can wrap
over other autoencoders and increase their performance. From experiment
results, the reconstruction loss is decreased by 86.47% for convolutional
autoencoder with high-resolution SIIs, 10.77% for variational autoencoder and
8.06% for conditional variational autoencoder with MNIST.
- Abstract(参考訳): 形状図像(siis)は工業製品の断面を記述する上で一般的かつ重要である。
mnistと同じ、手書きの数字画像、siisは灰色または二分体であり、空白の大きな領域に囲まれている形を含んでいる。
本研究では,SIIから低次元特徴を抽出し,再現精度を極力高く保ちながらResidual-Recursion Autoencoder (RRAE) を提案する。
RRAEは、元のイメージを何度か再構築し、次の再構築試行の前にエンコーダの入力の予約チャネルに最新の残像を再帰的に埋め込もうとする。
ある種のニューラルネットワークトレーニングフレームワークとして、RRAEは他のオートエンコーダをラップし、パフォーマンスを向上させることができる。
実験結果から、高分解能SIIを有する畳み込みオートエンコーダの86.47%、変分オートエンコーダの10.77%、MNISTによる条件付き変分オートエンコーダの8.06%の再現損失が減少した。
関連論文リスト
- $ε$-VAE: Denoising as Visual Decoding [61.29255979767292]
生成モデリングにおいて、トークン化は複雑なデータをコンパクトで構造化された表現に単純化し、より効率的で学習可能な空間を作り出す。
現在の視覚的トークン化手法は従来のオートエンコーダフレームワークに依存しており、エンコーダはデータを潜在表現に圧縮し、デコーダは元の入力を再構築する。
具体的には,デコーダを拡散処理に置き換え,ノイズを反復的に除去して元のイメージを復元し,エンコーダが提供する潜伏者によって誘導される。
再建(rFID)と生成品質(ジェネレーション品質)の両面からアプローチを評価する。
論文 参考訳(メタデータ) (2024-10-05T08:27:53Z) - In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - Learning Enriched Features for Fast Image Restoration and Enhancement [166.17296369600774]
本稿では,ネットワーク全体を通して空間的精度の高い高解像度表現を維持することを目的とする。
我々は、高解像度の空間的詳細を同時に保存しながら、複数のスケールからの文脈情報を組み合わせた豊富な特徴集合を学習する。
提案手法は,デフォーカス・デブロアリング,画像デノイング,超解像,画像強調など,さまざまな画像処理タスクに対して,最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-04-19T17:59:45Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - Cascade Decoders-Based Autoencoders for Image Reconstruction [2.924868086534434]
本稿では,カスケードデコーダを用いたオートエンコーダの画像再構成を目的とする。
提案したシリアルデコーダベースのオートエンコーダは、マルチレベルデコーダのアーキテクチャと関連する最適化アルゴリズムを含む。
提案するオートエンコーダは,画像再構成の性能において,従来のオートエンコーダよりも優れていた。
論文 参考訳(メタデータ) (2021-06-29T23:40:54Z) - Recurrent autoencoder with sequence-aware encoding [0.0]
本稿では,1次元畳み込み層を用いたシーケンシャル・アウェア・エンコーディングによるオートエンコーダアーキテクチャを提案する。
提案手法が標準RAEよりも優れており,トレーニングプロセスは桁違いに高速であることを示す。
論文 参考訳(メタデータ) (2020-09-15T20:51:20Z) - End-to-End JPEG Decoding and Artifacts Suppression Using Heterogeneous
Residual Convolutional Neural Network [0.0]
既存のディープラーニングモデルは、デコードプロトコルからJPEGアーティファクトを独立したタスクとして分離する。
我々は、スペクトル分解とヘテロジニアス再構成機構を備えた真のエンド・ツー・エンドヘテロジニアス残畳み込みニューラルネットワーク(HR-CNN)を設計する。
論文 参考訳(メタデータ) (2020-07-01T17:44:00Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。