Fugu-MT 論文翻訳(概要): Variable Length Embeddings

論文の概要: Variable Length Embeddings

arxiv url: http://arxiv.org/abs/2305.09967v1
Date: Wed, 17 May 2023 05:59:53 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-18 17:23:53.609679
Title: Variable Length Embeddings
Title（参考訳）: 可変長埋め込み
Authors: Johnathan Chiu, Andi Gu, Matt Zhou
Abstract要約: 我々は、新しいディープラーニングアーキテクチャ、可変長埋め込み(VLE)を導入する。概念実証として、再構成と画像分解を含むタスクにおけるVLEの能力を実証する。 VLEは,10分の1未満のパラメータを用いて,VAEに匹敵する再現結果が得られることがわかった。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: In this work, we introduce a novel deep learning architecture, Variable Length Embeddings (VLEs), an autoregressive model that can produce a latent representation composed of an arbitrary number of tokens. As a proof of concept, we demonstrate the capabilities of VLEs on tasks that involve reconstruction and image decomposition. We evaluate our experiments on a mix of the iNaturalist and ImageNet datasets and find that VLEs achieve comparable reconstruction results to a state of the art VAE, using less than a tenth of the parameters.
Abstract（参考訳）: 本稿では,任意の数のトークンからなる潜在表現を生成可能な自己回帰モデルである,新しいディープラーニングアーキテクチャである可変長埋め込み(VLE)を紹介する。概念実証として、再構成と画像分解を含むタスクにおけるVLEの能力を実証する。我々は、iNaturalistとImageNetのデータセットを混合した実験を行い、VLEが10分の1のパラメータを用いて、アートVAEの状態に匹敵する再構成結果が得られることを示した。

関連論文リスト

Generative Learning of Differentiable Object Models for Compositional Interpretation of Complex Scenes [0.20718016474717196]
この研究は、DVP(Disentangler of Visual Priors)のアーキテクチャに基づく。 DVPは、認識された物体を、形状、大きさ、配向、色見性の独立した視覚的側面に分解することで、シーンを解釈することを学ぶ。
論文参考訳（メタデータ） (2025-06-09T20:06:42Z)
Language Model as Visual Explainer [72.88137795439407]
本稿では,木構造言語学的説明を用いた視覚モデル解釈のための体系的アプローチを提案する。提案手法は,属性を付与した木の形で人間に理解可能な説明を提供する。提案手法の有効性を確認するため,新しいベンチマークを導入し,厳密な評価を行う。
論文参考訳（メタデータ） (2024-12-08T20:46:23Z)
Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文参考訳（メタデータ） (2024-05-23T09:13:36Z)
Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文参考訳（メタデータ） (2024-02-06T22:15:09Z)
Multi-task Image Restoration Guided By Robust DINO Features [88.74005987908443]
DINOv2から抽出したロバストな特徴を利用したマルチタスク画像復元手法であるmboxtextbfDINO-IRを提案する。まず,DINOV2の浅い特徴を動的に融合するPSF (Pixel-semantic fusion) モジュールを提案する。これらのモジュールを統一された深層モデルに定式化することにより、モデルトレーニングを制約するために、DINO知覚の対照的な損失を提案する。
論文参考訳（メタデータ） (2023-12-04T06:59:55Z)
Sequential Modeling Enables Scalable Learning for Large Vision Models [120.91839619284431]
本稿では,言語データを用いずにLVM(Large Vision Model)を学習できる新しい逐次モデリング手法を提案する。我々は、生画像やビデオや注釈付きデータソースを表現できる共通フォーマット「視覚文」を定義した。
論文参考訳（メタデータ） (2023-12-01T18:59:57Z)
MA-NeRF: Motion-Assisted Neural Radiance Fields for Face Synthesis from Sparse Images [21.811067296567252]
本研究では,高忠実度乾燥可能な顔アバターを再構成し,目に見えない表情を処理できる新しいフレームワークを提案する。実装の核となるのは、構造化変位特徴と意味認識学習モジュールです。我々の手法は現在の最先端技術よりもはるかに優れた結果が得られる。
論文参考訳（メタデータ） (2023-06-17T13:49:56Z)
Revisiting Image Reconstruction for Semi-supervised Semantic Segmentation [16.27277238968567]
画像再構成を補助課題として利用し、半教師付きセマンティックセグメンテーションフレームワークに組み込むという考え方を再考する。驚くことに、このような半教師付き学習の古いアイデアは、最先端のセマンティックセグメンテーションアルゴリズムと競合する結果をもたらす。
論文参考訳（メタデータ） (2023-03-17T06:31:06Z)
Improving VAE-based Representation Learning [26.47244578124654]
優れた表現にはどのような特性が必要か,また異なるVAE構造選択が学習特性に与える影響について検討する。ローカルな特徴を学習するデコーダを使用することで、残りのグローバルな特徴を潜伏者によってうまく捉えられることを示す。
論文参考訳（メタデータ） (2022-05-28T23:00:18Z)
An Empirical Investigation of Representation Learning for Imitation [76.48784376425911]
視覚、強化学習、NLPにおける最近の研究は、補助的な表現学習の目的が、高価なタスク固有の大量のデータの必要性を減らすことを示している。本稿では,表現学習アルゴリズムを構築するためのモジュラーフレームワークを提案する。
論文参考訳（メタデータ） (2022-05-16T11:23:42Z)
Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文参考訳（メタデータ） (2021-03-30T17:57:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。