論文の概要: A Missing Data Imputation Method for 3D Object Reconstruction using
Multi-modal Variational Autoencoder
- arxiv url: http://arxiv.org/abs/2101.10391v1
- Date: Mon, 25 Jan 2021 20:23:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 22:51:29.300640
- Title: A Missing Data Imputation Method for 3D Object Reconstruction using
Multi-modal Variational Autoencoder
- Title(参考訳): マルチモーダル変分オートエンコーダを用いた3次元オブジェクト再構成の欠落データ計算法
- Authors: Hyeonwoo Yu and Jean Oh
- Abstract要約: 本稿では,要素が部分的に失われたり,手動で除外された潜伏変数の計算手法を提案する。
variationalautoencodersで使用される事前分布は、ラベルのトレーニングデータポイントすべてから得られる。
- 参考スコア(独自算出の注目度): 15.815583594196488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For effective human-robot teaming, it is importantfor the robots to be able
to share their visual perceptionwith the human operators. In a harsh remote
collaborationsetting, however, it is especially challenging to transfer a
largeamount of sensory data over a low-bandwidth network in real-time, e.g.,
for the task of 3D shape reconstruction given 2Dcamera images. To reduce the
burden of data transferring, datacompression techniques such as autoencoder can
be utilized toobtain and transmit the data in terms of latent variables in
acompact form. However, due to the low-bandwidth limitation orcommunication
delay, some of the dimensions of latent variablescan be lost in transit,
degenerating the reconstruction results.Moreover, in order to achieve faster
transmission, an intentionalover compression can be used where only partial
elements ofthe latent variables are used. To handle these incomplete datacases,
we propose a method for imputation of latent variableswhose elements are
partially lost or manually excluded. Toperform imputation with only some
dimensions of variables,exploiting prior information of the category- or
instance-levelis essential. In general, a prior distribution used in
variationalautoencoders is achieved from all of the training
datapointsregardless of their labels. This type of flattened prior makes
itdifficult to perform imputation from the category- or instance-level
distributions.
- Abstract(参考訳): 人間とロボットの効果的なコラボレーションには、ロボットが人間のオペレーターと視覚的認識を共有することが重要である。
しかし,2次元カメラ画像の3次元形状再構成作業などにおいて,低帯域幅ネットワーク上で大量のセンサデータをリアルタイムに転送することは特に困難である。
データ転送の負担を軽減するために、オートエンコーダなどのデータ圧縮技術を利用して、潜在変数を非コンパクト形式で送信することができる。
しかし、低帯域幅の制限や通信遅延のため、潜伏変数の次元の一部が通過時に失われて復元結果が縮退し、より高速な伝送を実現するために、潜伏変数の部分的要素のみを用いる意図的超過圧縮が用いられる。
これらの不完全なデータケースを処理するために,要素が部分的に失われたり,手作業で除外された潜在変数をインプテーションする手法を提案する。
toperform imputation with some dimension of variable, exploiting prior information of the category- or instance-levelis essential (英語)
一般に、変分オートエンコーダで使われる事前分布は、それらのラベルのすべてのトレーニングデータポイントから得られる。
このタイプのフラット化前処理は、カテゴリまたはインスタンスレベルの分布からインプテーションを実行するのが困難である。
関連論文リスト
- Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Less is More: On the Feature Redundancy of Pretrained Models When
Transferring to Few-shot Tasks [120.23328563831704]
事前訓練されたモデルを下流タスクに転送することは、ターゲットデータと線形探索を行うのと同じくらい簡単である。
線形探索では, 下流データが少ない場合に, 事前学習した特徴が極めて冗長であることを示す。
論文 参考訳(メタデータ) (2023-10-05T19:00:49Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Neural Progressive Meshes [54.52990060976026]
本稿では,共有学習空間を用いた3次元メッシュの伝送手法を提案する。
分割型エンコーダ・デコーダアーキテクチャを用いて,この空間を学習する。
本手法は複雑な3次元形状を多種多様な形状で評価し, 圧縮率と復元品質の点で, ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-10T17:58:02Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Dispensed Transformer Network for Unsupervised Domain Adaptation [21.256375606219073]
本稿では,新しい非教師付き領域適応 (UDA) 方式であるディスペンデントトランスフォーマーネットワーク (DTNet) について述べる。
提案するネットワークは,いくつかの最先端技術と比較して,最高の性能を実現している。
論文 参考訳(メタデータ) (2021-10-28T08:27:44Z) - Transformer Networks for Data Augmentation of Human Physical Activity
Recognition [61.303828551910634]
Recurrent Generative Adrial Networks (RGAN)のような最先端技術モデルは、リアルな合成データを生成するために使用される。
本稿では,データにグローバルな注意を払っているトランスフォーマーベースの生成敵ネットワークを,PAMAP2とリアルワールドヒューマンアクティビティ認識データセットでRGANと比較する。
論文 参考訳(メタデータ) (2021-09-02T16:47:29Z) - Transformers Solve the Limited Receptive Field for Monocular Depth
Prediction [82.90445525977904]
畳み込みニューラルネットワークとトランスの両方の恩恵を受けるアーキテクチャであるTransDepthを提案します。
連続ラベルを含む画素単位での予測問題にトランスフォーマーを適用する最初の論文である。
論文 参考訳(メタデータ) (2021-03-22T18:00:13Z) - Anonymizing Sensor Data on the Edge: A Representation Learning and
Transformation Approach [4.920145245773581]
本稿では,データ難読化に有用な低次元表現を学習することで,ユーティリティとプライバシ損失のトレードオフを検討することを目的とする。
本稿では,時系列データを合成するための変分オートエンコーダの潜時空間における決定論的および確率的変換を提案する。
リソース制約のあるエッジデバイス上で,データをリアルタイムに匿名化できることを示す。
論文 参考訳(メタデータ) (2020-11-16T22:32:30Z) - Segmentation of Surgical Instruments for Minimally-Invasive
Robot-Assisted Procedures Using Generative Deep Neural Networks [17.571763112459166]
本研究は,極小侵襲手術器具のセマンティックセグメンテーションをトレーニングデータを用いて改善できることを証明した。
これを実現するために、ソースデータセットを変換してターゲットデータセットのドメイン分布を近似するCycleGANモデルを使用する。
完全ラベルを持つこの新たに生成されたデータは、セマンティックセグメンテーションニューラルネットワークであるU-Netのトレーニングに使用される。
論文 参考訳(メタデータ) (2020-06-05T14:39:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。