論文の概要: A Missing Data Imputation Method for 3D Object Reconstruction using
Multi-modal Variational Autoencoder
- arxiv url: http://arxiv.org/abs/2101.10391v1
- Date: Mon, 25 Jan 2021 20:23:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-14 22:51:29.300640
- Title: A Missing Data Imputation Method for 3D Object Reconstruction using
Multi-modal Variational Autoencoder
- Title(参考訳): マルチモーダル変分オートエンコーダを用いた3次元オブジェクト再構成の欠落データ計算法
- Authors: Hyeonwoo Yu and Jean Oh
- Abstract要約: 本稿では,要素が部分的に失われたり,手動で除外された潜伏変数の計算手法を提案する。
variationalautoencodersで使用される事前分布は、ラベルのトレーニングデータポイントすべてから得られる。
- 参考スコア(独自算出の注目度): 15.815583594196488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For effective human-robot teaming, it is importantfor the robots to be able
to share their visual perceptionwith the human operators. In a harsh remote
collaborationsetting, however, it is especially challenging to transfer a
largeamount of sensory data over a low-bandwidth network in real-time, e.g.,
for the task of 3D shape reconstruction given 2Dcamera images. To reduce the
burden of data transferring, datacompression techniques such as autoencoder can
be utilized toobtain and transmit the data in terms of latent variables in
acompact form. However, due to the low-bandwidth limitation orcommunication
delay, some of the dimensions of latent variablescan be lost in transit,
degenerating the reconstruction results.Moreover, in order to achieve faster
transmission, an intentionalover compression can be used where only partial
elements ofthe latent variables are used. To handle these incomplete datacases,
we propose a method for imputation of latent variableswhose elements are
partially lost or manually excluded. Toperform imputation with only some
dimensions of variables,exploiting prior information of the category- or
instance-levelis essential. In general, a prior distribution used in
variationalautoencoders is achieved from all of the training
datapointsregardless of their labels. This type of flattened prior makes
itdifficult to perform imputation from the category- or instance-level
distributions.
- Abstract(参考訳): 人間とロボットの効果的なコラボレーションには、ロボットが人間のオペレーターと視覚的認識を共有することが重要である。
しかし,2次元カメラ画像の3次元形状再構成作業などにおいて,低帯域幅ネットワーク上で大量のセンサデータをリアルタイムに転送することは特に困難である。
データ転送の負担を軽減するために、オートエンコーダなどのデータ圧縮技術を利用して、潜在変数を非コンパクト形式で送信することができる。
しかし、低帯域幅の制限や通信遅延のため、潜伏変数の次元の一部が通過時に失われて復元結果が縮退し、より高速な伝送を実現するために、潜伏変数の部分的要素のみを用いる意図的超過圧縮が用いられる。
これらの不完全なデータケースを処理するために,要素が部分的に失われたり,手作業で除外された潜在変数をインプテーションする手法を提案する。
toperform imputation with some dimension of variable, exploiting prior information of the category- or instance-levelis essential (英語)
一般に、変分オートエンコーダで使われる事前分布は、それらのラベルのすべてのトレーニングデータポイントから得られる。
このタイプのフラット化前処理は、カテゴリまたはインスタンスレベルの分布からインプテーションを実行するのが困難である。
関連論文リスト
- An adversarial feature learning based semantic communication method for Human 3D Reconstruction [0.559239450391449]
本稿では,人体3次元再構成のための適応的特徴学習ベースセマンティックコミュニケーション手法(AFLSC)を提案する。
本研究では,2次元画像から空間配置,キーポイント,姿勢,深度情報を抽出するマルチタスク学習に基づく特徴抽出手法を提案する。
また,これらの特徴情報を意味データにエンコードするための,敵対的特徴学習に基づく意味的符号化手法を設計する。
論文 参考訳(メタデータ) (2024-11-23T16:09:53Z) - WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks [7.775894876221921]
ムダGANと呼ばれる新しいGANアーキテクチャに基づくデータ拡張手法を提案する。
提案手法は,ラベル付きサンプルのごく限られたセットから,セマンティックセグメンテーションモデルの性能を向上させることができる。
次に、ムダGAN合成データに基づいて訓練されたモデルから予測される高品質なセグメンテーションマスクを活用し、セグメンテーション・アウェア・グルーピング・ポーズを計算する。
論文 参考訳(メタデータ) (2024-09-25T15:04:21Z) - Enhancing 3D Transformer Segmentation Model for Medical Image with Token-level Representation Learning [9.896550384001348]
本研究は、異なる拡張ビューからのトークン埋め込み間の合意を最大化するトークンレベルの表現学習損失を提案する。
また、入力ボリュームの1つの拡張ビューを回転・反転させ、後に特徴写像のトークンの順序を復元するシンプルな「回転・再保存」機構を発明する。
筆者らは2つの公開医療セグメント化データセットで事前トレーニングを行い、下流セグメンテーションタスクの結果は、他の最先端のプレトレーニング手法よりも、我々の方法の改善を示す。
論文 参考訳(メタデータ) (2024-08-12T01:49:13Z) - Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Less is More: On the Feature Redundancy of Pretrained Models When
Transferring to Few-shot Tasks [120.23328563831704]
事前訓練されたモデルを下流タスクに転送することは、ターゲットデータと線形探索を行うのと同じくらい簡単である。
線形探索では, 下流データが少ない場合に, 事前学習した特徴が極めて冗長であることを示す。
論文 参考訳(メタデータ) (2023-10-05T19:00:49Z) - 3D Adversarial Augmentations for Robust Out-of-Domain Predictions [115.74319739738571]
ドメイン外データへの一般化の改善に注力する。
対象を逆向きに変形させるベクトルの集合を学習する。
本研究では,学習したサンプル非依存ベクトルをモデルトレーニング時に利用可能なオブジェクトに適用することにより,対数拡大を行う。
論文 参考訳(メタデータ) (2023-08-29T17:58:55Z) - Neural Progressive Meshes [54.52990060976026]
本稿では,共有学習空間を用いた3次元メッシュの伝送手法を提案する。
分割型エンコーダ・デコーダアーキテクチャを用いて,この空間を学習する。
本手法は複雑な3次元形状を多種多様な形状で評価し, 圧縮率と復元品質の点で, ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-10T17:58:02Z) - Transformer Networks for Data Augmentation of Human Physical Activity
Recognition [61.303828551910634]
Recurrent Generative Adrial Networks (RGAN)のような最先端技術モデルは、リアルな合成データを生成するために使用される。
本稿では,データにグローバルな注意を払っているトランスフォーマーベースの生成敵ネットワークを,PAMAP2とリアルワールドヒューマンアクティビティ認識データセットでRGANと比較する。
論文 参考訳(メタデータ) (2021-09-02T16:47:29Z) - Transformers Solve the Limited Receptive Field for Monocular Depth
Prediction [82.90445525977904]
畳み込みニューラルネットワークとトランスの両方の恩恵を受けるアーキテクチャであるTransDepthを提案します。
連続ラベルを含む画素単位での予測問題にトランスフォーマーを適用する最初の論文である。
論文 参考訳(メタデータ) (2021-03-22T18:00:13Z) - Segmentation of Surgical Instruments for Minimally-Invasive
Robot-Assisted Procedures Using Generative Deep Neural Networks [17.571763112459166]
本研究は,極小侵襲手術器具のセマンティックセグメンテーションをトレーニングデータを用いて改善できることを証明した。
これを実現するために、ソースデータセットを変換してターゲットデータセットのドメイン分布を近似するCycleGANモデルを使用する。
完全ラベルを持つこの新たに生成されたデータは、セマンティックセグメンテーションニューラルネットワークであるU-Netのトレーニングに使用される。
論文 参考訳(メタデータ) (2020-06-05T14:39:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。