論文の概要: Multi-modal data generation with a deep metric variational autoencoder
- arxiv url: http://arxiv.org/abs/2202.03434v1
- Date: Mon, 7 Feb 2022 15:00:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 08:11:21.575166
- Title: Multi-modal data generation with a deep metric variational autoencoder
- Title(参考訳): ディープメトリック変分オートエンコーダを用いたマルチモーダルデータ生成
- Authors: Josefine Vilsb{\o}ll Sundgaard, Morten Rieger Hannemose, S{\o}ren
Laugesen, Peter Bray, James Harte, Yosuke Kamide, Chiemi Tanaka, Rasmus R.
Paulsen, and Anders Nymark Christensen
- Abstract要約: 変分オートエンコーダは、潜時空間における三重項損失を採用し、各クラスクラスタ内の潜時空間をサンプリングすることで条件付きデータ生成を可能にする。
本手法は, 広帯域ティンパノメトリー測定による鼓膜観察画像からなるマルチモーダルデータセットを用いて評価した。
- 参考スコア(独自算出の注目度): 1.3315493279442265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a deep metric variational autoencoder for multi-modal data
generation. The variational autoencoder employs triplet loss in the latent
space, which allows for conditional data generation by sampling in the latent
space within each class cluster. The approach is evaluated on a multi-modal
dataset consisting of otoscopy images of the tympanic membrane with
corresponding wideband tympanometry measurements. The modalities in this
dataset are correlated, as they represent different aspects of the state of the
middle ear, but they do not present a direct pixel-to-pixel correlation. The
approach shows promising results for the conditional generation of pairs of
images and tympanograms, and will allow for efficient data augmentation of data
from multi-modal sources.
- Abstract(参考訳): マルチモーダルデータ生成のためのディープメトリック変分オートエンコーダを提案する。
変分オートエンコーダは、各クラスクラスタ内の潜在空間でサンプリングすることで条件付きデータ生成を可能にする潜在空間における三重項損失を用いる。
本手法は, 広帯域ティンパノメトリー測定による鼓膜観察画像からなるマルチモーダルデータセットを用いて評価した。
このデータセットのモダリティは、中耳の状態の異なる側面を表すため相関するが、直接の画素間相関は示さない。
このアプローチは、画像とタイパノグラムのペアの条件付き生成に有望な結果を示し、マルチモーダルソースからのデータの効率的なデータ拡張を可能にする。
関連論文リスト
- Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Modified CycleGAN for the synthesization of samples for wheat head
segmentation [0.09999629695552192]
注釈付きデータセットがない場合は、モデル開発に合成データを使用することができる。
そこで我々は,小麦頭部分割のための現実的な注釈付き合成データセットを開発した。
その結果、Diceのスコアは内部データセットで83.4%、外部のGlobal Wheat Head Detectionデータセットで83.6%に達した。
論文 参考訳(メタデータ) (2024-02-23T06:42:58Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion
Models [61.906934570771256]
多様な合成画像や知覚アノテーションを生成できる汎用データセット生成モデルを提案する。
本手法は,事前学習した拡散モデルに基づいて,テキスト誘導画像合成を知覚データ生成に拡張する。
拡散モデルのリッチ潜時コードはデコーダモジュールを用いて正確な認識アノテーションとして効果的に復号できることを示す。
論文 参考訳(メタデータ) (2023-08-11T14:38:11Z) - Implicit Data Augmentation Using Feature Interpolation for Diversified
Low-Shot Image Generation [11.4559888429977]
生成モデルのトレーニングは、低データ設定で容易に発散することができる。
そこで本研究では,安定したトレーニングと多様なサンプルの合成を容易にする,新しい暗黙的データ拡張手法を提案する。
論文 参考訳(メタデータ) (2021-12-04T23:55:46Z) - Mixture Model Auto-Encoders: Deep Clustering through Dictionary Learning [72.9458277424712]
Mixture Model Auto-Encoders (MixMate)は、生成モデルで推論を実行することでデータをクラスタリングする新しいアーキテクチャである。
最先端のディープクラスタリングアルゴリズムと比較して,MixMateは競争性能が高いことを示す。
論文 参考訳(メタデータ) (2021-10-10T02:30:31Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Self-Supervised Multimodal Domino: in Search of Biomarkers for
Alzheimer's Disease [19.86082635340699]
自己監督型表現学習アルゴリズムを編成する合理的な方法の分類法を提案する。
まず,おもちゃのマルチモーダルMNISTデータセットのモデルを評価し,アルツハイマー病患者を用いたマルチモーダル・ニューロイメージングデータセットに適用した。
提案手法は,従来の自己教師付きエンコーダデコーダ法よりも優れていた。
論文 参考訳(メタデータ) (2020-12-25T20:28:13Z) - Multi-temporal and multi-source remote sensing image classification by
nonlinear relative normalization [17.124438150480326]
emカーネル化により,異なるドメインのデータを非線形に整列する手法を検討する。
我々は,超スペクトルイメージングのためのシャドウイングに不変なモデルを作成する作業に加えて,多時間的および多元的超高分解能分類タスクにおいてkemaのテストに成功した。
論文 参考訳(メタデータ) (2020-12-07T08:46:11Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。