論文の概要: Zero-shot Synthesis with Group-Supervised Learning
- arxiv url: http://arxiv.org/abs/2009.06586v3
- Date: Tue, 16 Feb 2021 21:19:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 11:25:13.359281
- Title: Zero-shot Synthesis with Group-Supervised Learning
- Title(参考訳): グループ教師付き学習によるゼロショット合成
- Authors: Yunhao Ge, Sami Abu-El-Haija, Gan Xin and Laurent Itti
- Abstract要約: 我々は,GSL(Group-Supervised Learning)と呼ばれる新しい学習フレームワークとして,実例群に表現された目的関数群を提案する。
GSLは、入力をスワップ可能なコンポーネントで切り離した表現に分解し、新しいサンプルを合成するために再結合することができる。
本稿では,学習フレームワークで学習したグループ教師付きゼロショット合成ネットワーク(GZS-Net)を,自動エンコーダに基づく実装として提案する。
- 参考スコア(独自算出の注目度): 19.77358298837775
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual cognition of primates is superior to that of artificial neural
networks in its ability to 'envision' a visual object, even a newly-introduced
one, in different attributes including pose, position, color, texture, etc. To
aid neural networks to envision objects with different attributes, we propose a
family of objective functions, expressed on groups of examples, as a novel
learning framework that we term Group-Supervised Learning (GSL). GSL allows us
to decompose inputs into a disentangled representation with swappable
components, that can be recombined to synthesize new samples. For instance,
images of red boats & blue cars can be decomposed and recombined to synthesize
novel images of red cars. We propose an implementation based on auto-encoder,
termed group-supervised zero-shot synthesis network (GZS-Net) trained with our
learning framework, that can produce a high-quality red car even if no such
example is witnessed during training. We test our model and learning framework
on existing benchmarks, in addition to anew dataset that we open-source. We
qualitatively and quantitatively demonstrate that GZS-Net trained with GSL
outperforms state-of-the-art methods.
- Abstract(参考訳): 霊長類の視覚認知は、ポーズ、位置、色、テクスチャなどの異なる特性で、新たに導入されたものでさえ、視覚オブジェクトを「強調」する能力において、人工ニューラルネットワークよりも優れている。
ニューラルネットワークがさまざまな属性を持つオブジェクトを想定するのを助けるために,GSL(Group-Supervised Learning)と呼ばれる新しい学習フレームワークとして,サンプル群に表現された目的関数のファミリーを提案する。
GSLは、入力をスワップ可能なコンポーネントで切り離した表現に分解し、新しいサンプルを合成するために再結合することができる。
例えば、赤いボートと青い車のイメージを分解して再結合することで、赤い車の新しいイメージを合成することができる。
本稿では,学習フレームワークを用いたグループ教師付きゼロショット合成ネットワーク(gzs-net,group-supervised zero-shot synthesis network)と呼ばれるオートエンコーダに基づく実装を提案する。
私たちは、新しいデータセットに加えて、既存のベンチマークでモデルと学習フレームワークをテストします。
GSLで訓練したGZS-Netが最先端の手法より優れていることを示す。
関連論文リスト
- Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - LowDINO -- A Low Parameter Self Supervised Learning Model [0.0]
本研究は,小規模ネットワークが巨大ネットワークの特性を活用可能なニューラルネットワークアーキテクチャの設計の可能性を検討することを目的とする。
これまでの研究では、畳み込みニューラルネットワーク(ConvNet)を使用することで、固有の帰納バイアスが得られることが示されている。
パラメータの数を減らすために、MobileViTブロックを使用してアテンションメカニズムを利用する。
論文 参考訳(メタデータ) (2023-05-28T18:34:59Z) - Extracting Semantic Knowledge from GANs with Unsupervised Learning [65.32631025780631]
GAN(Generative Adversarial Networks)は、特徴写像のセマンティクスを線形に分離可能な形でエンコードする。
本稿では,線形分離性を利用してGANの特徴をクラスタリングする新しいクラスタリングアルゴリズムKLiSHを提案する。
KLiSHは、さまざまなオブジェクトのデータセットに基づいてトレーニングされたGANのきめ細かいセマンティクスの抽出に成功している。
論文 参考訳(メタデータ) (2022-11-30T03:18:16Z) - Knowledge Transfer For On-Device Speech Emotion Recognition with Neural
Structured Learning [19.220263739291685]
音声感情認識(SER)は、ヒューマン・コンピュータ・インタラクション(HCI)において人気のある研究トピックである。
合成グラフ構築によるニューラル構造化学習(NSL)フレームワークを提案する。
実験の結果,音声サンプルとグラフを用いた軽量SERモデルの訓練は,小さなSERモデルを生成するだけでなく,モデル性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-10-26T18:38:42Z) - Learning Primitive-aware Discriminative Representations for Few-shot
Learning [28.17404445820028]
少ないショットラーニングは、いくつかのラベル付き例で、新しいクラスを容易に認識できる分類器を学習することを目的としている。
プリミティブ・マイニング・アンド・リ共振ネットワーク(PMRN)を提案し,プリミティブ・アウェアな表現を学習する。
提案手法は,6つの標準ベンチマークの最先端結果を実現する。
論文 参考訳(メタデータ) (2022-08-20T16:22:22Z) - Recursive Neural Programs: Variational Learning of Image Grammars and
Part-Whole Hierarchies [1.5990720051907859]
本稿では,部分階層学習問題に対処するため,再帰的ニューラルプログラム(RNP)を導入する。
RNPは、部分階層学習問題に対処する最初の神経生成モデルである。
以上の結果から,RNPはオブジェクトやシーンを直感的で説明可能な構成方法であることがわかった。
論文 参考訳(メタデータ) (2022-06-16T22:02:06Z) - Neural Body: Implicit Neural Representations with Structured Latent
Codes for Novel View Synthesis of Dynamic Humans [56.63912568777483]
本稿では,人間の演奏者に対する新しい視点合成の課題について,カメラビューの少なさから考察する。
異なるフレームで学習されたニューラルネットワーク表現が、変形可能なメッシュにアンカーされた同じ遅延コードセットを共有することを前提とした新しい人体表現であるNeural Bodyを提案する。
ZJU-MoCapの実験により、我々の手法は、新規なビュー合成品質において、先行研究よりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-12-31T18:55:38Z) - Understanding the Role of Individual Units in a Deep Neural Network [85.23117441162772]
本稿では,画像分類と画像生成ネットワーク内の隠れ単位を系統的に同定する分析フレームワークを提案する。
まず、シーン分類に基づいて訓練された畳み込みニューラルネットワーク(CNN)を分析し、多様なオブジェクト概念にマッチするユニットを発見する。
第2に、シーンを生成するために訓練されたGANモデルについて、同様の分析手法を用いて分析する。
論文 参考訳(メタデータ) (2020-09-10T17:59:10Z) - Neural Cellular Automata Manifold [84.08170531451006]
ニューラルセルラーオートマタのニューラルネットワークアーキテクチャは、より大きなNNにカプセル化可能であることを示す。
これにより、NAAの多様体を符号化する新しいモデルを提案し、それぞれが異なる画像を生成することができる。
生物学的には、我々のアプローチは転写因子の役割を担い、細胞の分化を促進する特定のタンパク質への遺伝子マッピングを調節する。
論文 参考訳(メタデータ) (2020-06-22T11:41:57Z) - Self-Supervised Viewpoint Learning From Image Collections [116.56304441362994]
本稿では,解析・合成パラダイムを取り入れた新たな学習フレームワークを提案する。
提案手法は,人間の顔,車,バス,電車など,複数の対象カテゴリに対して,完全に教師されたアプローチに対して競争力を発揮することを示す。
論文 参考訳(メタデータ) (2020-04-03T22:01:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。