論文の概要: Fork or Fail: Cycle-Consistent Training with Many-to-One Mappings
- arxiv url: http://arxiv.org/abs/2012.07412v3
- Date: Mon, 25 Jan 2021 11:18:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-09 02:29:33.944416
- Title: Fork or Fail: Cycle-Consistent Training with Many-to-One Mappings
- Title(参考訳): Fork or Fail: 複数対1マッピングによるサイクル一貫性トレーニング
- Authors: Qipeng Guo, Zhijing Jin, Ziyu Wang, Xipeng Qiu, Weinan Zhang, Jun Zhu,
Zheng Zhang, David Wipf
- Abstract要約: サイクル一貫性トレーニングは、2つの関心領域間の前方および逆マッピングの学習に広く用いられている。
我々は条件付き変分オートエンコーダ(cvae)アプローチを開発し、これは全射写像を暗黙の単射に変換するものと見なすことができる。
私たちのパイプラインは、グラフからテキストへの多様性を促進しながら、サイクルトレーニング中に多くのマッピングをキャプチャできます。
- 参考スコア(独自算出の注目度): 67.11712279612583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cycle-consistent training is widely used for jointly learning a forward and
inverse mapping between two domains of interest without the cumbersome
requirement of collecting matched pairs within each domain. In this regard, the
implicit assumption is that there exists (at least approximately) a
ground-truth bijection such that a given input from either domain can be
accurately reconstructed from successive application of the respective
mappings. But in many applications no such bijection can be expected to exist
and large reconstruction errors can compromise the success of cycle-consistent
training. As one important instance of this limitation, we consider
practically-relevant situations where there exists a many-to-one or surjective
mapping between domains. To address this regime, we develop a conditional
variational autoencoder (CVAE) approach that can be viewed as converting
surjective mappings to implicit bijections whereby reconstruction errors in
both directions can be minimized, and as a natural byproduct, realistic output
diversity can be obtained in the one-to-many direction. As theoretical
motivation, we analyze a simplified scenario whereby minima of the proposed
CVAE-based energy function align with the recovery of ground-truth surjective
mappings. On the empirical side, we consider a synthetic image dataset with
known ground-truth, as well as a real-world application involving natural
language generation from knowledge graphs and vice versa, a prototypical
surjective case. For the latter, our CVAE pipeline can capture such many-to-one
mappings during cycle training while promoting textural diversity for
graph-to-text tasks. Our code is available at github.com/QipengGuo/CycleGT
*A condensed version of this paper has been accepted to AISTATS 2021. This
version contains additional content and updates.
- Abstract(参考訳): サイクル一貫性のあるトレーニングは、各ドメイン内のマッチしたペアを収集するという面倒な要件なしに、2つの関心領域間の前方および逆のマッピングを共同学習するために広く使われている。
この点において、暗黙の仮定は、任意の領域から与えられた入力がそれぞれの写像の連続した適用から正確に再構成できるような(少なくともおよそ)接地単射が存在するということである。
しかし、多くのアプリケーションではそのような単射は存在せず、大規模な再構成エラーはサイクル一貫性トレーニングの成功を損なう可能性がある。
この制限の重要な例の1つとして、ドメイン間の多対一あるいは全射的マッピングが存在する、事実上関係のある状況を考える。
この状況に対処するために,条件付き変分オートエンコーダ(cvae)アプローチを開発し,両方向の再構成誤差を最小限に抑えるための全射写像を暗黙の単射に変換し,自然な副産物として1対1の方向に現実的な出力の多様性を求めることができる。
理論的動機として,提案したCVAEに基づくエネルギー関数の最小化が,地中トラス・サージェクティブ・マッピングの回復と一致するという簡易なシナリオを分析した。
経験的側面では、既知の基盤を持つ合成画像データセットと、知識グラフから自然言語を生成する現実のアプリケーション、そしてその逆の原型的な推測ケースを考える。
後者の場合、当社のcvaeパイプラインは、グラフからテキストへのタスクに対するテキストの多様性を促進しながら、サイクルトレーニング中にこのような多対一のマッピングをキャプチャすることができます。
我々のコードはgithub.com/QipengGuo/CycleGTで入手できる。
このバージョンには追加のコンテンツとアップデートが含まれている。
関連論文リスト
- RAGFormer: Learning Semantic Attributes and Topological Structure for Fraud Detection [8.050935113945428]
本稿では,transFormer(RAGFormer)を用いたRelation-Aware GNNという新しいフレームワークを提案する。
RAGFormerはセマンティック機能とトポロジ機能の両方をターゲットノードに埋め込む。
単純なネットワークはセマンティックエンコーダ、トポロジーエンコーダ、アテンション融合モジュールで構成される。
論文 参考訳(メタデータ) (2024-02-27T12:53:15Z) - Auto-Linear Phenomenon in Subsurface Imaging [31.36376355719394]
地表面イメージングは、フルウェーブフォームインバージョン(FWI)を解くことで、測定から物理特性を予測する。
通常、エンコーダとデコーダのネットワークを2つの領域のペアデータ(物理特性と測定)で訓練する。
本稿では, 線形写像がペアデータのみを必要とすることを示すとともに, エンコーダとデコーダの両方が自己教師付き学習によって各領域から学習可能であることを示す。
論文 参考訳(メタデータ) (2023-04-27T17:59:47Z) - Decoupled Multi-task Learning with Cyclical Self-Regulation for Face
Parsing [71.19528222206088]
顔解析のための周期的自己統制型デカップリング型マルチタスク学習を提案する。
具体的には、DML-CSRは、顔解析、バイナリエッジ、カテゴリエッジ検出を含むマルチタスクモデルを設計する。
提案手法は,Helen,CelebA-HQ,LapaMaskのデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-28T02:12:30Z) - Rethinking the Two-Stage Framework for Grounded Situation Recognition [61.93345308377144]
接地状況認識は「人間のような」事象理解に向けた重要なステップである。
既存のGSR手法では、第1段階で動詞を予測し、第2段階での意味的役割を検出するという、2段階の枠組みを採用している。
本稿では,CFVM (Coarse-to-Fine Verb Model) と Transformer-based Noun Model (TNM) で構成される新しいGSR用SituFormerを提案する。
論文 参考訳(メタデータ) (2021-12-10T08:10:56Z) - A Domain Gap Aware Generative Adversarial Network for Multi-domain Image
Translation [22.47113158859034]
本稿では,複数の領域にまたがって画像の変換を行う統一モデルを提案する。
単一の統一ジェネレータにより、モデルはグローバルな形状と複数のドメインにわたる局所的なテクスチャ情報との整合性を維持することができる。
論文 参考訳(メタデータ) (2021-10-21T00:33:06Z) - Image-to-image Mapping with Many Domains by Sparse Attribute Transfer [71.28847881318013]
教師なし画像と画像の変換は、2つの領域間の一対のマッピングを、ポイント間の既知のペアワイズ対応なしで学習することで構成される。
現在の慣例は、サイクル一貫性のあるGANでこのタスクにアプローチすることです。
そこで本研究では,ジェネレータを直接,潜在層における単純なスパース変換に制限する代替手法を提案する。
論文 参考訳(メタデータ) (2020-06-23T19:52:23Z) - Phase Consistent Ecological Domain Adaptation [76.75730500201536]
意味的セグメンテーション(意味的セグメンテーション)の課題に焦点をあてる。そこでは、注釈付き合成データが多用されるが、実際のデータへのアノテートは困難である。
視覚心理学に触発された最初の基準は、2つの画像領域間の地図が位相保存であることである。
第2の基準は、照明剤や撮像センサーの特性に関わらず、その画像に現れる環境統計、またはシーン内の規則を活用することを目的としている。
論文 参考訳(メタデータ) (2020-04-10T06:58:03Z) - Grounded and Controllable Image Completion by Incorporating Lexical
Semantics [111.47374576372813]
Lexical Semantic Image Completion (LSIC)は、芸術、デザイン、遺産保護に潜在的な応用をもたらす可能性がある。
視覚的文脈と語彙的文脈の両方に忠実な結果を生成することを提唱する。
LSICの大きな課題の1つは、ビジュアル・セマンティック・コンテキストの構造をモデル化し整合させることである。
論文 参考訳(メタデータ) (2020-02-29T16:54:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。