論文の概要: Towards Zero-Shot Personalized Table-to-Text Generation with Contrastive
Persona Distillation
- arxiv url: http://arxiv.org/abs/2304.08911v1
- Date: Tue, 18 Apr 2023 11:32:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 15:09:47.267100
- Title: Towards Zero-Shot Personalized Table-to-Text Generation with Contrastive
Persona Distillation
- Title(参考訳): コントラスト型パーソナリティ蒸留によるゼロショットパーソナライズテーブル・ツー・テキスト生成に向けて
- Authors: Haolan Zhan and Xuming Lin and Shaobo Cui and Zhongzhou Zhao and Wei
Zhou and Haiqing Chen
- Abstract要約: ゼロショット設定下で、パーソナライズされたテーブル・ツー・テキスト生成を探索する。
コントラスト型ペルソナ蒸留 (S2P-CPD) を用いた半教師付きアプローチを提案し, パーソナライズされたコンテキストを生成する。
2つのベンチマーク実験の結果、S2P-CPDはコンテンツの忠実さとパーソナライズされた表現を維持する能力を示した。
- 参考スコア(独自算出の注目度): 18.599507980524244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing neural methods have shown great potentials towards generating
informative text from structured tabular data as well as maintaining high
content fidelity. However, few of them shed light on generating personalized
expressions, which often requires well-aligned persona-table-text datasets that
are difficult to obtain. To overcome these obstacles, we explore personalized
table-to-text generation under a zero-shot setting, by assuming no well-aligned
persona-table-text triples are required during training. To this end, we
firstly collect a set of unpaired persona information and then propose a
semi-supervised approach with contrastive persona distillation (S2P-CPD) to
generate personalized context. Specifically, tabular data and persona
information are firstly represented as latent variables separately. Then, we
devise a latent space fusion technique to distill persona information into the
table representation. Besides, a contrastive-based discriminator is employed to
guarantee the style consistency between the generated context and its
corresponding persona. Experimental results on two benchmarks demonstrate
S2P-CPD's ability on keeping both content fidelity and personalized
expressions.
- Abstract(参考訳): 既存のニューラルネットワークは、構造化された表データから情報的テキストを生成するとともに、高いコンテンツ忠実性を維持する上で大きな可能性を示している。
しかし、パーソナライズされた表現の生成に光を当てる人は少なく、それらは多くの場合、取得が難しい、適切に整列したペルソナテーブルテキストデータセットを必要とする。
これらの障害を克服するために,訓練中にパーソナライズされたペルソナテーブルトリプルを必要とせず,ゼロショット設定下でのパーソナライズされたテーブルツーテキスト生成について検討する。
この目的のために,まず非ペア型ペルソナ情報の集合を収集し,その後,対照型ペルソナ蒸留(s2p-cpd)を用いた半教師付きアプローチを提案し,パーソナライズされたコンテキストを生成する。
具体的には、表データとペルソナ情報をそれぞれ別々に潜在変数として表現する。
そこで我々は,テーブル表現にペルソナ情報を蒸留する潜在空間融合手法を考案した。
さらに、コントラストベースの識別器を用いて、生成されたコンテキストとその対応するペルソナ間のスタイル整合性を保証する。
2つのベンチマーク実験の結果、S2P-CPDがコンテンツ忠実性とパーソナライズされた表現を維持する能力を示した。
関連論文リスト
- CTG-KrEW: Generating Synthetic Structured Contextually Correlated Content by Conditional Tabular GAN with K-Means Clustering and Efficient Word Embedding [12.072052949955385]
条件付き Tabular Generative Adversarial Networks (CTGAN) は、合成データを効率的に作成する能力に魅力がある。
本稿では,属性が意味的・文脈的に一貫性のある単語の集合である現実的な合成データを生成するのに長けている新しいフレームワークCTGKrEWを紹介する。
CTGKrEWは、従来のアプローチに比べてCPU時間の約99%、メモリフットプリントを33%削減する。
論文 参考訳(メタデータ) (2024-09-03T05:53:57Z) - Neural Text Sanitization with Privacy Risk Indicators: An Empirical
Analysis [2.9311414545087366]
テキスト・サニタイズのための2段階のアプローチを検討し、その経験的性能を詳細に分析する。
テキストサニタイズプロセスは、プライバシー指向のエンティティ認識器から始まり、識別可能な個人情報を表すテキストを識別する。
本稿では,言語モデルの確率,テキストスパン分類,シーケンスラベリング,摂動,Web検索に基づく再識別リスクの指標を5つ提示する。
論文 参考訳(メタデータ) (2023-10-22T14:17:27Z) - Stylized Data-to-Text Generation: A Case Study in the E-Commerce Domain [53.22419717434372]
本稿では,特定のスタイルに従ってコヒーレントテキストを生成することを目的とした新しいタスク,すなわちスタイル化されたデータ・テキスト生成を提案する。
このタスクは、生成されたテキストのロジック、構造化されていないスタイル参照、バイアスのあるトレーニングサンプルという3つの課題のため、簡単ではない。
本稿では,論理計画型データ埋め込み,マスク型スタイル埋め込み,非バイアス型スタイリングテキスト生成の3つのコンポーネントからなる,新しいスタイル付きデータ・テキスト生成モデルであるStyleD2Tを提案する。
論文 参考訳(メタデータ) (2023-05-05T03:02:41Z) - Unsupervised Neural Stylistic Text Generation using Transfer learning
and Adapters [66.17039929803933]
応答生成のためのスタイル特化属性を学習するために,モデルパラメータの0.3%しか更新しない新しい転送学習フレームワークを提案する。
我々はPERSONALITY-CAPTIONSデータセットからスタイル固有の属性を学習する。
論文 参考訳(メタデータ) (2022-10-07T00:09:22Z) - Attend, Memorize and Generate: Towards Faithful Table-to-Text Generation
in Few Shots [58.404516361586325]
Few-shot table-to-text generation は、限られたデータを用いてテーブル内容を伝えるために、流動的で忠実な文を構成するタスクである。
本稿では,人間のテキスト生成プロセスに触発された新しい手法,覚醒と生成(AMG)を提案する。
論文 参考訳(メタデータ) (2022-03-01T20:37:20Z) - Generating More Pertinent Captions by Leveraging Semantics and Style on
Multi-Source Datasets [56.018551958004814]
本稿では,データソースの非一様結合をトレーニングすることで,流動的な記述を生成するタスクに対処する。
ノイズの多い画像とテキストのペアを持つ大規模データセットは、サブ最適の監視源を提供する。
本稿では,検索コンポーネントから抽出したスタイルトークンとキーワードを組み込むことにより,セマンティクスと記述スタイルを活用・分離することを提案する。
論文 参考訳(メタデータ) (2021-11-24T19:00:05Z) - DSSL: Deep Surroundings-person Separation Learning for Text-based Person
Retrieval [40.70100506088116]
本稿では,Deep Surroundings-person Separation Learning(DSSL)モデルを提案する。
周囲の分離・融合機構は、正確かつ効果的な周囲の分離を実現する上で重要な役割を担っている。
CUHK-PEDES上で提案したDSSLの評価実験を行った。
論文 参考訳(メタデータ) (2021-09-12T15:09:09Z) - Person-in-Context Synthesiswith Compositional Structural Space [59.129960774988284]
本研究では,コンテキスト合成におけるtextbfPersons という新たな問題を提案する。
コンテキストは、形状情報を欠いたバウンディングボックスオブジェクトレイアウトで指定され、キーポイントによる人物のポーズは、わずかに注釈付けされている。
入力構造におけるスターク差に対処するため、各(コンテキスト/人物)入力を「共有構成構造空間」に意図的に合成する2つの別個の神経枝を提案した。
この構造空間は多レベル特徴変調戦略を用いて画像空間にデコードされ、自己学習される
論文 参考訳(メタデータ) (2020-08-28T14:33:28Z) - Towards Faithful Neural Table-to-Text Generation with Content-Matching
Constraints [63.84063384518667]
そこで本研究では,トランスフォーマーをベースとした新たな生成フレームワークを提案する。
忠実度を強制する手法の中核となる技術は、テーブル-テキストの最適トランスポート・マッチング・ロスである。
忠実度を評価するため,テーブル・ツー・テキスト生成問題に特化した新しい自動尺度を提案する。
論文 参考訳(メタデータ) (2020-05-03T02:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。