論文の概要: PGST: a Polyglot Gender Style Transfer method
- arxiv url: http://arxiv.org/abs/2009.01040v2
- Date: Sat, 26 Jun 2021 02:39:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 18:36:42.468389
- Title: PGST: a Polyglot Gender Style Transfer method
- Title(参考訳): PGST:ポリグロットジェンダースタイル転送法
- Authors: Reza Khanmohammadi and Seyed Abolghasem Mirroshandel
- Abstract要約: PGSTは、ジェンダー領域における新しい多言語テキストスタイルのトランスファーアプローチである。
提案手法の事前定義された要素を満たすことで,複数の言語でスタイル転送手法を適用することが可能である。
本手法の多言語適用性を示すため,英語とペルシャ語の両方のコーパスに適用した。
- 参考スコア(独自算出の注目度): 5.220940151628734
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent developments in Text Style Transfer have led this field to be more
highlighted than ever. The task of transferring an input's style to another is
accompanied by plenty of challenges (e.g., fluency and content preservation)
that need to be taken care of. In this research, we introduce PGST, a novel
polyglot text style transfer approach in the gender domain, composed of
different constitutive elements. In contrast to prior studies, it is feasible
to apply a style transfer method in multiple languages by fulfilling our
method's predefined elements. We have proceeded with a pre-trained word
embedding for token replacement purposes, a character-based token classifier
for gender exchange purposes, and a beam search algorithm for extracting the
most fluent combination. Since different approaches are introduced in our
research, we determine a trade-off value for evaluating different models'
success in faking our gender identification model with transferred text. To
demonstrate our method's multilingual applicability, we applied our method on
both English and Persian corpora and ended up defeating our proposed gender
identification model by 45.6% and 39.2%, respectively. While this research's
focus is not limited to a specific language, our obtained evaluation results
are highly competitive in an analogy among English state of the art methods.
- Abstract(参考訳): 最近のテキストスタイル転送の発展により、この分野はこれまで以上に強調されるようになった。
入力のスタイルを別のものに移すというタスクには、処理が必要な多くの課題(例えば、フルエンシとコンテンツの保存)が伴う。
本研究では,ジェンダードメインにおける新しい多言語テキストスタイルのトランスファーアプローチであるPGSTについて紹介する。
先行研究とは対照的に,本手法の既定要素を満たすことで,複数の言語にスタイル転送法を適用することが可能である。
我々は,トークン置換目的の単語埋め込み,性別交換目的の文字に基づくトークン分類,最も精巧な組み合わせを抽出するビーム探索アルゴリズムについて検討した。
本研究では, 異なるアプローチが導入されているため, トランスファーテキストを用いた性別識別モデルのフェーキングにおいて, 異なるモデルの成功を評価するためのトレードオフ値を決定する。
本手法の多言語適用性を実証するため,英語とペルシャ語の両方に適用し,提案した性別識別モデルをそれぞれ45.6%,39.2%で破った。
本研究の焦点は特定の言語に限ったものではないが,得られた評価結果は,英語の手法の類似性において高い競争力を有する。
関連論文リスト
- Don't lose the message while paraphrasing: A study on content preserving
style transfer [61.38460184163704]
スタイル伝達研究の現実的な応用には,コンテンツ保存が不可欠である。
形式性伝達領域の例において、様々なスタイル転送モデルを比較する。
我々は,スタイル伝達のための最先端技術について,精密な比較研究を行っている。
論文 参考訳(メタデータ) (2023-08-17T15:41:08Z) - Target-Agnostic Gender-Aware Contrastive Learning for Mitigating Bias in
Multilingual Machine Translation [28.471506840241602]
ジェンダーバイアスは機械翻訳において重要な問題であり、バイアス軽減技術の研究が進行中である。
本稿では,新しいアプローチに基づくバイアス緩和手法を提案する。
Gender-Aware Contrastive Learning, GACLは、文脈性情報を非明示性単語の表現にエンコードする。
論文 参考訳(メタデータ) (2023-05-23T12:53:39Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Detecting Text Formality: A Study of Text Classification Approaches [78.11745751651708]
本研究は,統計的,ニューラルベース,トランスフォーマーベースの機械学習手法に基づく形式性検出手法の体系的研究を初めて行う。
単言語,多言語,言語横断の3種類の実験を行った。
本研究は,モノリンガルおよび多言語形式分類タスクのためのトランスフォーマーベースモデルに対するChar BiLSTMモデルの克服を示す。
論文 参考訳(メタデータ) (2022-04-19T16:23:07Z) - Under the Morphosyntactic Lens: A Multifaceted Evaluation of Gender Bias
in Speech Translation [20.39599469927542]
ジェンダーバイアスは言語技術に影響を及ぼす問題として広く認識されている。
現代の評価慣行のほとんどは、合成条件下での職業名詞の狭いセットに単語レベルの焦点をあてている。
このようなプロトコルは、性合意のモルフォシンタクティック連鎖を特徴とする文法性言語の重要な特徴を見落としている。
論文 参考訳(メタデータ) (2022-03-18T11:14:16Z) - Few-shot Controllable Style Transfer for Low-Resource Settings: A Study
in Indian Languages [13.980482277351523]
スタイル転送は、その内容を保持しながら入力文をターゲットスタイルに書き換えるタスクである。
パラフレーズ間のスタイリスティックな差異をモデル化した新しい手法により,数ショットスタイルのトランスファーの最先端を推し進める。
本モデルでは,5言語にまたがる形式性伝達およびコード混合付加における性能と出力の多様性を2~3倍に向上する。
論文 参考訳(メタデータ) (2021-10-14T14:16:39Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Robust Cross-lingual Embeddings from Parallel Sentences [65.85468628136927]
本稿では,文整合コーパスを利用して頑健な言語間単語表現を実現するCBOW手法のバイリンガル拡張を提案する。
提案手法は,他のすべての手法と比較して,言語間文検索性能を著しく向上させる。
また、ゼロショットのクロスランガル文書分類タスクにおいて、ディープRNN法と同等性を実現する。
論文 参考訳(メタデータ) (2019-12-28T16:18:33Z) - Exploring the Limits of Transfer Learning with a Unified Text-to-Text
Transformer [64.22926988297685]
下流タスクで微調整される前に、まずデータリッチタスクでモデルが事前訓練されるトランスファーラーニングは、自然言語処理(NLP)において強力な手法として登場した。
本稿では,すべてのテキストベースの言語問題をテキスト・トゥ・テキスト・フォーマットに変換する統一フレームワークにより,NLPのためのトランスファー学習手法を導入する状況について検討する。
論文 参考訳(メタデータ) (2019-10-23T17:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。