論文の概要: Style Pooling: Automatic Text Style Obfuscation for Improved
Classification Fairness
- arxiv url: http://arxiv.org/abs/2109.04624v1
- Date: Fri, 10 Sep 2021 02:17:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-14 00:04:54.502391
- Title: Style Pooling: Automatic Text Style Obfuscation for Improved
Classification Fairness
- Title(参考訳): style pooling: 分類の公平性を改善するための自動テキストスタイル難読化
- Authors: Fatemehsadat Mireshghallah, Taylor Berg-Kirkpatrick
- Abstract要約: 求職アプリケーションの書き込みスタイルは、採用決定のバイアスにつながる可能性のある候補の保護された属性を明らかにする可能性がある。
本稿では,VAE ベースのフレームワークを提案する。テキスト自体を自動書き直しすることで,文体変換による人文文の文体的特徴を解消する。
- 参考スコア(独自算出の注目度): 32.3545569050269
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text style can reveal sensitive attributes of the author (e.g. race or age)
to the reader, which can, in turn, lead to privacy violations and bias in both
human and algorithmic decisions based on text. For example, the style of
writing in job applications might reveal protected attributes of the candidate
which could lead to bias in hiring decisions, regardless of whether hiring
decisions are made algorithmically or by humans. We propose a VAE-based
framework that obfuscates stylistic features of human-generated text through
style transfer by automatically re-writing the text itself. Our framework
operationalizes the notion of obfuscated style in a flexible way that enables
two distinct notions of obfuscated style: (1) a minimal notion that effectively
intersects the various styles seen in training, and (2) a maximal notion that
seeks to obfuscate by adding stylistic features of all sensitive attributes to
text, in effect, computing a union of styles. Our style-obfuscation framework
can be used for multiple purposes, however, we demonstrate its effectiveness in
improving the fairness of downstream classifiers. We also conduct a
comprehensive study on style pooling's effect on fluency, semantic consistency,
and attribute removal from text, in two and three domain style obfuscation.
- Abstract(参考訳): テキストスタイルは、著者の繊細な属性(例えば人種や年齢)を読者に示すことができ、それによって、テキストに基づく人間とアルゴリズムによる決定において、プライバシ侵害とバイアスにつながる。
例えば、ジョブアプリケーションで書くスタイルは、雇用決定がアルゴリズムでなされるか、あるいは人間によって行われるかに関わらず、雇用決定のバイアスにつながる可能性のある、候補者の保護された属性を明らかにする可能性がある。
テキスト自体を自動書き直し, スタイル変換を通じて, 人間の生成したテキストの様式的特徴を強調するvaeベースのフレームワークを提案する。
本フレームワークは,(1)学習中に見られる様々なスタイルを効果的に交差する最小限の概念,(2)テキストにすべての繊細な属性のスタイル的特徴を付加することにより難読化しようとする極大概念という,難読化スタイルの2つの異なる概念を可能にする柔軟な方法で難読化スタイルの概念を運用する。
当社のスタイル難読化フレームワークは,複数の目的に使用できるが,下流分類器の公平性向上に有効性を示す。
また,スタイルプーリングがテキストの流束性,意味的一貫性,属性除去に与えた影響を,ドメインスタイルの難読化として包括的に研究している。
関連論文リスト
- RealCustom: Narrowing Real Text Word for Real-Time Open-Domain
Text-to-Image Customization [57.86083349873154]
テキスト・ツー・イメージのカスタマイズは、与えられた被験者に対してテキスト駆動の画像を合成することを目的としている。
既存の作品は擬似語パラダイム、すなわち、与えられた主題を擬似語として表現し、与えられたテキストで合成する。
我々は、RealCustomを初めて、被写体の影響を関連部分のみに正確に制限することで、制御性から類似性を解き放つことを提示する。
論文 参考訳(メタデータ) (2024-03-01T12:12:09Z) - Learning to Generate Text in Arbitrary Writing Styles [6.7308816341849695]
言語モデルは、潜在的に小さな文章サンプルに基づいて、著者固有のスタイルでテキストを作成することが望ましい。
本稿では,テクスチャ的特徴を捉えた対照的に訓練された表現を用いて,ターゲットスタイルのテキストを生成するための言語モデルを提案する。
論文 参考訳(メタデータ) (2023-12-28T18:58:52Z) - ParaGuide: Guided Diffusion Paraphrasers for Plug-and-Play Textual Style
Transfer [57.6482608202409]
テキストスタイル転送は、意味を保ちながらテキストのスタイル特性を変換するタスクである。
任意のスタイルに柔軟に適応できる汎用型転送のための新しい拡散型フレームワークを提案する。
本研究では,人的評価と自動評価の両面から,Enron Email Corpusの手法を検証するとともに,形式性,感情,さらにはオーサシップスタイルの伝達にも優れることを示す。
論文 参考訳(メタデータ) (2023-08-29T17:36:02Z) - MSSRNet: Manipulating Sequential Style Representation for Unsupervised
Text Style Transfer [82.37710853235535]
教師なしのテキストスタイル転送タスクは、メインのコンテンツを保持しながらテキストをターゲットのスタイルに書き換えることを目的としている。
従来の方法では、固定サイズのベクトルを使ってテキストスタイルを規制するが、個々のトークンのスタイル強度を正確に伝達することは困難である。
提案手法は,テキスト中の各トークンに個々のスタイルベクトルを割り当てることでこの問題に対処する。
論文 参考訳(メタデータ) (2023-06-12T13:12:29Z) - Stylized Data-to-Text Generation: A Case Study in the E-Commerce Domain [53.22419717434372]
本稿では,特定のスタイルに従ってコヒーレントテキストを生成することを目的とした新しいタスク,すなわちスタイル化されたデータ・テキスト生成を提案する。
このタスクは、生成されたテキストのロジック、構造化されていないスタイル参照、バイアスのあるトレーニングサンプルという3つの課題のため、簡単ではない。
本稿では,論理計画型データ埋め込み,マスク型スタイル埋め込み,非バイアス型スタイリングテキスト生成の3つのコンポーネントからなる,新しいスタイル付きデータ・テキスト生成モデルであるStyleD2Tを提案する。
論文 参考訳(メタデータ) (2023-05-05T03:02:41Z) - Conversation Style Transfer using Few-Shot Learning [56.43383396058639]
本稿では,会話スタイルの伝達を数ショットの学習問題として紹介する。
そこで本研究では,スタイルフリー対話による課題をピボットとして解くための,コンテキスト内学習手法を提案する。
会話スタイルの転送は下流のタスクにも役立ちます。
論文 参考訳(メタデータ) (2023-02-16T15:27:00Z) - SLOGAN: Handwriting Style Synthesis for Arbitrary-Length and
Out-of-Vocabulary Text [35.83345711291558]
本稿では,任意の長文と語彙外文に対して,パラメータ化および制御可能な手書きスタイルを合成する手法を提案する。
我々は、容易に入手可能な印刷スタイルの画像を提供することで、テキストコンテンツを埋め込むことにより、コンテンツの多様性を柔軟に達成することができる。
本手法は,学習語彙に含まれない単語を,様々な新しいスタイルで合成することができる。
論文 参考訳(メタデータ) (2022-02-23T12:13:27Z) - From Theories on Styles to their Transfer in Text: Bridging the Gap with
a Hierarchical Survey [10.822011920177408]
スタイル転送は、既存のテキストを書き換え、望ましいスタイル特性を示すパラフレーズを作成することを目的としている。
少数の調査では、この分野の方法論的な概要が示されているが、研究者が特定のスタイルにフォーカスするのを支援していない。
それらを階層に整理し、それぞれの定義の課題を強調し、現在の研究状況のギャップを指摘します。
論文 参考訳(メタデータ) (2021-10-29T15:53:06Z) - Protecting Anonymous Speech: A Generative Adversarial Network
Methodology for Removing Stylistic Indicators in Text [2.9005223064604078]
我々は,生成的敵ネットワークの構築によるオーサリングの匿名化への新たなアプローチを開発する。
完全自動方式は,コンテンツ保存や流布の点で他の手法と同等の結果が得られる。
我々のアプローチは、オープンセットの文脈に順応し、これまで遭遇したことのない著者の文章を匿名化することができる。
論文 参考訳(メタデータ) (2021-10-18T17:45:56Z) - Separating Content from Style Using Adversarial Learning for Recognizing
Text in the Wild [103.51604161298512]
画像中の複数の文字の生成と認識のための逆学習フレームワークを提案する。
我々のフレームワークは、新しい最先端の認識精度を達成するために、最近の認識手法に統合することができる。
論文 参考訳(メタデータ) (2020-01-13T12:41:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。