論文の概要: Polyjuice: Automated, General-purpose Counterfactual Generation
- arxiv url: http://arxiv.org/abs/2101.00288v1
- Date: Fri, 1 Jan 2021 18:34:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 11:10:21.915402
- Title: Polyjuice: Automated, General-purpose Counterfactual Generation
- Title(参考訳): polyjuice: 自動化された汎用の反事実生成
- Authors: Tongshuang Wu, Marco Tulio Ribeiro, Jeffrey Heer, Daniel S. Weld
- Abstract要約: 用途から反実数生成を解き放ち、まず汎用的な反実数を収集し、特定の用途に選定することを提案する。
我々は, 自動逆ファクト生成をテキスト生成とし, GPT-2を生成器Polyjuiceにファインチューンし, 流動的で多様な反ファクト生成を行う。
- 参考スコア(独自算出の注目度): 37.152326506591876
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Counterfactual examples have been shown to be useful for many applications,
including calibrating, evaluating, and explaining model decision boundaries.
However, previous methods for generating such counterfactual examples have been
tightly tailored to a specific application, used a limited range of linguistic
patterns, or are hard to scale. We propose to disentangle counterfactual
generation from its use cases, i.e., gather general-purpose counterfactuals
first, and then select them for specific applications. We frame the automated
counterfactual generation as text generation, and finetune GPT-2 into a
generator, Polyjuice, which produces fluent and diverse counterfactuals. Our
method also allows control over where perturbations happen and what they do. We
show Polyjuice supports multiple use cases: by generating diverse
counterfactuals for humans to label, Polyjuice helps produce high-quality
datasets for model training and evaluation, requiring 40% less human effort.
When used to generate explanations, Polyjuice helps augment feature attribution
methods to reveal models' erroneous behaviors.
- Abstract(参考訳): モデル決定境界の校正、評価、説明など、多くのアプリケーションでカウンターファクト例が有用であることが示されている。
しかし、そのような反実例を生成するための従来の方法は、特定のアプリケーションに密に調整され、限られた言語パターンを使用したり、スケールするのが困難であった。
そこで本研究では,まず汎用のファクトファクトファクトを収集し,それらを特定の用途に選択することを提案する。
我々は, 自動逆ファクト生成をテキスト生成とし, GPT-2を生成器Polyjuiceにファインチューンし, 流動的で多様な反ファクト生成を行う。
提案手法では,摂動の発生場所と行動の制御も可能である。
我々は、Polyjuiceが複数のユースケースをサポートすることを示した: 人間がラベルを付けるための多様なカウンターファクトを生成することにより、Polyjuiceはモデルトレーニングと評価のための高品質なデータセットの作成を支援し、人間の労力を40%削減する。
説明を生成するために使用されると、polyjuiceはモデルの誤った振る舞いを明らかにするために機能帰属法を強化するのに役立つ。
関連論文リスト
- The Integer Linear Programming Inference Cookbook [108.82092464025231]
このサーベイは、整数線形プログラムのインスタンスとして新しい推論問題をフレーミングするプロセスを通じて、読者を導くことを目的としている。
最後に、これらのレシピの使用例を2つ紹介する。
論文 参考訳(メタデータ) (2023-06-30T23:33:11Z) - CeFlow: A Robust and Efficient Counterfactual Explanation Framework for
Tabular Data using Normalizing Flows [11.108866104714627]
対実的説明は、望ましい結果を達成するためにサンプルの摂動を生成する解釈可能な機械学習の一形態である。
可変オートエンコーダ (VAE) を用いて実現可能な改善を実現するために, 最先端の対実的説明法を提案する。
我々は,連続的特徴と分類的特徴の混合型に対して正規化フローを利用する,堅牢で効率的な対実的説明フレームワークであるCeFlowを設計する。
論文 参考訳(メタデータ) (2023-03-26T09:51:04Z) - Twist Decoding: Diverse Generators Guide Each Other [116.20780037268801]
様々なモデルの恩恵を受けながらテキストを生成するシンプルで一般的な推論アルゴリズムであるTwist decodingを導入する。
我々の方法は、語彙、トークン化、あるいは生成順序が共有されていると仮定しない。
論文 参考訳(メタデータ) (2022-05-19T01:27:53Z) - $\textit{latent}$-GLAT: Glancing at Latent Variables for Parallel Text
Generation [65.29170569821093]
並列テキスト生成は、ジェネレーション効率の成功により、広く注目を集めています。
本稿では,単語分類情報を取得するために,離散潜在変数を用いた$textitlatent$-GLATを提案する。
実験結果から,本手法は自己回帰モデルを用いることなく,強いベースラインを達成できることが示唆された。
論文 参考訳(メタデータ) (2022-04-05T07:34:12Z) - Reframing Human-AI Collaboration for Generating Free-Text Explanations [46.29832336779188]
少数の人間が記述した例を用いて,自由テキストの説明を生成する作業について考察する。
クラウドソースによる説明よりも,GPT-3による説明の方が好まれる。
我々は、GPT-3と教師付きフィルタを組み合わせたパイプラインを作成し、二項受理性判定を介し、ループ内人間を組み込む。
論文 参考訳(メタデータ) (2021-12-16T07:31:37Z) - Measuring Coding Challenge Competence With APPS [54.22600767666257]
コード生成のベンチマークであるAPPSを紹介する。
私たちのベンチマークには1万の問題が含まれています。
GPT-Neoのような最近のモデルでは、導入問題のテストケースの約15%をパスできる。
論文 参考訳(メタデータ) (2021-05-20T17:58:42Z) - Evaluating the Disentanglement of Deep Generative Models through
Manifold Topology [66.06153115971732]
本稿では,生成モデルのみを用いた乱れの定量化手法を提案する。
複数のデータセットにまたがるいくつかの最先端モデルを実証的に評価する。
論文 参考訳(メタデータ) (2020-06-05T20:54:11Z) - Generating Natural Adversarial Hyperspectral examples with a modified
Wasserstein GAN [0.0]
本稿では,第2パラダイムに従う真のデータから,自然な逆例を生成できる新しい手法を提案する。
リモートセンシングデータセット上で逆スペクトル超スペクトルシグネチャを生成することによって,本手法の概念実証を行う。
論文 参考訳(メタデータ) (2020-01-27T07:32:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。