論文の概要: Text Counterfactuals via Latent Optimization and Shapley-Guided Search
- arxiv url: http://arxiv.org/abs/2110.11589v1
- Date: Fri, 22 Oct 2021 05:04:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-26 00:30:19.823858
- Title: Text Counterfactuals via Latent Optimization and Shapley-Guided Search
- Title(参考訳): 潜在最適化とshapleyガイド付き検索によるテキスト偽造
- Authors: Quintin Pope, Xiaoli Z. Fern
- Abstract要約: 本研究は,分類モデルにおける対実テキスト生成の問題について考察する。
我々は、モデルの予測を変えるために、テキストを最小限に変更することを目指している。
ホワイトボックスアプローチは、視覚における同様の問題にうまく適用されている。
- 参考スコア(独自算出の注目度): 15.919650185010491
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the problem of generating counterfactual text for a classifier as a
means for understanding and debugging classification. Given a textual input and
a classification model, we aim to minimally alter the text to change the
model's prediction. White-box approaches have been successfully applied to
similar problems in vision where one can directly optimize the continuous
input. Optimization-based approaches become difficult in the language domain
due to the discrete nature of text. We bypass this issue by directly optimizing
in the latent space and leveraging a language model to generate candidate
modifications from optimized latent representations. We additionally use
Shapley values to estimate the combinatoric effect of multiple changes. We then
use these estimates to guide a beam search for the final counterfactual text.
We achieve favorable performance compared to recent white-box and black-box
baselines using human and automatic evaluations. Ablation studies show that
both latent optimization and the use of Shapley values improve success rate and
the quality of the generated counterfactuals.
- Abstract(参考訳): 本稿では,分類の理解とデバッグの手段として,分類器の対実テキストを生成する問題について検討する。
テキスト入力と分類モデルを考えると,テキストを最小限に修正してモデルの予測を変更することが目的である。
ホワイトボックスアプローチは、連続入力を直接最適化できるビジョンの同様の問題に対してうまく適用されている。
最適化に基づくアプローチは、テキストの離散的な性質のため、言語領域では困難になる。
我々は、潜時空間を直接最適化し、最適化された潜時表現から候補修正を生成するために言語モデルを活用することでこの問題を回避する。
さらに,複数の変化の組合せ効果を推定するためにshapley値を用いる。
次に、これらの推定値を用いて、最終的な偽造テキストのビームサーチを誘導する。
近年のホワイトボックスベースラインやブラックボックスベースラインと比較して,人間および自動評価により良好な性能が得られる。
アブレーション研究は、潜在最適化とシェープリー値の使用の両方が成功率と生成した反事実の品質を向上させることを示した。
関連論文リスト
- Predicting from Strings: Language Model Embeddings for Bayesian Optimization [21.370382766970877]
文字列入力に対してコンテキスト内回帰を適用するパラダイムである Embed-then-Regress を提案する。
すべての入力を文字列として表現することで、さまざまなドメインに対して最適化のための汎用回帰を行うことができる。
論文 参考訳(メタデータ) (2024-10-14T06:22:11Z) - Confidence-aware Reward Optimization for Fine-tuning Text-to-Image Models [85.96013373385057]
人間のフィードバックデータに基づいて訓練された報酬関数を持つ微調整テキスト・ツー・イメージモデルは、モデル行動と人間の意図との整合性を実証した。
しかし、そのような報酬モデルによる過度な最適化は、単にプロキシの目的として機能し、微調整されたモデルの性能を損なう可能性がある。
本研究では,テキストプロンプトの集合に対して推定された報酬モデル信頼度に基づいてアライメントを強化する手法であるTextNormを提案する。
論文 参考訳(メタデータ) (2024-04-02T11:40:38Z) - Data-driven Prior Learning for Bayesian Optimisation [5.199765487172328]
PLeBOと先行転送は少ない評価で良好な入力が得られることを示す。
学習先を検証し,伝達学習手法の広さと比較する。
PLeBOと先行転送は少ない評価で良好な入力が得られることを示す。
論文 参考訳(メタデータ) (2023-11-24T18:37:52Z) - RegaVAE: A Retrieval-Augmented Gaussian Mixture Variational Auto-Encoder
for Language Modeling [79.56442336234221]
可変オートエンコーダ(VAE)に基づく検索拡張言語モデルであるRegaVAEを紹介する。
テキストコーパスを潜在空間にエンコードし、ソースとターゲットの両方のテキストから現在と将来の情報をキャプチャする。
各種データセットに対する実験結果から,テキスト生成品質と幻覚除去の大幅な改善が示された。
論文 参考訳(メタデータ) (2023-10-16T16:42:01Z) - Language Model Decoding as Direct Metrics Optimization [87.68281625776282]
現在の復号法は、異なる側面にわたる人間のテキストと整合するテキストを生成するのに苦労している。
本研究では,言語モデルからの復号化を最適化問題として,期待される性能と人間のテキストとの厳密なマッチングを目的とした。
この誘導分布は,人間のテキストの難易度を向上させることが保証されていることを証明し,人間のテキストの基本的な分布に対するより良い近似を示唆する。
論文 参考訳(メタデータ) (2023-10-02T09:35:27Z) - LRANet: Towards Accurate and Efficient Scene Text Detection with
Low-Rank Approximation Network [63.554061288184165]
低ランク近似に基づく新しいパラメータ化テキスト形状法を提案する。
異なるテキストの輪郭間の形状相関を探索することにより, 形状表現における一貫性, コンパクト性, 単純性, 頑健性を実現する。
我々はLRANetという名前の正確で効率的な任意の形状のテキスト検出器を実装した。
論文 参考訳(メタデータ) (2023-06-27T02:03:46Z) - Adaptive Meta-learner via Gradient Similarity for Few-shot Text
Classification [11.035878821365149]
本稿では, モデル一般化能力の向上を図るため, 適応型メタラーナをグラディエント類似性(AMGS)を介して提案する。
いくつかのベンチマークによる実験結果から,提案したAMGSは連続的にテキスト分類性能を向上することが示された。
論文 参考訳(メタデータ) (2022-09-10T16:14:53Z) - Fourier Representations for Black-Box Optimization over Categorical
Variables [34.0277529502051]
そこで本研究では,ブラックボックス評価のためのサロゲートモデルと組み合わせた既存手法を提案する。
このような表現を学習するために、サロゲートモデルを更新するための2つの異なる設定を検討する。
合成ベンチマークと実世界のRNA配列最適化および設計問題の数値実験により,提案手法の表現力を示す。
論文 参考訳(メタデータ) (2022-02-08T08:14:58Z) - Bridge the Gap Between CV and NLP! A Gradient-based Textual Adversarial
Attack Framework [17.17479625646699]
そこで本研究では,テキストの敵対的サンプルを作成するための統一的なフレームワークを提案する。
本稿では,T-PGD(Textual Projected Gradient Descent)という攻撃アルゴリズムを用いて,我々のフレームワークをインスタンス化する。
論文 参考訳(メタデータ) (2021-10-28T17:31:51Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Stochastic Optimization Forests [60.523606291705214]
標準的なランダムな森林アルゴリズムのように予測精度を向上させるために分割するのではなく、分割を選択した木を栽培し、下流の意思決定品質を直接最適化することで、森林決定政策の訓練方法を示す。
概略分割基準は、各候補分割に対して正確に最適化された森林アルゴリズムに近い性能を保ちながら、100倍のランニング時間を短縮できることを示す。
論文 参考訳(メタデータ) (2020-08-17T16:56:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。