論文の概要: Dark patterns in e-commerce: a dataset and its baseline evaluations
- arxiv url: http://arxiv.org/abs/2211.06543v1
- Date: Sat, 12 Nov 2022 01:53:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 19:52:31.424119
- Title: Dark patterns in e-commerce: a dataset and its baseline evaluations
- Title(参考訳): eコマースにおけるダークパターン:データセットとそのベースライン評価
- Authors: Yuki Yada, Jiaying Feng, Tsuneo Matsumoto, Nao Fukushima, Fuyuko Kido,
Hayato Yamana
- Abstract要約: 我々は最先端の機械学習手法を用いて暗パターン検出のためのデータセットを構築した。
5倍のクロスバリデーションの結果,RoBERTaでは0.975の精度を達成できた。
- 参考スコア(独自算出の注目度): 0.14680035572775535
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dark patterns, which are user interface designs in online services, induce
users to take unintended actions. Recently, dark patterns have been raised as
an issue of privacy and fairness. Thus, a wide range of research on detecting
dark patterns is eagerly awaited. In this work, we constructed a dataset for
dark pattern detection and prepared its baseline detection performance with
state-of-the-art machine learning methods. The original dataset was obtained
from Mathur et al.'s study in 2019, which consists of 1,818 dark pattern texts
from shopping sites. Then, we added negative samples, i.e., non-dark pattern
texts, by retrieving texts from the same websites as Mathur et al.'s dataset.
We also applied state-of-the-art machine learning methods to show the automatic
detection accuracy as baselines, including BERT, RoBERTa, ALBERT, and XLNet. As
a result of 5-fold cross-validation, we achieved the highest accuracy of 0.975
with RoBERTa. The dataset and baseline source codes are available at
https://github.com/yamanalab/ec-darkpattern.
- Abstract(参考訳): オンラインサービスのユーザーインターフェースデザインであるダークパターンは、意図しないアクションをユーザに誘導する。
近年、プライバシーと公平性の問題としてダークパターンが提起されている。
このように、暗黒パターンの検出に関する幅広い研究が待ち望まれている。
本研究では,ダークパターン検出のためのデータセットを構築し,最先端機械学習手法によるベースライン検出性能を作成した。
オリジナルのデータセットは、ショッピングサイトから1,818の暗いパターンのテキストからなるMathurらの研究から2019年に得られた。
そして、Mathurらのデータセットと同じウェブサイトからテキストを検索することで、負のサンプル、すなわち非ダークパターンのテキストを追加した。
また,最新の機械学習手法を用いて,BERT,RoBERTa,ALBERT,XLNetなどの検出精度をベースラインとして示す。
5倍のクロスバリデーションの結果,RoBERTaでは0.975の精度を達成できた。
データセットとベースラインのソースコードはhttps://github.com/yamanalab/ec-darkpatternで入手できる。
関連論文リスト
- Detecting Deceptive Dark Patterns in E-commerce Platforms [0.0]
ダークパターン(ダークパターン)は、電子商取引サイトがウェブサイトに利益をもたらす方法でユーザーの振舞いを操作するために使う偽のユーザーインターフェースである。
既存のソリューションとしては、コンピュータビジョンと自然言語処理を使用するUIGuardや、検出可能性に基づいてダークパターンを分類するアプローチ、あるいはデータセットに基づいてトレーニングされた機械学習モデルを使用するアプローチなどがある。
我々は,Webスクレイピング手法と細調整されたBERT言語モデルを組み合わせることを提案する。
論文 参考訳(メタデータ) (2024-05-27T16:32:40Z) - Why is the User Interface a Dark Pattern? : Explainable Auto-Detection
and its Analysis [1.4474137122906163]
ダークパターンは、ユーザーが意図せず振る舞うオンラインサービスのための偽りのユーザーインターフェイスデザインである。
解釈可能なダークパターン自動検出,すなわち,特定のユーザインターフェースがダークパターンを持つものとして検出される理由について検討する。
我々の発見は、ユーザーがダークパターンで操作されることを防ぎ、より公平なインターネットサービスの構築を支援する可能性がある。
論文 参考訳(メタデータ) (2023-12-30T03:53:58Z) - Learn to Unlearn for Deep Neural Networks: Minimizing Unlearning
Interference with Gradient Projection [56.292071534857946]
最近のデータプライバシ法は、機械学習への関心を喚起している。
課題は、残りのデータセットに関する知識を変更することなく、忘れたデータに関する情報を捨てることである。
我々は、プロジェクテッド・グラディエント・アンラーニング(PGU)という、プロジェクテッド・グラディエント・ベースの学習手法を採用する。
トレーニングデータセットがもはやアクセスできない場合でも、スクラッチからスクラッチで再トレーニングされたモデルと同じような振る舞いをするモデルを、我々のアンラーニング手法が生成できることを実証するための実証的な証拠を提供する。
論文 参考訳(メタデータ) (2023-12-07T07:17:24Z) - Forecasting with Deep Learning [0.0]
本稿では,ディープラーニングを用いた時系列予測手法とその2つのデータセットに対する評価について述べる。
データセットの時系列に特定のバリエーションがあっても繰り返されるパターンが含まれている場合、単一の時系列を使用してディープラーニングネットワークをトレーニングすることができる。
株式市場の閉鎖価格のようなより構造化されていない時系列では、ネットワークは観測された最後の値を繰り返すベースラインのように機能する。
論文 参考訳(メタデータ) (2023-02-17T10:09:22Z) - On the Blind Spots of Model-Based Evaluation Metrics for Text Generation [79.01422521024834]
テキスト生成評価指標のロバスト性分析に有用であるが,しばしば無視される手法を探索する。
我々は、幅広い潜在的な誤差を設計、合成し、それらが測定値の余計な低下をもたらすかどうかを確認する。
私たちの実験では、既存のメトリクスの興味深い不感、バイアス、あるいは抜け穴が明らかになりました。
論文 参考訳(メタデータ) (2022-12-20T06:24:25Z) - TeST: Test-time Self-Training under Distribution Shift [99.68465267994783]
Test-Time Self-Training (TeST)は、あるソースデータとテスト時の新しいデータ分散に基づいてトレーニングされたモデルを入力する技術である。
また,TeSTを用いたモデルでは,ベースラインテスト時間適応アルゴリズムよりも大幅に改善されていることがわかった。
論文 参考訳(メタデータ) (2022-09-23T07:47:33Z) - Automated detection of dark patterns in cookie banners: how to do it
poorly and why it is hard to do it any other way [7.2834950390171205]
300のニュースサイトのクッキーバナーのデータセットを使用して、正確にそれを行う予測モデルをトレーニングした。
トレーニングされたモデルの正確性は有望ですが、改善の余地はたくさんあります。
我々は、人工知能に暗パターンの自動検出がもたらす学際的課題を詳細に分析する。
論文 参考訳(メタデータ) (2022-04-21T12:10:27Z) - Double Perturbation: On the Robustness of Robustness and Counterfactual
Bias Evaluation [109.06060143938052]
テストデータセットを超えたモデル弱点を明らかにするための"ダブル摂動"フレームワークを提案する。
この枠組みを,モデルの頑健さと英語における反事実バイアスの分析に使用される2つの摂動に基づくアプローチに応用する。
論文 参考訳(メタデータ) (2021-04-12T06:57:36Z) - Intrinsic Certified Robustness of Bagging against Data Poisoning Attacks [75.46678178805382]
emphdata中毒攻撃では、攻撃者は学習した機械学習モデルを破損させるためにいくつかのトレーニング例を変更し、削除し、または挿入する。
データ中毒攻撃に対するバッグングの本質的確固たる堅牢性を証明する。
本手法は, 任意の修正, 削除, 挿入を行う場合, MNIST 上で 911.1% の精度を達成している。
論文 参考訳(メタデータ) (2020-08-11T03:12:42Z) - Evaluating Models' Local Decision Boundaries via Contrast Sets [119.38387782979474]
テストデータの体系的なギャップを埋めるのに役立つNLPのための新しいアノテーションパラダイムを提案する。
10種類のNLPデータセットに対してコントラストセットを作成することで,コントラストセットの有効性を示す。
我々のコントラストセットは明示的には逆ではないが、モデルの性能は元のテストセットよりも大幅に低い。
論文 参考訳(メタデータ) (2020-04-06T14:47:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。