論文の概要: VTruST: Controllable value function based subset selection for
Data-Centric Trustworthy AI
- arxiv url: http://arxiv.org/abs/2403.05174v1
- Date: Fri, 8 Mar 2024 09:28:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 20:16:16.544815
- Title: VTruST: Controllable value function based subset selection for
Data-Centric Trustworthy AI
- Title(参考訳): VTruST:Data-Centric Trustworthy AIのための制御可能な値関数に基づくサブセット選択
- Authors: Soumi Das, Shubhadip Nag, Shreyyash Sharma, Suparna Bhattacharya,
Sourangshu Bhattacharya
- Abstract要約: 信頼できるAIは、高度なアプリケーションにAIを広く採用するために不可欠である。
本稿では,データ中心型信頼性AI(DCTAI)-VTruSTのための制御可能なフレームワークを提案する。
VTruSTは、社会的、画像的、科学的なデータセットにおける最先端のベースラインよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 3.085064325893845
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Trustworthy AI is crucial to the widespread adoption of AI in high-stakes
applications with fairness, robustness, and accuracy being some of the key
trustworthiness metrics. In this work, we propose a controllable framework for
data-centric trustworthy AI (DCTAI)- VTruST, that allows users to control the
trade-offs between the different trustworthiness metrics of the constructed
training datasets. A key challenge in implementing an efficient DCTAI framework
is to design an online value-function-based training data subset selection
algorithm. We pose the training data valuation and subset selection problem as
an online sparse approximation formulation. We propose a novel online version
of the Orthogonal Matching Pursuit (OMP) algorithm for solving this problem.
Experimental results show that VTruST outperforms the state-of-the-art
baselines on social, image, and scientific datasets. We also show that the data
values generated by VTruST can provide effective data-centric explanations for
different trustworthiness metrics.
- Abstract(参考訳): 信頼に値するAIは、公正性、堅牢性、正確性を備えた高度なアプリケーションにAIを広く採用するために不可欠である。
本研究では,データ中心型信頼度AI(DCTAI)-VTruSTのための制御可能なフレームワークを提案する。
効率的なDCTAIフレームワークを実装する上で重要な課題は、オンライン価値関数ベースのトレーニングデータサブセット選択アルゴリズムを設計することである。
オンラインスパース近似定式化として,学習データ評価とサブセット選択問題を提案する。
そこで我々は,この問題を解決するために,Orthogonal Matching Pursuit (OMP)アルゴリズムのオンライン版を提案する。
実験の結果、VTruSTは社会的、画像的、科学的データセットの最先端のベースラインを上回っていることがわかった。
また、VTruSTが生成したデータ値が、信頼性の異なるメトリクスに対して効果的なデータ中心の説明を提供することを示す。
関連論文リスト
- Self-Training with Pseudo-Label Scorer for Aspect Sentiment Quad Prediction [54.23208041792073]
Aspect Sentiment Quad Prediction (ASQP) は、与えられたレビューに対して全てのクワッド(アスペクト項、アスペクトカテゴリー、意見項、感情極性)を予測することを目的としている。
ASQPタスクにおける重要な課題はラベル付きデータの不足であり、既存のメソッドのパフォーマンスを制限している。
そこで我々は,擬似ラベルスコアラーを用いた自己学習フレームワークを提案し,レビューと擬似ラベルの一致をスコアラーが評価する。
論文 参考訳(メタデータ) (2024-06-26T05:30:21Z) - LAVA: Data Valuation without Pre-Specified Learning Algorithms [20.578106028270607]
我々は、下流学習アルゴリズムに不利な方法でトレーニングデータを評価できる新しいフレームワークを導入する。
本研究では,訓練と検証セット間の非伝統的なクラスワイドワッサースタイン距離に基づいて,トレーニングセットに関連する検証性能のプロキシを開発する。
距離は、特定のリプシッツ条件下での任意のモデルに対する検証性能の上限を特徴付けることを示す。
論文 参考訳(メタデータ) (2023-04-28T19:05:16Z) - Benchmarking FedAvg and FedCurv for Image Classification Tasks [1.376408511310322]
本稿では,同じフェデレーションネットワークにおけるデータの統計的不均一性の問題に焦点をあてる。
FedAvg、FedProx、Federated Curvature(FedCurv)など、いくつかのフェデレートラーニングアルゴリズムがすでに提案されている。
この研究の副産物として、FLコミュニティからのさらなる比較を容易にするために使用したデータセットの非IIDバージョンをリリースします。
論文 参考訳(メタデータ) (2023-03-31T10:13:01Z) - VertiBayes: Learning Bayesian network parameters from vertically partitioned data with missing values [2.9707233220536313]
フェデレーション学習は、分散データに基づいて機械学習モデルをトレーニングすることを可能にする。
本稿では,垂直分割データ上でベイズネットワークを学習するためのVertiBayesという新しい手法を提案する。
提案手法は,従来のアルゴリズムを用いて学習したモデルに匹敵するモデルを生成する。
論文 参考訳(メタデータ) (2022-10-31T11:13:35Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Self-Supervised Pre-Training for Transformer-Based Person
Re-Identification [54.55281692768765]
トランスフォーマーに基づく教師付き事前訓練は、人物再識別(ReID)において大きなパフォーマンスを達成する
ImageNetとReIDデータセットのドメインギャップのため、通常、パフォーマンスを高めるために、より大きなトレーニング済みデータセットが必要です。
この研究は、データとモデル構造の観点から、事前トレーニングデータセットとReIDデータセットのギャップを軽減することを目的としている。
論文 参考訳(メタデータ) (2021-11-23T18:59:08Z) - Sample Selection for Fair and Robust Training [28.94276265328868]
公平でロバストなトレーニングのためのサンプル選択に基づくアルゴリズムを提案する。
提案アルゴリズムは,最先端技術に匹敵する公平性と堅牢性が得られることを示す。
論文 参考訳(メタデータ) (2021-10-27T07:17:29Z) - A Principled Approach to Data Valuation for Federated Learning [73.19984041333599]
フェデレートラーニング(FL)は、分散データソース上で機械学習(ML)モデルをトレーニングする一般的なテクニックである。
Shapley value (SV) はデータ値の概念として多くのデシラタを満たすユニークなペイオフスキームを定義する。
本稿では,FL に対応する SV の変種を提案する。
論文 参考訳(メタデータ) (2020-09-14T04:37:54Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。