論文の概要: Extending Variability-Aware Model Selection with Bias Detection in
Machine Learning Projects
- arxiv url: http://arxiv.org/abs/2311.14214v1
- Date: Thu, 23 Nov 2023 22:08:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-27 16:13:40.451834
- Title: Extending Variability-Aware Model Selection with Bias Detection in
Machine Learning Projects
- Title(参考訳): 機械学習プロジェクトにおけるバイアス検出による変数認識モデル選択の拡張
- Authors: Cristina Tavares, Nathalia Nascimento, Paulo Alencar, Donald Cowan
- Abstract要約: 本稿では,機械学習プロジェクトにおけるバイアス検出による適応変数認識モデル選択手法の拡張について述べる。
提案手法は, モデル選択, 特にバイアスに関連する要因, およびそれらの相互作用に影響を及ぼす因子を明示することによって, 技術の現状を推し進めることを目的としている。
- 参考スコア(独自算出の注目度): 0.7646713951724013
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data science projects often involve various machine learning (ML) methods
that depend on data, code, and models. One of the key activities in these
projects is the selection of a model or algorithm that is appropriate for the
data analysis at hand. ML model selection depends on several factors, which
include data-related attributes such as sample size, functional requirements
such as the prediction algorithm type, and non-functional requirements such as
performance and bias. However, the factors that influence such selection are
often not well understood and explicitly represented. This paper describes
ongoing work on extending an adaptive variability-aware model selection method
with bias detection in ML projects. The method involves: (i) modeling the
variability of the factors that affect model selection using feature models
based on heuristics proposed in the literature; (ii) instantiating our
variability model with added features related to bias (e.g., bias-related
metrics); and (iii) conducting experiments that illustrate the method in a
specific case study to illustrate our approach based on a heart failure
prediction project. The proposed approach aims to advance the state of the art
by making explicit factors that influence model selection, particularly those
related to bias, as well as their interactions. The provided representations
can transform model selection in ML projects into a non ad hoc, adaptive, and
explainable process.
- Abstract(参考訳): データサイエンスプロジェクトは、データ、コード、モデルに依存するさまざまな機械学習(ML)メソッドを含むことが多い。
これらのプロジェクトにおける重要な活動の1つは、手元のデータ分析に適したモデルやアルゴリズムの選択である。
mlモデルの選択は、サンプルサイズなどのデータ関連属性、予測アルゴリズムタイプのような機能要件、パフォーマンスやバイアスなどの非機能要件など、いくつかの要因に依存する。
しかし、このような選択に影響を与える要因はよく理解されず、明確に表現される。
本稿では,mlプロジェクトにおけるバイアス検出を用いた適応的可変性認識モデル選択手法の拡張について述べる。
方法は次のとおりである。
(i)文献に提示されたヒューリスティックスに基づく特徴モデルを用いたモデル選択に影響する要因の変動のモデル化
(ii)バイアスに関連する追加機能(例えば、バイアス関連指標)による変動性モデルのインスタンス化、
(iii)心不全予測プロジェクトに基づいたアプローチを説明するための、特定のケーススタディにおける方法を示す実験を行うこと。
提案手法は,モデル選択に影響を及ぼす明示的な要因,特にバイアスに関連する要因を,その相互作用にもとづく技術の発展を目標としている。
提供された表現は、MLプロジェクトのモデル選択を非アドホックで適応的で説明可能なプロセスに変換することができる。
関連論文リスト
- Influence Functions for Scalable Data Attribution in Diffusion Models [52.92223039302037]
拡散モデルは、生成的モデリングに大きな進歩をもたらした。
しかし、彼らの普及はデータ属性と解釈可能性に関する課題を引き起こす。
本稿では,テキスト・インフルエンス・ファンクション・フレームワークを開発することにより,このような課題に対処することを目的とする。
論文 参考訳(メタデータ) (2024-10-17T17:59:02Z) - Revisiting Demonstration Selection Strategies in In-Context Learning [66.11652803887284]
大規模言語モデル(LLM)は、インコンテキスト学習(ICL)を用いて広範囲のタスクを実行するという印象的な能力を示している。
本研究ではまず,データとモデルの両方の側面から,この分散に寄与する要因を再検討し,実演の選択がデータとモデルに依存していることを確かめる。
本研究では,データとモデルに依存した実演選択手法である textbfTopK + ConE を提案する。
論文 参考訳(メタデータ) (2024-01-22T16:25:27Z) - Subjectivity in Unsupervised Machine Learning Model Selection [2.9370710299422598]
本研究では、モデル選択に関わる主観性を調べる例として、隠れマルコフモデルを用いる。
主観性の源泉には、異なる基準とメトリクスの重要性についての異なる意見、モデルがどのように同化されるべきなのか、データセットのサイズがモデル選択にどのように影響するかについての異なる見解が含まれる。
論文 参考訳(メタデータ) (2023-09-01T01:40:58Z) - A prediction and behavioural analysis of machine learning methods for
modelling travel mode choice [0.26249027950824505]
我々は、モデル選択に影響を及ぼす可能性のある重要な要因の観点から、複数のモデリング問題に対して異なるモデリングアプローチを体系的に比較する。
その結果,非凝集性予測性能が最も高いモデルでは,行動指標やアグリゲーションモードのシェアが低下することが示唆された。
MNLモデルは様々な状況において堅牢に機能するが、ML手法はWillingness to Payのような行動指標の推定を改善することができる。
論文 参考訳(メタデータ) (2023-01-11T11:10:32Z) - Selecting Treatment Effects Models for Domain Adaptation Using Causal
Knowledge [82.5462771088607]
監視されていないドメイン適応設定下でITE法用に特別に設計された新しいモデル選択メトリックを提案する。
特に,介入効果の予測が対象領域の既知の因果構造を満たすモデルを選択することを提案する。
論文 参考訳(メタデータ) (2021-02-11T21:03:14Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z) - Model-specific Data Subsampling with Influence Functions [37.64859614131316]
トレーニングポイントが様々な影響を持つ場合、ランダムサンプリングよりも優れたモデル固有データサブサンプリング戦略を開発する。
具体的には、影響関数を活用して、選択戦略をガイドし、理論的に証明し、我々のアプローチが素早く高品質なモデルを選択することを実証する。
論文 参考訳(メタデータ) (2020-10-20T12:10:28Z) - Feature Selection Methods for Uplift Modeling and Heterogeneous
Treatment Effect [1.349645012479288]
アップリフトモデリングは、サブグループレベルの治療効果を推定する因果学習手法である。
従来の機能選択の方法は、そのタスクには適していない。
本稿では,アップリフトモデリングのための特徴選択手法を提案する。
論文 参考訳(メタデータ) (2020-05-05T00:28:18Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。