Fugu-MT 論文翻訳(概要): A data-science pipeline to enable the Interpretability of Many-Objective Feature Selection

論文の概要: A data-science pipeline to enable the Interpretability of Many-Objective Feature Selection

arxiv url: http://arxiv.org/abs/2311.18746v1
Date: Thu, 30 Nov 2023 17:44:22 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-01 15:35:21.097208
Title: A data-science pipeline to enable the Interpretability of Many-Objective Feature Selection
Title（参考訳）: 多目的特徴選択の解釈を可能にするデータサイエンスパイプライン
Authors: Uchechukwu F. Njoku, Alberto Abell\'o, Besim Bilalli, Gianluca Bontempi
Abstract要約: 多目的特徴選択(MOFS)アプローチは、4つ以上の目的を用いて、教師付き学習タスクにおける機能のサブセットの関連性を決定する。本稿では,MOFS結果の解釈と比較においてデータサイエンティストを支援する手法を提案する。
参考スコア（独自算出の注目度）: 0.1474723404975345
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Many-Objective Feature Selection (MOFS) approaches use four or more objectives to determine the relevance of a subset of features in a supervised learning task. As a consequence, MOFS typically returns a large set of non-dominated solutions, which have to be assessed by the data scientist in order to proceed with the final choice. Given the multi-variate nature of the assessment, which may include criteria (e.g. fairness) not related to predictive accuracy, this step is often not straightforward and suffers from the lack of existing tools. For instance, it is common to make use of a tabular presentation of the solutions, which provide little information about the trade-offs and the relations between criteria over the set of solutions. This paper proposes an original methodology to support data scientists in the interpretation and comparison of the MOFS outcome by combining post-processing and visualisation of the set of solutions. The methodology supports the data scientist in the selection of an optimal feature subset by providing her with high-level information at three different levels: objectives, solutions, and individual features. The methodology is experimentally assessed on two feature selection tasks adopting a GA-based MOFS with six objectives (number of selected features, balanced accuracy, F1-Score, variance inflation factor, statistical parity, and equalised odds). The results show the added value of the methodology in the selection of the final subset of features.
Abstract（参考訳）: 多目的特徴選択(mofs)アプローチは、4つ以上の目的を用いて教師付き学習タスクにおける特徴のサブセットの関連性を決定する。その結果、MOFSは通常、最終的な選択を進めるためにデータ科学者によって評価されなければならない大量の非支配的なソリューションを返します。予測精度に関係のない基準(例えば公正性)を含むような評価の多変量性を考えると、このステップは単純ではなく、既存のツールの欠如に悩まされることが多い。例えば、ソリューションセットに関するトレードオフや基準間の関係についてはほとんど情報を提供しない、ソリューションの表形式でのプレゼンテーションを利用するのが一般的である。本稿では,mofs結果の解釈と比較において,処理後と解集合の可視化を組み合わせることでデータサイエンティストを支援する手法を提案する。この方法論は、目的、ソリューション、個々の機能という3つの異なるレベルでハイレベルな情報を提供することで、データサイエンティストが最適な機能サブセットを選択することをサポートする。この手法は,GAベースのMOFSを6つの目的(選択された特徴数,平衡精度,F1スコア,分散インフレーション係数,統計パリティ,等化オッズ)で採用した2つの特徴選択タスクを実験的に評価した。その結果,機能の最終サブセットの選択において,方法論の付加価値が示された。

関連論文リスト

A High-Dimensional Feature Selection Algorithm Based on Multiobjective Differential Evolution [6.912442653561439]
多目的特徴選択は、最も差別的な特徴部分集合を決定する。提案手法は,最先端の多目的特徴選択手法よりも優れている。
論文参考訳（メタデータ） (2025-05-09T02:02:49Z)
Add-One-In: Incremental Sample Selection for Large Language Models via a Choice-Based Greedy Paradigm [50.492124556982674]
本稿では,新しい選択型サンプル選択フレームワークを提案する。個々のサンプル品質の評価から、異なるサンプルのコントリビューション値の比較へと焦点をシフトする。われわれのアプローチをより大きな医療データセットで検証し、現実の応用における実用性を強調した。
論文参考訳（メタデータ） (2025-03-04T07:32:41Z)
Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric [48.81957145701228]
サンプルレベルの「ノーベルティ」に基づく新しい多様性指標であるNovellSumを提案する。シミュレーションデータと実世界のデータの両方の実験により、NovellSumは正確に多様性の変動を捉え、命令調整されたモデルの性能と0.97の相関を達成している。
論文参考訳（メタデータ） (2025-02-24T14:20:22Z)
LLM-Select: Feature Selection with Large Language Models [64.5099482021597]
大規模言語モデル(LLM)は、データサイエンスの標準ツールに匹敵するパフォーマンスで、最も予測可能な機能を選択することができる。以上の結果から,LSMはトレーニングに最適な機能を選択するだけでなく,そもそもどの機能を収集すべきかを判断する上でも有用である可能性が示唆された。
論文参考訳（メタデータ） (2024-07-02T22:23:40Z)
Take the essence and discard the dross: A Rethinking on Data Selection for Fine-Tuning Large Language Models [36.22392593103493]
微調整された大規模言語モデル(LLM)のデータ選択は、既存のデータセットから高品質なサブセットを選択することを目的としている。既存の調査では、微調整フェーズの詳細な調査を見落としている。特徴抽出, 基準設計, セレクタ評価を含む新しい3段階の手法を導入し, これらの手法を体系的に分類し, 評価する。
論文参考訳（メタデータ） (2024-06-20T08:58:58Z)
Multi-Teacher Multi-Objective Meta-Learning for Zero-Shot Hyperspectral Band Selection [50.30291173608449]
ゼロショットハイパースペクトル帯選択のための新しい多目的メタラーニングネットワーク(M$3$BS)を提案する。 M$3$BSでは、データセットに依存しないベースを生成するために、一般化可能なグラフ畳み込みネットワーク(GCN)を構築している。取得したメタ知識は、トレーニングや微調整なしに、直接見えないデータセットに転送することができる。
論文参考訳（メタデータ） (2024-06-12T07:13:31Z)
A Contrast Based Feature Selection Algorithm for High-dimensional Data set in Machine Learning [9.596923373834093]
本稿では,異なるクラス間で示される相違点に基づいて識別的特徴を抽出する新しいフィルタ特徴選択手法であるContrastFSを提案する。提案手法の有効性と有効性について検証し,提案手法が無視可能な計算で良好に動作することを示す。
論文参考訳（メタデータ） (2024-01-15T05:32:35Z)
Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文参考訳（メタデータ） (2023-10-17T08:04:45Z)
Multi-Objective Genetic Algorithm for Multi-View Feature Selection [0.23343923880060582]
多視点データに対する従来の特徴選択手法の限界を克服する新しい遺伝的アルゴリズム戦略を提案する。提案手法は多視点多目的特徴選択遺伝的アルゴリズム (MMFS-GA) と呼ばれ、ビュー内およびビュー間における特徴の最適なサブセットを同時に選択する。合成データと実データを含む3つのベンチマークデータセットに対する評価結果から,最良基準法よりも優れた結果が得られた。
論文参考訳（メタデータ） (2023-05-26T13:25:20Z)
A User-Guided Bayesian Framework for Ensemble Feature Selection in Life Science Applications (UBayFS) [0.0]
本稿では,ベイズ統計フレームワークに組み込んだアンサンブル特徴選択手法UBayFSを提案する。提案手法は,データとドメイン知識の2つの情報源を考慮し,特徴選択のプロセスを強化する。標準的な機能セレクタとの比較では、UBayFSは競争力のあるパフォーマンスを実現し、ドメイン知識を組み込むための柔軟性を提供する。
論文参考訳（メタデータ） (2021-04-30T06:51:33Z)
Leveraging Expert Consistency to Improve Algorithmic Decision Support [62.61153549123407]
建設のギャップを狭めるために観測結果と組み合わせることができる情報源として,歴史専門家による意思決定の利用について検討する。本研究では,データ内の各ケースが1人の専門家によって評価された場合に,専門家の一貫性を間接的に推定する影響関数に基づく手法を提案する。本研究は, 児童福祉領域における臨床現場でのシミュレーションと実世界データを用いて, 提案手法が構成ギャップを狭めることに成功していることを示す。
論文参考訳（メタデータ） (2021-01-24T05:40:29Z)
Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文参考訳（メタデータ） (2020-11-13T10:53:27Z)
Feature Selection for Huge Data via Minipatch Learning [0.0]
安定ミニパッチ選択(STAMPS)と適応STAMPSを提案する。 STAMPSは、データの観測と特徴の両方の小さな(適応性の高い)ランダムなサブセットに基づいて訓練された基本特徴セレクタの選択イベントのアンサンブルを構築するメタアルゴリズムである。われわれのアプローチは一般的であり、様々な機能選択戦略や機械学習技術に応用できる。
論文参考訳（メタデータ） (2020-10-16T17:41:08Z)
Joint Adaptive Graph and Structured Sparsity Regularization for Unsupervised Feature Selection [6.41804410246642]
本稿では,共同適応グラフと構造付き空間正規化unsupervised feature selection (JASFS)法を提案する。最適な機能のサブセットがグループで選択され、選択された機能の数が自動的に決定される。 8つのベンチマーク実験の結果,提案手法の有効性と有効性を示した。
論文参考訳（メタデータ） (2020-10-09T08:17:04Z)
Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文参考訳（メタデータ） (2020-06-10T20:20:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。