論文の概要: FeatureEnVi: Visual Analytics for Feature Engineering Using Stepwise
Selection and Semi-Automatic Extraction Approaches
- arxiv url: http://arxiv.org/abs/2103.14539v1
- Date: Fri, 26 Mar 2021 15:45:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-29 12:52:17.532353
- Title: FeatureEnVi: Visual Analytics for Feature Engineering Using Stepwise
Selection and Semi-Automatic Extraction Approaches
- Title(参考訳): FeatureEnVi: ステップワイズ選択と半自動抽出アプローチを用いた機能エンジニアリングのためのビジュアル分析
- Authors: Angelos Chatzimparmpas, Rafael M. Martins, Kostiantyn Kucher, Andreas
Kerren
- Abstract要約: 我々は,機能工学的プロセスを支援するビジュアル分析システムであるfeatureenviを提案する。
提案システムは,ユーザが最も重要な機能を選択し,元の機能を強力な代替品に転換し,異なる機能生成の組み合わせを試すのに役立つ。
FeatureEnViの有用性と適用性は、人気のある赤ワインの品質データセットと、シルエットからの車両認識に関する公開データを用いて、2つのユースケースで実証される。
- 参考スコア(独自算出の注目度): 5.890700712095962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The machine learning (ML) life cycle involves a series of iterative steps,
from the effective gathering and preparation of the data, including complex
feature engineering processes, to the presentation and improvement of results,
with various algorithms to choose from in every step. Feature engineering in
particular can be very beneficial for ML, leading to numerous improvements such
as boosting the predictive results, decreasing computational times, reducing
excessive noise, and increasing the transparency behind the decisions taken
during the training. Despite that, while several visual analytics tools exist
to monitor and control the different stages of the ML life cycle (especially
those related to data and algorithms), feature engineering support remains
inadequate. In this paper, we present FeatureEnVi, a visual analytics system
specifically designed to assist with the feature engineering process. Our
proposed system helps users to choose the most important feature, to transform
the original features into powerful alternatives, and to experiment with
different feature generation combinations. Additionally, data space slicing
allows users to explore the impact of features on both local and global scales.
FeatureEnVi utilizes multiple automatic feature selection techniques;
furthermore, it visually guides users with statistical evidence about the
influence of each feature (or subsets of features). The final outcome is the
extraction of heavily engineered features, evaluated by multiple validation
metrics. The usefulness and applicability of FeatureEnVi are demonstrated with
two use cases, using a popular red wine quality data set and publicly available
data related to vehicle recognition from their silhouettes. We also report
feedback from interviews with ML experts and a visualization researcher who
assessed the effectiveness of our system.
- Abstract(参考訳): 機械学習(ML)のライフサイクルは、複雑な特徴エンジニアリングプロセスを含むデータの効率的な収集と準備から、プレゼンテーションと結果の改善に至るまで、さまざまなステップから選択するアルゴリズムを含む一連の反復的なステップを含む。
特に機能エンジニアリングはMLにとって非常に有益であり、予測結果を向上し、計算時間を短縮し、過度なノイズを低減し、トレーニング中に行われた決定の背後にある透明性を高めるなど、多くの改善をもたらす。
それでも、mlライフサイクル(特にデータとアルゴリズムに関連するもの)の異なるステージを監視および制御するためのビジュアル分析ツールがいくつか存在するが、機能エンジニアリングのサポートは不十分である。
本稿では,機能工学プロセスを支援するために設計された視覚分析システムであるFeatureEnViを提案する。
提案システムは,ユーザが最も重要な機能を選択し,元の機能を強力な代替品に変換し,異なる機能生成の組み合わせを試すのに役立つ。
さらに、データ空間スライシングにより、ユーザーはローカルとグローバルの両方のスケールで機能の影響を調べることができる。
FeatureEnViは複数の自動機能選択技術を使用し、さらに、各機能(または機能のサブセット)の影響に関する統計的証拠を視覚的にユーザに案内する。
最終的な結果は、複数のバリデーションメトリクスによって評価される、高度に設計された機能の抽出である。
FeatureEnViの有用性と適用性は、人気のある赤ワインの品質データセットと、シルエットからの車両認識に関する公開データを用いて、2つのユースケースで実証される。
また,システムの有効性を評価する可視化研究者とML専門家とのインタビューからフィードバックを得た。
関連論文リスト
- CLOVA: A Closed-Loop Visual Assistant with Tool Usage and Update [69.59482029810198]
CLOVAは、推論、リフレクション、学習フェーズを含むフレームワーク内で動作するクローズドループビジュアルアシスタントである。
その結果,CLOVAは既存のツール利用手法を5%,知識タグ付けでは10%,画像編集では20%,視覚的質問応答や複数画像推論では5%に上回っていることがわかった。
論文 参考訳(メタデータ) (2023-12-18T03:34:07Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - DoE2Vec: Deep-learning Based Features for Exploratory Landscape Analysis [0.0]
本研究では,地形特性を最適化するための変分オートエンコーダ(VAE)に基づく手法であるDoE2Vecを提案する。
古典的な探索的景観解析(ELA)法とは異なり,本手法では特徴工学は必要としない。
検証のために、潜伏再構成の品質を検査し、異なる実験を用いて潜伏表現を解析する。
論文 参考訳(メタデータ) (2023-03-31T09:38:44Z) - Traceable Automatic Feature Transformation via Cascading Actor-Critic
Agents [25.139229855367088]
特徴変換は機械学習(ML)の有効性と解釈可能性を高めるための必須課題である
特徴変換タスクを、特徴生成と選択の反復的、ネストされたプロセスとして定式化する。
高次元データにおけるSOTAとロバスト性と比較すると,F1スコアの24.7%の改善が見られた。
論文 参考訳(メタデータ) (2022-12-27T08:20:19Z) - Feature Selection with Distance Correlation [0.0]
距離相関に基づく特徴選択法(DisCo)を提案する。
7000以上のエネルギーフローの集合から特徴を抽出するために本手法を用いることで,より深いアーキテクチャの性能に適合できることを示す。
論文 参考訳(メタデータ) (2022-11-30T19:00:04Z) - Task Formulation Matters When Learning Continually: A Case Study in
Visual Question Answering [58.82325933356066]
継続的な学習は、以前の知識を忘れずに、一連のタスクでモデルを漸進的にトレーニングすることを目的としている。
本稿では,視覚的質問応答において,異なる設定がパフォーマンスに与える影響について詳細に検討する。
論文 参考訳(メタデータ) (2022-09-30T19:12:58Z) - HardVis: Visual Analytics to Handle Instance Hardness Using Undersampling and Oversampling Techniques [48.82319198853359]
HardVisは、主に不均衡な分類シナリオでインスタンスの硬さを処理するために設計されたビジュアル分析システムである。
ユーザはさまざまな視点からデータのサブセットを探索して、これらのパラメータをすべて決定できる。
HardVisの有効性と有効性は仮説的利用シナリオとユースケースで実証される。
論文 参考訳(メタデータ) (2022-03-29T17:04:16Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - AEFE: Automatic Embedded Feature Engineering for Categorical Features [4.310748698480341]
本稿では,カスタムパラダイム機能構築や複数機能選択など,さまざまなコンポーネントから構成されるカテゴリ機能を表現するための自動機能エンジニアリングフレームワークを提案する。
いくつかの典型的なeコマースデータセットで実施された実験は、我々の手法が古典的な機械学習モデルや最先端のディープラーニングモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2021-10-19T07:22:59Z) - Towards Explainable Exploratory Landscape Analysis: Extreme Feature
Selection for Classifying BBOB Functions [4.932130498861987]
驚くほど少数の機能(多くの場合4つ未満)が、98%の精度を達成するのに十分であることを示している。
分類精度は、いくつかのインスタンスがトレーニングやテストに関わっている設定に変換されることを示す。
論文 参考訳(メタデータ) (2021-02-01T10:04:28Z) - Shared Space Transfer Learning for analyzing multi-site fMRI data [83.41324371491774]
マルチボクセルパターン解析(MVPA)は、タスクベース機能磁気共鳴画像(fMRI)データから予測モデルを学習する。
MVPAはよく設計された機能セットと十分なサンプルサイズで機能する。
ほとんどのfMRIデータセットはノイズが多く、高次元で、収集するのに高価で、サンプルサイズも小さい。
本稿では,新しい伝達学習手法として共有空間移動学習(SSTL)を提案する。
論文 参考訳(メタデータ) (2020-10-24T08:50:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。