論文の概要: Xputer: Bridging Data Gaps with NMF, XGBoost, and a Streamlined GUI
Experience
- arxiv url: http://arxiv.org/abs/2311.09989v1
- Date: Thu, 16 Nov 2023 16:07:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-17 13:39:32.460196
- Title: Xputer: Bridging Data Gaps with NMF, XGBoost, and a Streamlined GUI
Experience
- Title(参考訳): Xputer: NMF, XGBoost, 合理化されたGUIエクスペリエンスを備えたデータギャップ
- Authors: Saleena Younus, Lars R\"onnstrand and Julhash U. Kazi
- Abstract要約: 本稿では,非負行列因子化(NMF)とXGBoostの予測強度を包含する新しい計算ツールであるXputerを紹介する。
Xputerの特長の1つは、その汎用性である。
Xputerは、カテゴリ、連続、Booleanなど、さまざまなデータタイプを自律的に処理する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The rapid proliferation of data across diverse fields has accentuated the
importance of accurate imputation for missing values. This task is crucial for
ensuring data integrity and deriving meaningful insights. In response to this
challenge, we present Xputer, a novel imputation tool that adeptly integrates
Non-negative Matrix Factorization (NMF) with the predictive strengths of
XGBoost. One of Xputer's standout features is its versatility: it supports zero
imputation, enables hyperparameter optimization through Optuna, and allows
users to define the number of iterations. For enhanced user experience and
accessibility, we have equipped Xputer with an intuitive Graphical User
Interface (GUI) ensuring ease of handling, even for those less familiar with
computational tools. In performance benchmarks, Xputer not only rivals the
computational speed of established tools such as IterativeImputer but also
often outperforms them in terms of imputation accuracy. Furthermore, Xputer
autonomously handles a diverse spectrum of data types, including categorical,
continuous, and Boolean, eliminating the need for prior preprocessing. Given
its blend of performance, flexibility, and user-friendly design, Xputer emerges
as a state-of-the-art solution in the realm of data imputation.
- Abstract(参考訳): 様々な分野にまたがるデータの急速な拡散は、不足値に対する正確な計算の重要性を暗示している。
このタスクはデータの完全性を確保し、有意義な洞察を引き出すのに不可欠です。
この課題に対して、XGBoostの予測強度と非負行列因子化(NMF)を有効に統合する新しい計算ツールであるXputerを提案する。
xputerの際立った特徴の1つは、その汎用性である: ゼロインプテーションをサポートし、optunaによるハイパーパラメータ最適化を可能にし、ユーザがイテレーションの数を定義することができる。
ユーザエクスペリエンスとアクセシビリティの向上のために,計算ツールに慣れていない人でも操作が容易な,直感的なグラフィカルユーザインターフェース(gui)を備えたxputerを開発しました。
パフォーマンスベンチマークでは、XputerはIterativeImputerのような確立したツールの計算速度に匹敵するだけでなく、インプットの精度でも性能を上回っている。
さらにXputerは、カテゴリ、連続、Booleanなど、さまざまなデータタイプを自律的に処理することで、事前処理の必要性を排除している。
パフォーマンス、柔軟性、ユーザーフレンドリーなデザインが組み合わさったxputerは、データインプテーションの分野で最先端のソリューションとして登場します。
関連論文リスト
- WaLiN-GUI: a graphical and auditory tool for neuron-based encoding [73.88751967207419]
ニューロモルフィックコンピューティングはスパイクベースのエネルギー効率の高い通信に依存している。
本研究では, スパイクトレインへのサンプルベースデータの符号化に適した構成を同定するツールを開発した。
WaLiN-GUIはオープンソースとドキュメントが提供されている。
論文 参考訳(メタデータ) (2023-10-25T20:34:08Z) - Basis Function Encoding of Numerical Features in Factorization Machines
for Improved Accuracy [2.3022070933226217]
FM変種に数値的特徴を組み込む体系的・理論的に最適化された方法を提案する。
提案手法は,選択した関数の集合にまたがる数値特徴の分数化関数を学習するモデルであることを示す。
本手法は,高速な学習と推論を保存し,FMモデルの計算グラフのわずかな修正しか必要としない。
論文 参考訳(メタデータ) (2023-05-23T21:10:17Z) - Communication-Efficient Graph Neural Networks with Probabilistic
Neighborhood Expansion Analysis and Caching [59.8522166385372]
大規模グラフ上でのグラフニューラルネットワーク(GNN)のトレーニングと推論は、GNNの登場以来活発に研究されている。
本稿では,分散環境におけるノードワイドサンプリングを用いたGNNによるミニバッチ学習と推論について述べる。
分割された特徴データを扱うために,従来のSALIENTシステムを拡張したSALIENT++を提案する。
論文 参考訳(メタデータ) (2023-05-04T21:04:01Z) - FAStEN: an efficient adaptive method for feature selection and
estimation in high-dimensional functional regressions [8.384075654211685]
本稿では,スパース関数オン・ファンクション回帰問題において特徴選択を行うための,新しい,柔軟な,超効率的なアプローチを提案する。
我々はそれをスカラー・オン・ファンクション・フレームワークに拡張する方法を示す。
AOMIC PIOP1による脳MRIデータへの応用について述べる。
論文 参考訳(メタデータ) (2023-03-26T19:41:17Z) - Energy-efficient Task Adaptation for NLP Edge Inference Leveraging
Heterogeneous Memory Architectures [68.91874045918112]
Adapter-ALBERTは、様々なタスクにわたる最大データ再利用のための効率的なモデル最適化である。
検証されたNLPエッジアクセラレータ上でシミュレーションを行うことにより、モデルを不均一なオンチップメモリアーキテクチャにマッピングする利点を実証する。
論文 参考訳(メタデータ) (2023-03-25T14:40:59Z) - A Computational Exploration of Emerging Methods of Variable Importance
Estimation [0.0]
変数の重要性を推定することは、現代の機械学習において必須のタスクである。
本稿では,変数重要度推定の新しい手法の計算的および理論的検討を提案する。
この結果から,PERFは相関性の高いデータでは最高の性能を示した。
論文 参考訳(メタデータ) (2022-08-05T20:00:56Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - X2T: Training an X-to-Text Typing Interface with Online Learning from
User Feedback [83.95599156217945]
ユーザがキーボードを操作できないが、他の入力を供給できる、補助型タイピングアプリケーションに焦点を当てる。
標準メソッドは、ユーザ入力の固定データセット上でモデルをトレーニングし、そのミスから学ばない静的インターフェースをデプロイする。
このようなインターフェースが時間の経過とともに改善されるようなシンプルなアイデアを,ユーザによる最小限の努力で検討する。
論文 参考訳(メタデータ) (2022-03-04T00:07:20Z) - RAMANMETRIX: a delightful way to analyze Raman spectra [0.0]
Raman分光ツールを臨床ルーチンに統合することを妨げる要因の1つは、データ処理ワークフローの複雑さである。
そこでRAMANMETRIXは,直感的なWebベースグラフィカルユーザインタフェース(GUI)を備えたユーザフレンドリーなソフトウェアとして紹介される。
このソフトウェアは、モデルトレーニングと、事前訓練されたモデルの新しいデータセットへの適用の両方に使用することができる。
論文 参考訳(メタデータ) (2022-01-19T13:20:28Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。