論文の概要: FastForest: Increasing Random Forest Processing Speed While Maintaining
Accuracy
- arxiv url: http://arxiv.org/abs/2004.02423v1
- Date: Mon, 6 Apr 2020 06:37:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 05:44:34.649910
- Title: FastForest: Increasing Random Forest Processing Speed While Maintaining
Accuracy
- Title(参考訳): FastForest: 正確性を維持しつつ、ランダムな森林処理速度を向上
- Authors: Darren Yates and Md Zahidul Islam
- Abstract要約: 提案したFastForestアルゴリズムは,ランダムフォレストと比較して処理速度が平均24%向上する。
それは45のデータセットを含むテストよりも、分類の精度で維持する(そしてしばしば超える)。
Subbaggingサイズに関する詳細なテストでは、処理性能と精度の正の混合を提供する最適なスカラーが見つかった。
- 参考スコア(独自算出の注目度): 2.6118176084782836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Random Forest remains one of Data Mining's most enduring ensemble algorithms,
achieving well-documented levels of accuracy and processing speed, as well as
regularly appearing in new research. However, with data mining now reaching the
domain of hardware-constrained devices such as smartphones and Internet of
Things (IoT) devices, there is continued need for further research into
algorithm efficiency to deliver greater processing speed without sacrificing
accuracy. Our proposed FastForest algorithm delivers an average 24% increase in
processing speed compared with Random Forest whilst maintaining (and frequently
exceeding) it on classification accuracy over tests involving 45 datasets.
FastForest achieves this result through a combination of three optimising
components - Subsample Aggregating ('Subbagging'), Logarithmic Split-Point
Sampling and Dynamic Restricted Subspacing. Moreover, detailed testing of
Subbagging sizes has found an optimal scalar delivering a positive mix of
processing performance and accuracy.
- Abstract(参考訳): ランサムフォレストは、データマイニングの最も永続的なアンサンブルアルゴリズムの1つであり、文書化された精度と処理速度を達成し、新しい研究に定期的に現れる。
しかし、現在、スマートフォンやIoT(Internet of Things)デバイスのようなハードウェアに制約のあるデバイスの領域にデータマイニングが到達しているため、精度を犠牲にすることなく処理速度を向上するためのアルゴリズム効率に関するさらなる研究が必要である。
提案したFastForestアルゴリズムはRandom Forestと比較して処理速度が平均24%向上する一方、45のデータセットを含むテストの分類精度は維持する(そして頻繁に上回る)。
FastForestは、Subsample Aggregating('Subbagging')、Logarithmic Split-Point Smpling、Dynamic Restricted Subspacingという3つの最適化コンポーネントを組み合わせてこの結果を達成する。
さらに,サブバッギングサイズの詳細なテストにより,処理性能と精度の正の混合を実現する最適スカラーが得られた。
関連論文リスト
- Faster WIND: Accelerating Iterative Best-of-$N$ Distillation for LLM Alignment [81.84950252537618]
本稿では,反復的BONDと自己プレイアライメントの統一的なゲーム理論接続を明らかにする。
WINレート支配(WIN rate Dominance, WIND)という新しいフレームワークを構築し, 正規化利率支配最適化のためのアルゴリズムを多数提案する。
論文 参考訳(メタデータ) (2024-10-28T04:47:39Z) - Optimized Speculative Sampling for GPU Hardware Accelerators [14.681982904792763]
並列ハードウェアアクセラレータの投機的サンプリングを最適化し,サンプリング速度を向上する。
ワークロードを複数のGPUスレッドに分散し、スレッドブロック内の行列セグメントの同時操作を可能にします。
本手法の有効性を検証するために,音声認識と要約タスクの両方について広範な実験を行った。
論文 参考訳(メタデータ) (2024-06-16T17:19:23Z) - Edge-Enabled Real-time Railway Track Segmentation [0.0]
エッジ対応鉄道線路分割アルゴリズムを提案する。
ネットワーク構造を最適化し、トレーニング後のモデルを定量化することで、エッジアプリケーションに適したように最適化されている。
実験結果から,提案アルゴリズムの精度は83.3%であった。
論文 参考訳(メタデータ) (2024-01-21T13:45:52Z) - Improved Sparse Ising Optimization [0.0]
本報告では,最大2万変数の長期ベンチマーク問題において,性能が著しく向上したことを示す新しいデータを示す。
速度と精度の組み合わせを先導するのとは対照的に、概念実証の実装は2-4桁の精度で目標に到達した。
このデータは、スパースIsingパフォーマンスフロンティアを、アルゴリズムポートフォリオ、AIツールキット、意思決定システムを強化するために推進するエキサイティングな可能性を示している。
論文 参考訳(メタデータ) (2023-11-15T17:59:06Z) - Fast Bayesian Optimization of Needle-in-a-Haystack Problems using
Zooming Memory-Based Initialization [73.96101108943986]
Needle-in-a-Haystack問題は、データセットのサイズに対して最適な条件が極端に不均衡であるときに発生する。
本稿では,従来のベイズ最適化原理に基づくズームメモリに基づく初期化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-26T23:57:41Z) - Rapid Person Re-Identification via Sub-space Consistency Regularization [51.76876061721556]
Person Re-Identification (ReID) は、歩行者を分離したカメラで識別する。
実値特徴記述子を用いた既存のReID法は精度が高いが、ユークリッド距離計算が遅いため効率が低い。
本稿では,ReID 処理を 0.25 倍高速化するサブスペース一貫性規則化 (SCR) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-13T02:44:05Z) - Real-Time Scene Text Detection with Differentiable Binarization and
Adaptive Scale Fusion [62.269219152425556]
セグメンテーションに基づくシーンテキスト検出手法はシーンテキスト検出分野において大きな注目を集めている。
本稿では,二項化処理をセグメンテーションネットワークに統合する分散二項化(DB)モジュールを提案する。
アダプティブ・スケール・フュージョン (ASF) モジュールは, 異なるスケールの特徴を適応的に融合させることにより, スケールのロバスト性を向上させる。
論文 参考訳(メタデータ) (2022-02-21T15:30:14Z) - SwiftLane: Towards Fast and Efficient Lane Detection [0.8972186395640678]
我々は、軽量でエンドツーエンドのディープラーニングベースのフレームワークであるSwiftLaneと、高速かつ効率的なレーン検出のための行単位の分類定式化を提案する。
提案手法は1秒あたり411フレームの推論速度を実現し,CULaneベンチマークデータセットの精度で比較結果を実現した。
論文 参考訳(メタデータ) (2021-10-22T13:35:05Z) - GNNSampler: Bridging the Gap between Sampling Algorithms of GNN and
Hardware [8.15489210461058]
GNNSamplerと呼ばれるメインストリームサンプリングアルゴリズムのための統一型プログラミングモデルを提案する。
我々は,サンプリング中の不規則なメモリアクセスを軽減するために,実世界のデータセットでノードとその隣人のデータの局所性を探索する。
提案手法は主流サンプリングアルゴリズムに普遍的であり,GNNのトレーニング時間を短縮する。
論文 参考訳(メタデータ) (2021-08-26T04:13:52Z) - HANT: Hardware-Aware Network Transformation [82.54824188745887]
ハードウェア・アウェア・ネットワーク・トランスフォーメーション(HANT)を提案する。
HANTは、ニューラルネットワーク検索のようなアプローチを使用して、非効率な操作をより効率的な代替手段に置き換える。
EfficientNetファミリの高速化に関する我々の結果は、ImageNetデータセットのトップ1の精度で最大3.6倍、0.4%の低下でHANTがそれらを加速できることを示している。
論文 参考訳(メタデータ) (2021-07-12T18:46:34Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。