論文の概要: Randomized Spline Trees for Functional Data Classification: Theory and Application to Environmental Time Series
- arxiv url: http://arxiv.org/abs/2409.07879v1
- Date: Thu, 12 Sep 2024 09:38:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-13 17:08:15.564778
- Title: Randomized Spline Trees for Functional Data Classification: Theory and Application to Environmental Time Series
- Title(参考訳): 機能データ分類のためのランダム化されたスプラインツリー:理論と環境時系列への応用
- Authors: Donato Riccio, Fabrizio Maturo, Elvira Romano,
- Abstract要約: 本稿ではランダム化された関数表現をランダムフォレストフレームワークに組み込むことで2つのアプローチをブリッジする新しいアルゴリズムであるランダム化されたスプラインツリー(RST)を紹介する。
RSTは、ランダム化されたB-スプラインパラメータを用いて入力データの多様な機能表現を生成し、これらの様々な表現に基づいて訓練された決定ツリーのアンサンブルを生成する。
その結果、RTTの変種は、ほとんどのデータセットで標準のランダムフォレストやグラディエントブースティングよりも優れており、分類精度は最大14%向上した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Functional data analysis (FDA) and ensemble learning can be powerful tools for analyzing complex environmental time series. Recent literature has highlighted the key role of diversity in enhancing accuracy and reducing variance in ensemble methods.This paper introduces Randomized Spline Trees (RST), a novel algorithm that bridges these two approaches by incorporating randomized functional representations into the Random Forest framework. RST generates diverse functional representations of input data using randomized B-spline parameters, creating an ensemble of decision trees trained on these varied representations. We provide a theoretical analysis of how this functional diversity contributes to reducing generalization error and present empirical evaluations on six environmental time series classification tasks from the UCR Time Series Archive. Results show that RST variants outperform standard Random Forests and Gradient Boosting on most datasets, improving classification accuracy by up to 14\%. The success of RST demonstrates the potential of adaptive functional representations in capturing complex temporal patterns in environmental data. This work contributes to the growing field of machine learning techniques focused on functional data and opens new avenues for research in environmental time series analysis.
- Abstract(参考訳): 機能データ分析(FDA)とアンサンブル学習は、複雑な環境時系列を解析するための強力なツールである。
本稿では,ランダム化された機能表現をランダムフォレストフレームワークに組み込むことで,これらの2つのアプローチを橋渡しするアルゴリズムであるランダム化されたスプラインツリー(RST)を紹介する。
RSTは、ランダム化されたB-スプラインパラメータを用いて入力データの多様な機能表現を生成し、これらの様々な表現に基づいて訓練された決定ツリーのアンサンブルを生成する。
本稿では, この機能的多様性が一般化誤差の低減にどのように貢献するかを理論的に分析し, UCR Time Series Archiveの6つの環境時系列分類タスクについて経験的評価を行う。
その結果、RTTの変種は標準のランダムフォレストやグラディエントブースティングよりも優れており、分類精度は最大14\%向上した。
RSTの成功は、環境データにおける複雑な時間的パターンを捕捉する適応的機能表現の可能性を示している。
この研究は、機能データに焦点をあてた機械学習技術の発展に寄与し、環境時系列分析研究のための新たな道を開く。
関連論文リスト
- Enriched Functional Tree-Based Classifiers: A Novel Approach Leveraging
Derivatives and Geometric Features [0.0]
本研究では,高次元時系列の分類手法として,関数型データ分析(FDA)と木に基づくアンサンブル技術を統合した教師付き分類手法を提案する。
論文 参考訳(メタデータ) (2024-09-26T12:57:47Z) - Augmented Functional Random Forests: Classifier Construction and Unbiased Functional Principal Components Importance through Ad-Hoc Conditional Permutations [0.0]
本稿では,木に基づく手法と関数型データ解析を統合した新しい教師付き分類手法を提案する。
機能的分類木と機能的ランダム林の拡張版を提案し,機能的主成分の重要性を評価するための新しいツールを取り入れた。
論文 参考訳(メタデータ) (2024-08-23T15:58:41Z) - Enhancing Variable Importance in Random Forests: A Novel Application of Global Sensitivity Analysis [0.9954382983583578]
本研究は,Global Sensitivity Analysisをランダムフォレストなどの教師あり機械学習手法に適用する。
グローバル感度解析は、入力変数の不確かさが出力に与える影響を調べるために主に数学的モデリングで用いられる。
シミュレーション研究により,提案手法は,効率,説明能力,あるいは既存の結果の確認方法によって,どのような進歩が達成できるかを探索するために有効であることが示唆された。
論文 参考訳(メタデータ) (2024-07-19T10:45:36Z) - Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。
本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。
両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文 参考訳(メタデータ) (2024-06-12T08:30:16Z) - Embedded feature selection in LSTM networks with multi-objective
evolutionary ensemble learning for time series forecasting [49.1574468325115]
本稿では,Long Short-Term Memory Networkに埋め込まれた特徴選択手法を提案する。
本手法はLSTMの重みと偏りを分割的に最適化する。
イタリアとスペイン南東部の大気質時系列データの実験的評価により,従来のLSTMの能力一般化が著しく向上することが確認された。
論文 参考訳(メタデータ) (2023-12-29T08:42:10Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Heterogeneous Multi-Task Gaussian Cox Processes [61.67344039414193]
異種相関タスクを共同でモデル化するためのマルチタスクガウスコックスプロセスの新たな拡張を提案する。
MOGPは、分類、回帰、ポイントプロセスタスクの専用可能性のパラメータに先行して、異種タスク間の情報の共有を容易にする。
モデルパラメータを推定するための閉形式反復更新を実現する平均場近似を導出する。
論文 参考訳(メタデータ) (2023-08-29T15:01:01Z) - Large Language Model as Attributed Training Data Generator: A Tale of
Diversity and Bias [92.41919689753051]
大規模言語モデル(LLM)は、最近、様々な自然言語処理(NLP)タスクのためのトレーニングデータジェネレータとして活用されている。
本稿では,多様な属性を持つプロンプトを用いたトレーニングデータ生成について検討する。
属性付きプロンプトは、結果のモデルの性能の観点から、単純なクラス条件プロンプトより優れていることを示す。
論文 参考訳(メタデータ) (2023-06-28T03:31:31Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Interpretable Feature Construction for Time Series Extrinsic Regression [0.028675177318965035]
一部のアプリケーション領域では、対象変数が数値であり、その問題は時系列外部回帰(TSER)として知られている。
TSERの文脈における頑健で解釈可能な特徴構築と選択のためのベイズ法の拡張を提案する。
私たちのアプローチは、TSERに取り組むためのリレーショナルな方法を利用します:(i)、リレーショナルデータスキームに格納されている時系列の多様で単純な表現を構築し、(ii)二次テーブルからデータを「フラット化」するために解釈可能な機能を構築するためにプロポジション化技術を適用します。
論文 参考訳(メタデータ) (2021-03-15T08:12:19Z) - RENT -- Repeated Elastic Net Technique for Feature Selection [0.46180371154032895]
特徴選択のための繰り返し弾性ネット技術(RENT)を提案する。
RENTは、弾力性のあるネット正規化を備えた一般化線形モデルのアンサンブルを使用しており、それぞれがトレーニングデータの異なるサブセットに基づいて訓練されている。
RENTは、トレーニング中に予測が難しいデータ内のオブジェクトの識別に関するモデル解釈のための貴重な情報を提供する。
論文 参考訳(メタデータ) (2020-09-27T07:55:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。