論文の概要: Fractal interpolation in the context of prediction accuracy optimization
- arxiv url: http://arxiv.org/abs/2403.00403v1
- Date: Fri, 1 Mar 2024 09:49:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-05 17:47:47.024563
- Title: Fractal interpolation in the context of prediction accuracy optimization
- Title(参考訳): 予測精度最適化の文脈におけるフラクタル補間
- Authors: Alexandra Baicoianu, Cristina Gabriela Gavril\u{a}, Cristina Maria
Pacurar, Victor Dan Pacurar
- Abstract要約: 本稿ではフラクタル手法を用いて時系列予測を最適化する仮説に焦点をあてる。
LSTMモデルにより得られた予測結果は,生のデータセットと比較して有意に精度が向上した。
- 参考スコア(独自算出の注目度): 44.99833362998488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper focuses on the hypothesis of optimizing time series predictions
using fractal interpolation techniques. In general, the accuracy of machine
learning model predictions is closely related to the quality and quantitative
aspects of the data used, following the principle of \textit{garbage-in,
garbage-out}. In order to quantitatively and qualitatively augment datasets,
one of the most prevalent concerns of data scientists is to generate synthetic
data, which should follow as closely as possible the actual pattern of the
original data.
This study proposes three different data augmentation strategies based on
fractal interpolation, namely the \textit{Closest Hurst Strategy},
\textit{Closest Values Strategy} and \textit{Formula Strategy}. To validate the
strategies, we used four public datasets from the literature, as well as a
private dataset obtained from meteorological records in the city of Brasov,
Romania. The prediction results obtained with the LSTM model using the
presented interpolation strategies showed a significant accuracy improvement
compared to the raw datasets, thus providing a possible answer to practical
problems in the field of remote sensing and sensor sensitivity. Moreover, our
methodologies answer some optimization-related open questions for the fractal
interpolation step using \textit{Optuna} framework.
- Abstract(参考訳): 本稿ではフラクタル補間法を用いて時系列予測を最適化する仮説に焦点をあてる。
一般に、機械学習モデル予測の精度は、textit{garbage-in, garbage-out}の原則に従って使用されるデータの質と量的側面と密接に関連している。
データセットを定量的かつ定性的に拡張するために、データサイエンティストの最も一般的な関心事の1つは合成データを生成することである。
本研究では,フラクタル補間に基づく3つの異なるデータ拡張戦略,すなわち \textit{Closest Hurst Strategy}, \textit{Closest Values Strategy} と \textit{Formula Strategy を提案する。
この戦略を検証するために,文献から得られた4つの公開データセットと,ルーマニアのブラソフ市の気象記録から得られたプライベートデータセットを用いた。
提案する補間戦略を用いてlstmモデルにより得られた予測結果は, 生データセットと比較して有意に精度が向上し, リモートセンシングとセンサ感度の分野における実用的問題に対する答えとなりうる。
さらに,この手法は,フラクタル補間ステップに対して, \textit{optuna} フレームワークを用いた最適化に関連するオープン質問に答える。
関連論文リスト
- TD3: Tucker Decomposition Based Dataset Distillation Method for Sequential Recommendation [50.23504065567638]
本稿では,メタラーニングフレームワークにおける textbfDataset textbfDistillation 手法である textbfTD3 を紹介する。
TD3は、オリジナルのデータから完全に表現力のある合成配列の要約を蒸留する。
拡張技術により、学習者は合成要約を忠実に適合させ、アンプループでの正確な更新を確実にすることができる。
論文 参考訳(メタデータ) (2025-02-05T03:13:25Z) - Kriging and Gaussian Process Interpolation for Georeferenced Data Augmentation [10.945947159224302]
本研究は,ラ・ルエニオンのサトウキビ群集におけるコメルナ・ベンガルシス L. の存在を予測することを目的として,ジオレファレンスデータの拡張手法について検討した。
収集データの空間特性と高コスト化を考慮し,異なるカーネルを持つガウス過程 (GP) と,様々なヴァリグラムを持つクリッピングの2つのアプローチを評価した。
その結果,GPベースの手法,特にGP-COMBを用いた場合,付加的なデータを必要とすることなく回帰アルゴリズムの性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2025-01-13T10:29:09Z) - Interpolation pour l'augmentation de donnees : Application à la gestion des adventices de la canne a sucre a la Reunion [10.945947159224302]
本研究では,ジオレファレンスデータの拡張手法について検討する。
ラ・ルエニオンにおけるサトウキビのプロットにおけるコメリナ・ベンガルシス L. の存在を予測することを目的としている。
論文 参考訳(メタデータ) (2025-01-10T11:02:13Z) - Transfer Learning in $\ell_1$ Regularized Regression: Hyperparameter Selection Strategy based on Sharp Asymptotic Analysis [3.5374094795720854]
転送学習技術は、複数の関連するデータセットからの情報を活用し、ターゲットデータセットに対する予測品質を向上させることを目的としている。
トランス・ラッソ(Trans-Lasso)とプレトレーニング・ラッソ(Pretraining Lasso)である。
レプリカ法を用いて解析することにより,高次元環境下でのアルゴリズムの徹底的,精密な研究を行う。
微調整段階に転送される2種類の情報の1つを無視することは、一般化性能にはほとんど影響しない。
論文 参考訳(メタデータ) (2024-09-26T10:20:59Z) - Ranking and Combining Latent Structured Predictive Scores without Labeled Data [2.5064967708371553]
本稿では,新しい教師なしアンサンブル学習モデル(SUEL)を提案する。
連続的な予測スコアを持つ予測器のセット間の依存関係を利用して、ラベル付きデータなしで予測器をランク付けし、それらをアンサンブルされたスコアに重み付けする。
提案手法の有効性は、シミュレーション研究とリスク遺伝子発見の現実的応用の両方を通じて厳密に評価されている。
論文 参考訳(メタデータ) (2024-08-14T20:14:42Z) - Hierarchical Features Matter: A Deep Exploration of GAN Priors for Improved Dataset Distillation [51.44054828384487]
階層的生成潜在蒸留(H-GLaD)と呼ばれる新しいパラメータ化法を提案する。
本手法はGAN内の階層層を系統的に探索する。
さらに,合成データセット評価に伴う計算負担を軽減するために,新しいクラス関連特徴距離尺度を導入する。
論文 参考訳(メタデータ) (2024-06-09T09:15:54Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Hierarchical regularization networks for sparsification based learning
on noisy datasets [0.0]
階層は、連続的により微細なスケールで特定される近似空間から従う。
各スケールでのモデル一般化を促進するため,複数次元にわたる新規な射影型ペナルティ演算子も導入する。
その結果、合成データセットと実データセットの両方において、データ削減およびモデリング戦略としてのアプローチの性能が示された。
論文 参考訳(メタデータ) (2020-06-09T18:32:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。