論文の概要: A Systematic Approach for Selecting Trajectories for Data Augmentation
- arxiv url: http://arxiv.org/abs/2606.10938v1
- Date: Tue, 09 Jun 2026 14:46:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.561385
- Title: A Systematic Approach for Selecting Trajectories for Data Augmentation
- Title(参考訳): データ拡張のための軌道選択のための体系的アプローチ
- Authors: Adam Nordling,
- Abstract要約: この論文は、アウトリーネス、多様性、代表性、不確実性、ランダム選択という5つの体系的な選択戦略を評価するための枠組みを開発する。
これらの戦略は、動物行動、海上交通、都市交通を含む4つのデータセットで厳格にテストされた。
結果は、体系的選択は普遍的な解ではないが、ランダムなベースラインよりも有利であることを示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Trajectory data augmentation is a promising approach to mitigate data scarcity in machine learning applications, but its utility has been limited by the complexity of preserving spatio-temporal coherence. Although prior work demonstrated the viability of geometric perturbation, it relied on naive random selection, leaving a critical gap in understanding which trajectories should be augmented for maximal benefit. This thesis addresses this gap by developing a systematic and scalable framework to evaluate five systematic selection strategies: Outlierness, Diversity, Representativeness, Uncertainty, and Random selection. These strategies were rigorously tested across four datasets covering animal behavior (Foxes and Starkey), maritime traffic (AIS), and urban traffic (Car) using a suite of linear and non-linear machine learning models. As part of this evaluation, an Optuna-based hyperparameter optimization loop was integrated to empirically identify the best-performing augmentation parameters for each dataset within the explored search space. The results indicate that, while systematic selection is not a universal solution, it offers distinct advantages over the random baseline. Systematic strategies, particularly Outlierness and Uncertainty, demonstrated higher stability and were less prone to performance degradation observed with random sampling in dense datasets. However, the findings also reveal that the value of augmentation is strictly conditional. Visual analysis via UMAP demonstrates that while systematic augmentation successfully repairs topological fragmentation in sparse datasets, it can act as a corrupting noise signal in high-quality, dense datasets. Furthermore, the study identified physical limitations in high-velocity domains, where standard perturbation techniques lead to divergence in feature space...
- Abstract(参考訳): トラジェクティブデータ拡張は、機械学習アプリケーションにおけるデータの不足を軽減するための有望なアプローチであるが、その実用性は時空間コヒーレンスを保存する複雑さによって制限されている。
以前の研究は幾何摂動の生存可能性を示したが、それは無作為なランダム選択に依存しており、どの軌道を最大限の利益のために拡張すべきかを理解するための重要なギャップを残していた。
この論文は、アウトリーネス、多様性、代表性、不確実性、ランダム選択という5つの体系的な選択戦略を評価するための、体系的でスケーラブルなフレームワークを開発することで、このギャップに対処する。
これらの戦略は、動物行動(FoxesとStarkey)、海洋交通(AIS)、都市交通(Car)をカバーする4つのデータセットに対して、線形および非線形機械学習モデルを用いて厳格にテストされた。
この評価の一環として,オプトゥーナをベースとしたハイパーパラメータ最適化ループが統合され,探索された探索空間内の各データセットの最適な拡張パラメータを実証的に同定した。
結果は、体系的選択は普遍的な解ではないが、ランダムなベースラインに対して明確な優位性をもたらすことを示している。
システム戦略,特に不確かさと不確かさは高い安定性を示し,高密度データセットのランダムサンプリングで観測された性能劣化の傾向が低かった。
しかし, この結果から, 拡張の値は厳密な条件付きであることが判明した。
UMAPによる視覚分析は、体系的な拡張がスパースデータセットのトポロジ的断片化をうまく修復する一方で、高品質で高密度なデータセットにおける劣化するノイズ信号として機能することを示した。
さらに、この研究は、標準摂動技術が特徴空間のばらつきを引き起こす高速度領域における物理的制限を特定した。
関連論文リスト
- VMF-GOS: Geometry-guided virtual Outlier Synthesis for Long-Tailed OOD Detection [10.895746797423223]
我々は、超球面上のvon Mises-Fisher(vMF)分布を用いて統計特性をモデル化する幾何学誘導仮想外乱合成(GOS)戦略を導入する。
具体的には、特徴空間に低線状アニュラスを配置し、この領域で仮想外れ値の方向サンプリングを行う。
CIFAR-LTなどのベンチマーク実験により,本手法は外部実画像を用いたソタ手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2026-02-05T07:58:12Z) - Unsupervised Feature Selection via Robust Autoencoder and Adaptive Graph Learning [4.371255245299254]
教師なし機能選択(UFS)は、データを同時にクラスタ化し、最も識別しやすい特徴を特定することを目的としている。
本稿では, ディープオートエンコーダを利用して非線形特徴表現を学習するロバスト・オートエンコーダに基づくunsupervised Feature Selection (RAEUFS)モデルを提案する。
提案手法は, クリーンかつ外部に汚染されたデータ設定において, 最先端のUFSアプローチより優れる。
論文 参考訳(メタデータ) (2025-12-21T12:42:37Z) - CART-based Synthetic Tabular Data Generation for Imbalanced Regression [1.342834401139078]
我々は、既存のCARTベースの合成データ生成手法を適応させ、不均衡回帰に適合させることを提案する。
本手法は, 対象空間のスパース領域におけるサンプリングを誘導するための関連性および密度に基づくメカニズムを統合する。
本実験は,ベンチマークデータセット間での極端目標値の予測に焦点をあてる。
論文 参考訳(メタデータ) (2025-06-03T12:42:20Z) - A Hybrid Framework for Statistical Feature Selection and Image-Based Noise-Defect Detection [55.2480439325792]
本稿では,統計的特徴選択と分類技術を統合し,欠陥検出精度を向上させるハイブリッドフレームワークを提案する。
工業画像から抽出した55個の特徴を統計的手法を用いて解析した。
これらの手法をフレキシブルな機械学習アプリケーションに統合することにより、検出精度を改善し、偽陽性や誤分類を減らす。
論文 参考訳(メタデータ) (2024-12-11T22:12:21Z) - Stochastic Gradient Descent with Adaptive Data [4.119418481809095]
勾配降下(SGD)は、オンライン学習シナリオにおいて特に有用である強力な最適化手法である。
オペレーションリサーチにおけるポリシー最適化問題へのSGDの適用には、環境を変えてポリシー更新に使用するデータに影響を与えるという、明確な課題が伴う。
過去の決定が生成したデータに与える影響は、勾配推定におけるバイアスを導入し、iidケースに存在しないオンライン学習の不安定性の潜在的な原因を示す。
適応データによるSGDの収束速度は, 政策誘起力学の混合時間に係わる限り, 古典的イド設定とほとんど同様であることを示す。
論文 参考訳(メタデータ) (2024-10-02T02:58:32Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous Unobserved Confounders [9.401989343015364]
連続的に外生的でない共同設立者が存在する場合、ロバストな政策評価と政策最適化について検討する。
本研究は,敗血症治療のシミュレーションと実世界の縦断医療データの両方において,複雑性境界,洞察,有効性を示す。
論文 参考訳(メタデータ) (2023-02-01T18:40:53Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Dynamic Federated Learning [57.14673504239551]
フェデレートラーニング(Federated Learning)は、マルチエージェント環境における集中的なコーディネーション戦略の包括的用語として登場した。
我々は、各イテレーションにおいて、利用可能なエージェントのランダムなサブセットがそのデータに基づいてローカル更新を実行する、フェデレートされた学習モデルを考える。
集約最適化問題に対する真の最小化器上の非定常ランダムウォークモデルの下で、アーキテクチャの性能は、各エージェントにおけるデータ変動率、各エージェントにおけるモデル変動率、アルゴリズムの学習率に逆比例する追跡項の3つの要因によって決定されることを示す。
論文 参考訳(メタデータ) (2020-02-20T15:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。