論文の概要: Impact Assessment of Missing Data in Model Predictions for Earth Observation Applications
- arxiv url: http://arxiv.org/abs/2403.14297v1
- Date: Thu, 21 Mar 2024 11:03:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-22 14:38:14.963708
- Title: Impact Assessment of Missing Data in Model Predictions for Earth Observation Applications
- Title(参考訳): 地球観測用モデル予測における欠測データの影響評価
- Authors: Francisco Mena, Diego Arenas, Marcela Charfuelan, Marlon Nuske, Andreas Dengel,
- Abstract要約: 分類タスクと回帰タスクを含む4つのデータセットのトレーニングモデルにおいて、時間的および静的なEO源の欠如が与える影響を評価する。
いくつかのメソッドは、欠落データに対して自然に堅牢であることに気付きました。
光学ビューは、個別に欠落しているときに最も重要なビューである。
- 参考スコア(独自算出の注目度): 4.388282062290401
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Earth observation (EO) applications involving complex and heterogeneous data sources are commonly approached with machine learning models. However, there is a common assumption that data sources will be persistently available. Different situations could affect the availability of EO sources, like noise, clouds, or satellite mission failures. In this work, we assess the impact of missing temporal and static EO sources in trained models across four datasets with classification and regression tasks. We compare the predictive quality of different methods and find that some are naturally more robust to missing data. The Ensemble strategy, in particular, achieves a prediction robustness up to 100%. We evidence that missing scenarios are significantly more challenging in regression than classification tasks. Finally, we find that the optical view is the most critical view when it is missing individually.
- Abstract(参考訳): 複雑で異質なデータソースを含む地球観測(EO)アプリケーションは、一般的に機械学習モデルによってアプローチされる。
しかし、データソースが永続的に利用可能になるという一般的な仮定がある。
ノイズや雲、衛星ミッションの失敗など、さまざまな状況がEOソースの可用性に影響を与える可能性がある。
本研究では,分類タスクと回帰タスクを含む4つのデータセットを対象としたトレーニングモデルにおいて,時間的および静的なEO源の欠如が与える影響を評価する。
異なるメソッドの予測品質を比較して、欠落したデータに対して自然に堅牢であることを示す。
特にEnsembleの戦略は、予測の堅牢性を最大100%達成している。
我々は、欠落したシナリオは分類タスクよりも回帰がかなり難しいことを証明している。
最後に、光学ビューが個別に欠落している場合、最も重要なビューであることが分かる。
関連論文リスト
- A Study on Bias Detection and Classification in Natural Language Processing [2.908482270923597]
我々の研究の目的は、ヘイトスピーチの検出と分類のタスクにおいて、公開データセットをもっとうまく組み合わせてモデルを訓練する方法を決定することである。
我々は,これらの課題を実験の展開と合わせて議論し,異なるデータセットの組み合わせがモデルの性能に大きな影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2024-08-14T11:49:24Z) - Class Imbalance in Object Detection: An Experimental Diagnosis and Study
of Mitigation Strategies [0.5439020425818999]
本研究は, YOLOv5単段検出器を用いて, 前地上クラス不均衡問題に対処するベンチマークフレームワークを提案する。
我々は,サンプリング,損失重み付け,データ強化という3つの確立した手法を精査した。
比較分析の結果,2段階検出法では有効であるが,YOLOv5の性能向上には有効ではないことが明らかとなった。
論文 参考訳(メタデータ) (2024-03-11T19:06:04Z) - Spatial-temporal Forecasting for Regions without Observations [13.805203053973772]
本研究では,歴史的観察を伴わない関心領域の時空間予測について検討した。
タスクに対してSTSMというモデルを提案する。
私たちの重要な洞察は、関心のある領域に類似している場所から学ぶことです。
論文 参考訳(メタデータ) (2024-01-19T06:26:05Z) - Mobile Internet Quality Estimation using Self-Tuning Kernel Regression [7.6449549886709764]
合衆国の州の規模でモバイル(携帯電話)のインターネット品質を推定することを検討する。
ほとんどのサンプルは限られた領域に集中しているが、残りはごくわずかである。
本稿では,データ不均衡の悪影響を軽減するために自己調整型カーネルを用いた適応型カーネル回帰手法を提案する。
論文 参考訳(メタデータ) (2023-11-04T21:09:46Z) - Systematic Evaluation of Predictive Fairness [60.0947291284978]
バイアス付きデータセットのトレーニングにおけるバイアスの緩和は、重要なオープンな問題である。
複数のタスクにまたがる様々なデバイアス化手法の性能について検討する。
データ条件が相対モデルの性能に強い影響を与えることがわかった。
論文 参考訳(メタデータ) (2022-10-17T05:40:13Z) - Time Series Anomaly Detection via Reinforcement Learning-Based Model
Selection [3.1692938090731584]
時系列異常検出は、実世界のシステムの信頼性と効率的な運用において重要である。
本研究では、異常検出モデルのプールがアクセス可能であると仮定し、強化学習を利用して候補モデルを動的に選択することを提案する。
提案手法は,全体の性能において,すべてのベースラインモデルより優れていることを示す。
論文 参考訳(メタデータ) (2022-05-19T22:10:35Z) - General Greedy De-bias Learning [163.65789778416172]
本稿では,関数空間における勾配降下のような偏りのあるモデルとベースモデルを優雅に訓練する一般グリーディ・デバイアス学習フレームワーク(GGD)を提案する。
GGDは、事前知識を持つタスク固有バイアスモデルと、事前知識を持たない自己アンサンブルバイアスモデルの両方の設定の下で、より堅牢なベースモデルを学ぶことができる。
論文 参考訳(メタデータ) (2021-12-20T14:47:32Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - OR-Net: Pointwise Relational Inference for Data Completion under Partial
Observation [51.083573770706636]
この作業はリレーショナル推論を使って不完全なデータを埋めます。
本稿では,2つの点での相対性理論をモデル化するために,全関係ネットワーク (or-net) を提案する。
論文 参考訳(メタデータ) (2021-05-02T06:05:54Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。