論文の概要: Data-Centric Machine Learning for Geospatial Remote Sensing Data
- arxiv url: http://arxiv.org/abs/2312.05327v1
- Date: Fri, 8 Dec 2023 19:24:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 21:32:38.494293
- Title: Data-Centric Machine Learning for Geospatial Remote Sensing Data
- Title(参考訳): 地理空間リモートセンシングデータのためのデータ中心機械学習
- Authors: Ribana Roscher and Marc Ru{\ss}wurm and Caroline Gevaert and Michael
Kampffmeyer and Jefersson A. dos Santos and Maria Vakalopoulou and Ronny
H\"ansch and Stine Hansen and Keiller Nogueira and Jonathan Prexl and Devis
Tuia
- Abstract要約: 本研究では地理空間データに対する自動データ中心学習手法の定義と正確な分類について述べる。
我々は、補完的なデータ中心の視点に焦点を移すことが、エンドユーザーアプリケーションにおける精度、一般化能力、および真の影響のさらなる改善を達成するために必要であると主張している。
- 参考スコア(独自算出の注目度): 14.875006009324721
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent developments and research in modern machine learning have led to
substantial improvements in the geospatial field. Although numerous deep
learning models have been proposed, the majority of them have been developed on
benchmark datasets that lack strong real-world relevance. Furthermore, the
performance of many methods has already saturated on these datasets. We argue
that shifting the focus towards a complementary data-centric perspective is
necessary to achieve further improvements in accuracy, generalization ability,
and real impact in end-user applications. This work presents a definition and
precise categorization of automated data-centric learning approaches for
geospatial data. It highlights the complementary role of data-centric learning
with respect to model-centric in the larger machine learning deployment cycle.
We review papers across the entire geospatial field and categorize them into
different groups. A set of representative experiments shows concrete
implementation examples. These examples provide concrete steps to act on
geospatial data with data-centric machine learning approaches.
- Abstract(参考訳): 最近の機械学習の発展と研究は、地理空間分野の大幅な改善をもたらした。
多くのディープラーニングモデルが提案されているが、その大半は、現実世界の強い妥当性に欠けるベンチマークデータセット上で開発されている。
さらに、これらのデータセットでは、多くのメソッドのパフォーマンスがすでに飽和している。
データ中心の観点に焦点を移すことは、エンドユーザアプリケーションにおける精度、一般化能力、実際の影響のさらなる改善を達成するために必要である。
本研究では,地理空間データの自動学習手法の定義と正確な分類を行う。
これは、より大きな機械学習デプロイメントサイクルにおけるモデル中心の学習に対するデータ中心学習の補完的な役割を強調している。
我々は,地理空間領域全体の論文をレビューし,それらを異なるグループに分類する。
代表的な実験のセットは具体的な実装例を示している。
これらの例は、データ中心の機械学習アプローチで地理空間データに作用する具体的なステップを提供する。
関連論文リスト
- Prospector Heads: Generalized Feature Attribution for Large Models &
Data [63.33062996732212]
本稿では,特徴帰属のための説明に基づく手法の,効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - A Survey on Autonomous Driving Datasets: Data Statistic, Annotation, and
Outlook [27.04693234358137]
高品質なデータセットは、信頼性の高い自律運転アルゴリズムの開発に不可欠である。
以前のデータセット調査では、データセットをレビューしようとしたが、限られた数に集中するか、データセットの文字に関する詳細な調査が欠如していた。
複数の視点から200以上の自律走行データセットを網羅的に検討した。
論文 参考訳(メタデータ) (2024-01-02T22:35:33Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and
Regulatory Norms [58.93352076927003]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Exploring Data Redundancy in Real-world Image Classification through
Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。
実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。
オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文 参考訳(メタデータ) (2023-06-25T03:31:05Z) - Global Update Tracking: A Decentralized Learning Algorithm for
Heterogeneous Data [14.386062807300666]
本稿では,デバイス間のデータ分散の変化の影響を受けにくい分散学習アルゴリズムの設計に焦点をあてる。
我々は,分散学習における異種データの影響を,通信オーバーヘッドを伴わずに緩和することを目的とした,新たなトラッキングベース手法であるGUTを提案する。
提案手法は,既存手法と比較して1~6%の精度向上により,異種データの分散学習における最先端性能を実現する。
論文 参考訳(メタデータ) (2023-05-08T15:48:53Z) - Evaluation Challenges for Geospatial ML [5.576083740549639]
地理空間機械学習モデルと地図は、科学と政策の下流分析にますます使われている。
空間機械学習出力の正確な測定方法は議論の的となっている。
本稿では,グローバルあるいはリモートセンシングされたデータセットを用いた地理空間機械学習におけるモデル評価のユニークな課題について述べる。
論文 参考訳(メタデータ) (2023-03-31T14:24:06Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Homogenization of Existing Inertial-Based Datasets to Support Human
Activity Recognition [8.076841611508486]
信号から日常生活の行動を認識する問題に対処するために,いくつかの手法が提案されている。
慣性信号に適用する深層学習技術は有効であることが証明されており、かなりの分類精度が達成されている。
人間の行動認識モデルの研究は、ほぼ完全にモデル中心である。
論文 参考訳(メタデータ) (2022-01-17T14:29:48Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。