論文の概要: Major TOM: Expandable Datasets for Earth Observation
- arxiv url: http://arxiv.org/abs/2402.12095v1
- Date: Mon, 19 Feb 2024 12:23:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-20 16:37:07.976018
- Title: Major TOM: Expandable Datasets for Earth Observation
- Title(参考訳): TOM:地球観測のための拡張可能なデータセット
- Authors: Alistair Francis and Mikolaj Czerkawski
- Abstract要約: この枠組みとして,地球観測メタセット (Major TOM) が提案されている。
グリッドポイントの集合に基づく地理的インデックスシステムと、複数のデータセットをマージ可能なメタデータ構造で構成されている。
フレームワークとしてのMajor TOMの仕様に加えて、この研究は大きなオープンアクセスデータセットMajorTOM-Coreも提示している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Deep learning models are increasingly data-hungry, requiring significant
resources to collect and compile the datasets needed to train them, with Earth
Observation (EO) models being no exception. However, the landscape of datasets
in EO is relatively atomised, with interoperability made difficult by diverse
formats and data structures. If ever larger datasets are to be built, and
duplication of effort minimised, then a shared framework that allows users to
combine and access multiple datasets is needed. Here, Major TOM (Terrestrial
Observation Metaset) is proposed as this extensible framework. Primarily, it
consists of a geographical indexing system based on a set of grid points and a
metadata structure that allows multiple datasets with different sources to be
merged. Besides the specification of Major TOM as a framework, this work also
presents a large, open-access dataset, MajorTOM-Core, which covers the vast
majority of the Earth's land surface. This dataset provides the community with
both an immediately useful resource, as well as acting as a template for future
additions to the Major TOM ecosystem. Access: https://huggingface.co/Major-TOM
- Abstract(参考訳): ディープラーニングモデルはますますデータに飢えており、トレーニングに必要なデータセットの収集とコンパイルにはかなりのリソースを必要としている。
しかしながら、EOにおけるデータセットの展望は比較的微妙であり、さまざまなフォーマットやデータ構造による相互運用性は困難である。
より大きなデータセットを構築し、労力の重複を最小限に抑えるためには、複数のデータセットを組み合わせてアクセスするための共有フレームワークが必要です。
ここでは、この拡張可能なフレームワークとして、Major TOM(地球観測メタセット)を提案する。
主に、グリッドポイントのセットに基づく地理的インデックスシステムと、異なるソースを持つ複数のデータセットをマージ可能なメタデータ構造で構成されている。
フレームワークとしてのメジャー・トムの仕様に加えて、この研究は大規模なオープンアクセス・データセットである majortom-core も提供しており、地球の陸地の大部分をカバーしている。
このデータセットはコミュニティにすぐに役立つリソースを提供し、Major TOMエコシステムへの将来の追加のテンプレートとして機能する。
アクセス:https://huggingface.co/Major-TOM
関連論文リスト
- GenQA: Generating Millions of Instructions from a Handful of Prompts [67.54980063851605]
ほとんどの公開命令微調整データセットは、業界モデルをトレーニングするために使用されるクローズドソースデータセットと比較して比較的小さい。
本研究では,1つのプロンプトから大規模命令データセットを生成する手法について検討する。
我々のデータセットは、知識集約型リーダーボードタスクと会話評価の両方で、WizardLMとUltrachatの両方に遭遇または超過します。
論文 参考訳(メタデータ) (2024-06-14T17:44:08Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - MASSTAR: A Multi-Modal and Large-Scale Scene Dataset with a Versatile Toolchain for Surface Prediction and Completion [25.44529512862336]
MASSTARはマルチモーダルなlArgeスケールのシーンデータセットであり、サーフAce predictionと完了のためのVerSatile Toolchainを備えている。
環境から生の3Dデータを処理するための汎用的で効率的なツールチェーンを開発した。
実世界の部分的なデータを含む1000以上のシーンレベルのモデルからなるサンプルデータセットを生成する。
論文 参考訳(メタデータ) (2024-03-18T11:35:18Z) - MergeOcc: Bridge the Domain Gap between Different LiDARs for Robust Occupancy Prediction [8.993992124170624]
MergeOccは、複数のデータセットを活用することで、異なるLiDARを同時に扱うように開発されている。
MergeOccの有効性は、自動運転車のための2つの顕著なデータセットの実験を通じて検証される。
論文 参考訳(メタデータ) (2024-03-13T13:23:05Z) - Relational Deep Learning: Graph Representation Learning on Relational
Databases [69.7008152388055]
複数のテーブルにまたがって配置されたデータを学ぶために、エンドツーエンドの表現アプローチを導入する。
メッセージパッシンググラフニューラルネットワークは、自動的にグラフを学習して、すべてのデータ入力を活用する表現を抽出する。
論文 参考訳(メタデータ) (2023-12-07T18:51:41Z) - Ben-ge: Extending BigEarthNet with Geographical and Environmental Data [1.1377027568901037]
本稿では,世界規模で利用可能な地理・環境データを自由にコンパイルすることで,BigEarthNet-MMデータセットを補完するben-geデータセットを提案する。
このデータセットに基づいて、パッチベースの土地利用/土地被覆分類と土地利用/土地被覆区分の下流タスクに異なるデータモダリティを組み合わせる価値を示す。
論文 参考訳(メタデータ) (2023-07-04T14:17:54Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - From Isolated Islands to Pangea: Unifying Semantic Space for Human Action Understanding [50.412121156940294]
アクション理解は、物理空間から意味空間へのマッピングとして形成することができる。
そこで本研究では,Pangeaを完全に活用するために,物理空間から意味空間への新たなモデルマッピングを提案する。
論文 参考訳(メタデータ) (2023-04-02T15:04:43Z) - Neural Network Architecture for Database Augmentation Using Shared
Features [0.0]
医学のような領域では、大きな単一ソースデータセットや同一の機能を持つマルチソースデータセットを作成するのが難しくなる。
本稿では、これらのデータセット間で共通する機能を用いて、データ拡張を提供するニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-02T19:17:06Z) - A Multi-Format Transfer Learning Model for Event Argument Extraction via
Variational Information Bottleneck [68.61583160269664]
イベント引数抽出(EAE)は、テキストから所定の役割を持つ引数を抽出することを目的としている。
変動情報のボトルネックを考慮したマルチフォーマット変換学習モデルを提案する。
3つのベンチマークデータセットに対して広範な実験を行い、EAE上での新たな最先端性能を得る。
論文 参考訳(メタデータ) (2022-08-27T13:52:01Z) - Understanding collections of related datasets using dependent MMD
coresets [3.6882136969540844]
最大平均遅延(MMD)コアセットで選択された代表点は、単一のデータセットの解釈可能な要約を提供することができるが、データセット間で簡単に比較することはできない。
本稿では,分布の比較を容易にするデータセットの集合に対するデータ要約手法である依存MDDコアセットを提案する。
論文 参考訳(メタデータ) (2020-06-24T23:35:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。