Fugu-MT 論文翻訳(概要): SeafloorAI: A Large-scale Vision-Language Dataset for Seafloor Geological Survey

論文の概要: SeafloorAI: A Large-scale Vision-Language Dataset for Seafloor Geological Survey

arxiv url: http://arxiv.org/abs/2411.00172v1
Date: Thu, 31 Oct 2024 19:37:47 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:43.085447
Title: SeafloorAI: A Large-scale Vision-Language Dataset for Seafloor Geological Survey
Title（参考訳）: SeafloorAI: 海底地質調査のための大規模ビジョンランゲージデータセット
Authors: Kien X. Nguyen, Fengchun Qiao, Arthur Trembanis, Xi Peng,
Abstract要約: SeafloorAIは、5つの地質層にまたがる海底マッピングのための、初めてのAI対応データセットである。このデータセットは、17,300平方キロメートルに及ぶ62の地理的分散データサーベイと、696Kソナー画像、827Kの注釈付きセグメンテーションマスク、696Kの詳細な言語記述で構成されている。
参考スコア（独自算出の注目度）: 11.642711706384212
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A major obstacle to the advancements of machine learning models in marine science, particularly in sonar imagery analysis, is the scarcity of AI-ready datasets. While there have been efforts to make AI-ready sonar image dataset publicly available, they suffer from limitations in terms of environment setting and scale. To bridge this gap, we introduce SeafloorAI, the first extensive AI-ready datasets for seafloor mapping across 5 geological layers that is curated in collaboration with marine scientists. We further extend the dataset to SeafloorGenAI by incorporating the language component in order to facilitate the development of both vision- and language-capable machine learning models for sonar imagery. The dataset consists of 62 geo-distributed data surveys spanning 17,300 square kilometers, with 696K sonar images, 827K annotated segmentation masks, 696K detailed language descriptions and approximately 7M question-answer pairs. By making our data processing source code publicly available, we aim to engage the marine science community to enrich the data pool and inspire the machine learning community to develop more robust models. This collaborative approach will enhance the capabilities and applications of our datasets within both fields.
Abstract（参考訳）: 海洋科学における機械学習モデルの進歩に対する大きな障害は、特にソナー画像解析において、AI対応データセットの不足である。 AI対応ソナー画像データセットを一般公開する努力はあったが、環境設定やスケールの制限に悩まされている。このギャップを埋めるために、海洋科学者と共同でキュレートされた5つの地質層にわたる海底マッピングのための、初めてのAI対応データセットであるSeafloorAIを紹介します。ソナー画像のための視覚および言語対応機械学習モデルの開発を容易にするために、言語コンポーネントを組み込むことで、データセットをさらにSeafloorGenAIに拡張する。このデータセットは、17,300平方キロメートルにわたる62の地理的分散データサーベイからなり、696Kソナー画像、827Kの注釈付きセグメンテーションマスク、696Kの詳細な言語記述と約7Mの質問応答対で構成されている。データ処理のソースコードを公開することにより、海洋科学コミュニティがデータプールを強化し、マシンラーニングコミュニティにより堅牢なモデル開発を促すことを目指しています。このコラボレーティブなアプローチは、両方のフィールドにおけるデータセットの機能とアプリケーションを強化するでしょう。

関連論文リスト

Exploring the Underwater World Segmentation without Extra Training [55.291219073365546]
我々は,最初の大規模かつ微細な水中セグメンテーションデータセットである textbfAquaOV255 を紹介する。トレーニング不要なOVセグメンテーションフレームワークである textbfEarth2Ocean も紹介する。
論文参考訳（メタデータ） (2025-11-11T07:22:56Z)
BenthiCat: An opti-acoustic dataset for advancing benthic classification and habitat mapping [0.0]
本稿では,カタルーニャ(スペイン)沿岸で収集された約100万個のサイドスキャン・ソナー (SSS) タイルからなる,完全なマルチモーダルデータセットを提案する。 SSSタイルの約num36000は、分類モデルの教師付き微調整を可能にするためにセグメンテーションマスクで手動で注釈付けされている。センサーデータはすべてモザイクとともにリリースされ、さらなる探索とアルゴリズム開発をサポートする。
論文参考訳（メタデータ） (2025-10-06T15:00:20Z)
Neptune-X: Active X-to-Maritime Generation for Universal Maritime Object Detection [54.1960918379255]
Neptune-Xは、海洋オブジェクト検出のためのデータ中心の生成-選択フレームワークである。 X-to-Maritime(X-to-Maritime)は、多様で現実的な海洋シーンを合成する多モード条件生成モデルである。提案手法は,海上シーン合成における新しいベンチマークを設定し,検出精度を大幅に向上させる。
論文参考訳（メタデータ） (2025-09-25T04:59:02Z)
Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。 EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文参考訳（メタデータ） (2025-04-09T15:13:26Z)
OmniGeo: Towards a Multimodal Large Language Models for Geospatial Artificial Intelligence [51.0456395687016]
マルチモーダル大言語モデル(LLM)が人工知能の新しいフロンティアをオープンした。地理空間応用に適したMLLM(OmniGeo)を提案する。自然言語理解の長所と空間的推論の長所を組み合わせることで,GeoAIシステムの指示追従能力と精度を高めることができる。
論文参考訳（メタデータ） (2025-03-20T16:45:48Z)
EarthView: A Large Scale Remote Sensing Dataset for Self-Supervision [72.84868704100595]
本稿では,地球モニタリングタスクにおける深層学習アプリケーションを強化することを目的とした,リモートセンシングデータの自己監督を目的としたデータセットを提案する。このデータセットは15テラピクセルのグローバルリモートセンシングデータにまたがっており、NEON、Sentinel、Satellogicによる1mの空間解像度データの新たなリリースなど、さまざまなソースの画像を組み合わせている。このデータセットは、リモートセンシングデータの異なる課題に取り組むために開発されたMasked Autoencoderである。
論文参考訳（メタデータ） (2025-01-14T13:42:22Z)
SMILE-UHURA Challenge -- Small Vessel Segmentation at Mesoscopic Scale from Ultra-High Resolution 7T Magnetic Resonance Angiograms [60.35639972035727]
公開されている注釈付きデータセットの欠如は、堅牢で機械学習駆動のセグメンテーションアルゴリズムの開発を妨げている。 SMILE-UHURAチャレンジは、7T MRIで取得したTime-of-Flightアンジオグラフィーの注釈付きデータセットを提供することで、公開されている注釈付きデータセットのギャップに対処する。 Diceスコアは、それぞれのデータセットで0.838 $pm$0.066と0.716 $pm$ 0.125まで到達し、平均パフォーマンスは0.804 $pm$ 0.15までになった。
論文参考訳（メタデータ） (2024-11-14T17:06:00Z)
Introducing VaDA: Novel Image Segmentation Model for Maritime Object Segmentation Using New Dataset [3.468621550644668]
海上輸送産業はコンピュータビジョン人工知能(AI)の進歩によって急速に進化している海洋環境における物体認識は、光の反射、干渉、激しい照明、様々な気象条件といった課題に直面します。既存のAI認識モデルとデータセットは、自律ナビゲーションシステムを構成するのに限定的に適している。
論文参考訳（メタデータ） (2024-07-12T05:48:53Z)
BenthicNet: A global compilation of seafloor images for deep learning applications [25.466405216505166]
BenthicNetは海底画像のグローバルコンパイルである。最初の114万枚以上の画像が収集され、海底環境の多様性を表すためにキュレーションされた。このコンパイルに基づいて大規模なディープラーニングモデルをトレーニングし,その予備的な結果から,大規模かつ小規模の画像解析タスクの自動化に有効であることが示唆された。
論文参考訳（メタデータ） (2024-05-08T17:37:57Z)
SeePerSea: Multi-modal Perception Dataset of In-water Objects for Autonomous Surface Vehicles [10.732732686425308]
本稿では,自律航法のためのマルチモーダル認識データセットについて紹介する。自律型表面車両(ASV)の環境意識を高めるため、水中環境における水中障害物に焦点を当てている。
論文参考訳（メタデータ） (2024-04-29T04:00:19Z)
An Open Hyperspectral Dataset with Sea-Land-Cloud Ground-Truth from the HYPSO-1 Satellite [0.0]
HYPSO-1Sea-Land-Cloud-Labeledデータセットは、HYPSO-1ミッションから200の多様なハイパースペクトル画像を持つオープンデータセットである。これらの画像のうち38枚は、海と陸とクラウドのカテゴリにラベル付けされた約2500万のスペクトルシグネチャで、ピクセルレベルの地平線ラベルを含んでいる。
論文参考訳（メタデータ） (2023-08-25T21:35:22Z)
A New Path: Scaling Vision-and-Language Navigation with Synthetic Instructions and Imitation Learning [70.14372215250535]
VLN(Vision-and-Language Navigation)の最近の研究は、RLエージェントを訓練して、フォトリアリスティックな環境で自然言語ナビゲーション命令を実行する。人間の指導データが不足し、訓練環境の多様性が限られていることを考えると、これらのエージェントは複雑な言語基盤と空間言語理解に苦慮している。我々は、密集した360度パノラマで捉えた500以上の屋内環境を取り、これらのパノラマを通して航法軌道を構築し、各軌道に対して視覚的に接地された指示を生成する。 4.2Mの命令-軌道対のデータセットは、既存の人間の注釈付きデータセットよりも2桁大きい。
論文参考訳（メタデータ） (2022-10-06T17:59:08Z)
Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文参考訳（メタデータ） (2022-09-28T18:51:59Z)
FathomNet: A global underwater image training set for enabling artificial intelligence in the ocean [0.0]
オーシャンゴープラットフォームは、監視とナビゲーションのために高解像度のカメラフィードを統合することで、視覚データを大量に生成している。機械学習の最近の進歩は、視覚データの高速かつ洗練された分析を可能にするが、海洋学の世界では成功しなかった。 FathomNetのデータに基づいてトレーニングされた機械学習モデルを、さまざまな機関のビデオデータに適用する方法を実証する。
論文参考訳（メタデータ） (2021-09-29T18:08:42Z)
Paradigm selection for Data Fusion of SAR and Multispectral Sentinel data applied to Land-Cover Classification [63.072664304695465]
本稿では、畳み込みニューラルネットワーク(CNN)に基づく4つのデータ融合パラダイムを分析し、実装する。目標は、最良のデータ融合フレームワークを選択するための体系的な手順を提供することであり、その結果、最高の分類結果が得られる。この手順は、土地被覆分類のために検証されているが、他のケースに転送することができる。
論文参考訳（メタデータ） (2021-06-18T11:36:54Z)
REGRAD: A Large-Scale Relational Grasp Dataset for Safe and Object-Specific Robotic Grasping in Clutter [52.117388513480435]
本稿では,オブジェクト間の関係のモデル化を継続するregradという新しいデータセットを提案する。データセットは2D画像と3Dポイントクラウドの両方で収集されます。ユーザは、好きなだけ多くのデータを生成するために、自由に独自のオブジェクトモデルをインポートできる。
論文参考訳（メタデータ） (2021-04-29T05:31:21Z)
DeepSatData: Building large scale datasets of satellite images for training machine learning models [77.17638664503215]
本稿では,機械学習モデルの学習のための衛星画像データセットの自動生成のための設計検討を行う。本稿では,ニューラルネットワークの深層学習と評価の観点から直面する課題について論じる。
論文参考訳（メタデータ） (2021-04-28T15:13:12Z)
FathomNet: An underwater image training database for ocean exploration and discovery [0.0]
FathomNetは、最新のインテリジェントで自動化された水中画像解析の開発を加速するために最適化された、新しいベースラインイメージトレーニングセットである。現在までに8万枚以上の画像と10万6000枚以上の局所化が233のクラスで行われており、その中には中層生物やベント生物が含まれる。この新たなデータセットの予測による品質結果が得られたが、我々の結果は最終的に、海洋探査のためにより大きなデータセットが必要であることを示唆している。
論文参考訳（メタデータ） (2020-06-30T21:23:06Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。