論文の概要: From LAION-5B to LAION-EO: Filtering Billions of Images Using Anchor
Datasets for Satellite Image Extraction
- arxiv url: http://arxiv.org/abs/2309.15535v1
- Date: Wed, 27 Sep 2023 09:53:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-28 14:27:07.154746
- Title: From LAION-5B to LAION-EO: Filtering Billions of Images Using Anchor
Datasets for Satellite Image Extraction
- Title(参考訳): LAION-5BからLAION-EO:衛星画像抽出のためのアンカーデータセットを用いた数十億の画像フィルタリング
- Authors: Mikolaj Czerkawski, Alistair Francis
- Abstract要約: LAION-EOは、高解像度のテキストと衛星画像のペアを含むWebからソースされたデータセットである。
論文では、取得手順とデータセットの特徴について概説する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large datasets, such as LAION-5B, contain a diverse distribution of images
shared online. However, extraction of domain-specific subsets of large image
corpora is challenging. The extraction approach based on an anchor dataset,
combined with further filtering, is proposed here and demonstrated for the
domain of satellite imagery. This results in the release of LAION-EO, a dataset
sourced from the web containing pairs of text and satellite images in high
(pixel-wise) resolution. The paper outlines the acquisition procedure as well
as some of the features of the dataset.
- Abstract(参考訳): LAION-5Bのような大規模なデータセットには、オンラインで共有される画像の多様な分布が含まれている。
しかし、大画像コーパスのドメイン固有部分集合の抽出は困難である。
本稿では,アンカーデータセットとさらなるフィルタリングを組み合わせた抽出手法を提案し,衛星画像の領域について実証した。
これにより、高解像度(ピクセル単位で)のテキストと衛星画像のペアを含むWebからソースされたデータセットであるLAION-EOがリリースされた。
論文では、取得手順とデータセットの特徴について概説する。
関連論文リスト
- SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。
私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。
私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文 参考訳(メタデータ) (2024-03-11T09:20:40Z) - SISP: A Benchmark Dataset for Fine-grained Ship Instance Segmentation in
Panchromatic Satellite Images [25.259591254585388]
本研究では,パンクロマティック衛星画像,すなわちSISPの粒度の細かいShip Instanceのベンチマークデータセットを提案する。
SISPには56,693のよく注釈付けされた船のインスタンスがあり、1万のスライスされた画像に4つの細かいカテゴリがある。
提案したSISPデータセットのターゲットには、実際の衛星シーンと整合した特性がある。
論文 参考訳(メタデータ) (2024-02-06T05:02:33Z) - OBELICS: An Open Web-Scale Filtered Dataset of Interleaved Image-Text
Documents [122.55393759474181]
我々は、インターリーブされた画像テキスト文書のオープンなWebスケールフィルタリングデータセットであるOBELICSを紹介する。
データセット作成プロセスを説明し、包括的なフィルタリングルールを示し、データセットの内容を分析する。
IDEFICSという名前の9~800億のパラメータのビジョンと言語モデルをトレーニングし、異なるマルチモーダルベンチマークで競合性能を得る。
論文 参考訳(メタデータ) (2023-06-21T14:01:01Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - Ultra-High Resolution Segmentation with Ultra-Rich Context: A Novel
Benchmark [57.55282704762691]
URURデータセットには、サイズ5,120x5,120の3,008枚の画像、63都市からの幅広い複雑なシーン、豊富なコンテキストが含まれている。
また、UHRセグメンテーションのためのより効率的で効果的なフレームワークであるWSDNetを、特に超リッチなコンテキストで提案する。
いくつかのUHRデータセットの実験は、最先端のパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-05-18T11:54:13Z) - SATIN: A Multi-Task Metadataset for Classifying Satellite Imagery using
Vision-Language Models [33.814335088752046]
SATellite ImageNet(SATIN)は,既存の27のリモートセンシングデータセットから算出したメタデータセットである。
SATIN上での広帯域ビジョン言語(VL)モデルのゼロショット転送分類能力を総合的に評価する。
SATINは,評価する上で最強のベンチマークであり,分類精度は52.0%である。
論文 参考訳(メタデータ) (2023-04-23T11:23:05Z) - Scrape, Cut, Paste and Learn: Automated Dataset Generation Applied to
Parcel Logistics [58.720142291102135]
4つのステップでインスタンスセグメンテーションのための合成データセットを生成するために,完全に自動化されたパイプラインを提案する。
まず、人気のある画像検索エンジンから興味ある対象の画像を抽出する。
画像選択には,オブジェクトに依存しない事前処理,手動画像選択,CNNに基づく画像選択の3つの方法を比較する。
論文 参考訳(メタデータ) (2022-10-18T12:49:04Z) - LAION-5B: An open large-scale dataset for training next generation
image-text models [16.129935376579326]
我々は585億のCLIPフィルタリング画像テキストペアからなるデータセットであるLAION-5Bを紹介し、そのうち2.32Bは英語を含む。
このデータセットを用いて,CLIP,GLIDE,Stable Diffusionといった基礎モデルのレプリケーションと微調整に成功した。
また、近接するいくつかのインデックス、データセット探索のためのWebインターフェースの改善、サブセット生成も提供しています。
論文 参考訳(メタデータ) (2022-10-16T00:08:18Z) - Sci-Net: a Scale Invariant Model for Building Detection from Aerial
Images [0.0]
本研究では,空間分解能の異なる空間画像に存在している建物を分割できるスケール不変ニューラルネットワーク(Sci-Net)を提案する。
具体的には,U-Netアーキテクチャを改良し,それを高密度なASPP(Atrous Space Pyramid Pooling)で融合し,微細なマルチスケール表現を抽出した。
論文 参考訳(メタデータ) (2021-11-12T16:45:20Z) - Object Detection in Aerial Images: A Large-Scale Benchmark and
Challenges [124.48654341780431]
航空画像(DOTA)におけるオブジェクトデテクションの大規模データセットとODAIの総合的ベースラインについて述べる。
提案するDOTAデータセットは,11,268個の空中画像から収集した18カテゴリのオブジェクト指向ボックスアノテーションの1,793,658個のオブジェクトインスタンスを含む。
70以上の構成を持つ10の最先端アルゴリズムをカバーするベースラインを構築し,各モデルの速度と精度を評価した。
論文 参考訳(メタデータ) (2021-02-24T11:20:55Z) - RGB2LIDAR: Towards Solving Large-Scale Cross-Modal Visual Localization [20.350871370274238]
我々は,大規模なモーダルな視覚的位置決めの重要かつ未解明な問題について検討する。
我々は550万組のRGBと空中LIDAR深度画像を含む新しいデータセットを導入する。
両モードの外観と意味的手がかりを効果的に組み合わせた新しい結合埋め込み方式を提案する。
論文 参考訳(メタデータ) (2020-09-12T01:18:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。