論文の概要: A General Purpose Spectral Foundational Model for Both Proximal and Remote Sensing Spectral Imaging
- arxiv url: http://arxiv.org/abs/2503.01628v1
- Date: Mon, 03 Mar 2025 15:04:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:18:17.734913
- Title: A General Purpose Spectral Foundational Model for Both Proximal and Remote Sensing Spectral Imaging
- Title(参考訳): 近近距離・遠距離スペクトルイメージングのための汎用スペクトル基礎モデル
- Authors: William Michael Laprade, Jesper Cairo Westergaard, Svend Christensen, Mads Nielsen, Anders Bjorholm Dahl,
- Abstract要約: 時間とリソースの制約は、大規模なスペクトルデータセットを収集する能力を制限します。
マスク付きオートエンコーダアーキテクチャに基づく大規模基盤モデルとデータセットを提案する。
- 参考スコア(独自算出の注目度): 2.4832894642382195
- License:
- Abstract: Spectral imaging data acquired via multispectral and hyperspectral cameras can have hundreds of channels, where each channel records the reflectance at a specific wavelength and bandwidth. Time and resource constraints limit our ability to collect large spectral datasets, making it difficult to build and train predictive models from scratch. In the RGB domain, we can often alleviate some of the limitations of smaller datasets by using pretrained foundational models as a starting point. However, most existing foundation models are pretrained on large datasets of 3-channel RGB images, severely limiting their effectiveness when used with spectral imaging data. The few spectral foundation models that do exist usually have one of two limitations: (1) they are built and trained only on remote sensing data limiting their application in proximal spectral imaging, (2) they utilize the more widely available multispectral imaging datasets with less than 15 channels restricting their use with hundred-channel hyperspectral images. To alleviate these issues, we propose a large-scale foundational model and dataset built upon the masked autoencoder architecture that takes advantage of spectral channel encoding, spatial-spectral masking and ImageNet pretraining for an adaptable and robust model for downstream spectral imaging tasks.
- Abstract(参考訳): マルチスペクトル・ハイパースペクトルカメラで取得した分光画像データには数百のチャンネルがあり、各チャンネルは特定の波長と帯域幅で反射率を記録する。
時間とリソースの制約により、大規模なスペクトルデータセットの収集能力が制限され、予測モデルをスクラッチから構築し、トレーニングすることが困難になります。
RGBドメインでは、事前訓練された基礎モデルを出発点として使用することにより、より小さなデータセットの制限を緩和できることが多い。
しかし、既存の基盤モデルは3チャンネルのRGB画像の大規模なデータセットで事前訓練されており、スペクトル画像データを用いた場合の有効性を著しく制限している。
現存する数少ないスペクトル基盤モデルは、(1)近位分光画像における応用を制限するリモートセンシングデータのみに構築され、訓練されている、(2)より広く利用可能な15チャンネル未満のマルチスペクトル画像データセットを使用して、100チャンネルのハイパースペクトル画像の使用を制限する、という2つの制限の1つである。
これらの問題を緩和するために, スペクトルチャネル符号化, 空間スペクトルマスキング, ImageNetプリトレーニングを活用するマスク付きオートエンコーダアーキテクチャ上に構築された大規模基盤モデルとデータセットを提案する。
関連論文リスト
- BihoT: A Large-Scale Dataset and Benchmark for Hyperspectral Camouflaged Object Tracking [22.533682363532403]
我々は、ハイパースペクトルカモフラージュされた物体追跡(HCOT)と呼ばれる新しいタスクを提供する。
大規模HCOTデータセットであるBihoTは,49個のビデオシーケンスをカバーする41,912個のハイパースペクトル画像からなる。
スペクトルプロンプトベースインタラプタ・アウェアネットワーク(SPDAN)という,シンプルだが効果的なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2024-08-22T09:07:51Z) - SpectralEarth: Training Hyperspectral Foundation Models at Scale [47.93167977587301]
ハイパースペクトル基礎モデルの事前学習を目的とした大規模マルチ時間データセットであるSpectralEarthを紹介する。
我々は、最先端の自己教師付き学習(SSL)アルゴリズムを用いて、SpectralEarthの一連の基礎モデルを事前訓練する。
我々は、土地被覆と収穫型マッピングのための4つの下流データセットを構築し、モデル評価のためのベンチマークを提供する。
論文 参考訳(メタデータ) (2024-08-15T22:55:59Z) - Spectral Image Data Fusion for Multisource Data Augmentation [44.99833362998488]
マルチスペクトル画像やハイパースペクトル画像は、リモートセンシング、天文学的イメージング、精密農業など、さまざまな研究分野で人気が高まっている。
機械学習タスクを実行できる無料データの量は比較的少ない。
スペクトル画像の領域で開発された人工知能モデルは、固定されたスペクトルシグネチャを持つ入力画像を必要とする。
論文 参考訳(メタデータ) (2024-04-05T13:40:18Z) - SpectralNeRF: Physically Based Spectral Rendering with Neural Radiance
Field [70.15900280156262]
本稿では,新しいスペクトルの観点から,高品質な物理ベースレンダリングのためのエンドツーエンドニューラルラジアンスフィールド(NeRF)アーキテクチャを提案する。
スペクトルNeRFは、合成データセットと実データセットの新しいビューを合成する際に、最近のNeRFベースの方法よりも優れている。
論文 参考訳(メタデータ) (2023-12-14T07:19:31Z) - SpectralGPT: Spectral Remote Sensing Foundation Model [60.023956954916414]
SpectralGPTという名前のユニバーサルRS基盤モデルは、新しい3D生成事前学習変換器(GPT)を用いてスペクトルRS画像を処理するために構築されている。
既存の基礎モデルと比較して、SpectralGPTは、様々なサイズ、解像度、時系列、領域をプログレッシブトレーニング形式で対応し、広範なRSビッグデータのフル活用を可能にする。
我々の評価では、事前訓練されたスペクトルGPTモデルによる顕著な性能向上が強調され、地球科学分野におけるスペクトルRSビッグデータ応用の進展に有意な可能性を示唆している。
論文 参考訳(メタデータ) (2023-11-13T07:09:30Z) - Exploring Cross-Domain Pretrained Model for Hyperspectral Image
Classification [30.10527300601721]
プレトレイン-ファインチューン戦略は、CNNトレーニングにデータが不十分な場合に発生するオーバーフィッティングを減らすために広く用いられている。
我々は、後に様々なスペクトル領域に展開できる普遍的クロスドメインモデルをトレーニングすることを目指している。
提案手法は,精度と訓練効率の両方において優れていることがわかった。
論文 参考訳(メタデータ) (2022-04-07T01:09:42Z) - Mega-NeRF: Scalable Construction of Large-Scale NeRFs for Virtual
Fly-Throughs [54.41204057689033]
我々は、ニューラルネットワーク(NeRF)を活用して、建物にまたがる大規模な視覚的キャプチャーや、主にドローンデータから収集された複数の都市ブロックからインタラクティブな3D環境を構築する方法について検討する。
NeRFが伝統的に評価されている単一のオブジェクトシーンとは対照的に、この設定には複数の課題がある。
我々は、訓練画像(またはむしろピクセル)を、並列で訓練できる異なるNeRFサブモジュールに分割する単純なクラスタリングアルゴリズムを導入する。
論文 参考訳(メタデータ) (2021-12-20T17:40:48Z) - spectrai: A deep learning framework for spectral data [0.0]
本稿では、スペクトルデータに基づくニューラルネットワークのトレーニングを容易にするために設計されたオープンソースのフレームワークであるspectraiを紹介する。
Spectiは、多数のスペクトルデータ前処理と拡張方法、スペクトル(画像)のデノイズ化、スペクトル(画像)分類、スペクトル画像セグメンテーション、スペクトル画像超解像を含むスペクトルデータのためのニューラルネットワークを提供する。
論文 参考訳(メタデータ) (2021-08-17T12:54:34Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z) - Learning Spatial-Spectral Prior for Super-Resolution of Hyperspectral
Imagery [79.69449412334188]
本稿では,最先端の残差学習をベースとした単一グレー/RGB画像の超解像化手法について検討する。
本稿では,空間情報とハイパースペクトルデータのスペクトル間の相関をフル活用するための空間スペクトル先行ネットワーク(SSPN)を提案する。
実験結果から,SSPSR法により高分解能高分解能高分解能画像の詳細が得られた。
論文 参考訳(メタデータ) (2020-05-18T14:25:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。