論文の概要: Universal Spectral Tokenization via Self-Supervised Panchromatic Representation Learning
- arxiv url: http://arxiv.org/abs/2510.17959v2
- Date: Mon, 10 Nov 2025 16:51:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 14:56:00.330196
- Title: Universal Spectral Tokenization via Self-Supervised Panchromatic Representation Learning
- Title(参考訳): 自己教師付きパンクロマティック表現学習によるユニバーサルスペクトルトークン化
- Authors: Jeff Shen, Francois Lanusse, Liam Holden Parker, Ollie Liu, Tom Hehir, Leopoldo Sarra, Lucas Meyer, Micah Bowles, Sebastian Wagner-Carena, Sebastian Wagner-Carena, Helen Qu, Siavash Golkar, Alberto Bietti, Hatim Bourfoune, Nathan Cassereau, Pierre Cornette, Keiya Hirashima, Geraud Krawezik, Ruben Ohana, Nicholas Lourie, Michael McCabe, Rudy Morel, Payel Mukhopadhyay, Mariel Pettee, Bruno Régaldo-Saint Blancard, Kyunghyun Cho, Miles Cranmer, Shirley Ho,
- Abstract要約: 連続した科学的データは、多くの解像度と領域にまたがり、それらを共通の表現に統一することは、科学の基礎モデルを開発するための重要なステップである。
ヘテロジニアススペクトルを自己監督的に学習する深層学習モデルを提案する。
初めて、単一のモデルが、解像度と領域をまたいだスペクトルデータを統一できることを実証した。
- 参考スコア(独自算出の注目度): 39.14992490784682
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sequential scientific data span many resolutions and domains, and unifying them into a common representation is a key step toward developing foundation models for the sciences. Astronomical spectra exemplify this challenge: massive surveys have collected millions of spectra across a wide range of wavelengths and resolutions, yet analyses remain fragmented across spectral domains (e.g., optical vs. infrared) and object types (e.g., stars vs. galaxies), limiting the ability to pool information across datasets. We present a deep learning model that jointly learns from heterogeneous spectra in a self-supervised manner. Our universal spectral tokenizer processes spectra from a variety of object types and resolutions directly on their native wavelength grids, producing intrinsically aligned, homogeneous, and physically meaningful representations that can be efficiently adapted to achieve competitive performance across a range of downstream tasks. For the first time, we demonstrate that a single model can unify spectral data across resolutions and domains, suggesting that our model can serve as a powerful building block for foundation models in astronomy -- and potentially extend to other scientific domains with heterogeneous sequential data, such as climate and healthcare.
- Abstract(参考訳): 連続した科学的データは、多くの解像度と領域にまたがり、それらを共通の表現に統一することは、科学の基礎モデルを開発するための重要なステップである。
大規模な調査では、広い波長と解像度で数百万のスペクトルを集めているが、分析は、スペクトル領域(例えば、光対赤外線)とオブジェクトタイプ(例えば、恒星対銀河)で断片化され、データセット間で情報をプールする能力が制限されている。
ヘテロジニアススペクトルを自己監督的に学習する深層学習モデルを提案する。
我々の普遍的なスペクトルトークン化器は、様々なオブジェクトタイプや解像度のスペクトルをネイティブの波長グリッド上で直接処理し、本質的に整列し、均一で、物理的に有意義な表現を生成し、様々な下流タスクで競争性能を達成するために効率的に適応することができる。
初めて、単一のモデルが解像度と領域をまたいでスペクトルデータを統一できることを示し、私たちのモデルは天文学の基礎モデルのための強力なビルディングブロックとして機能し、気候や医療のような異質なシーケンシャルなデータを持つ他の科学領域にまで拡張できる可能性を示唆している。
関連論文リスト
- Augmenting representations with scientific papers [0.820984376071696]
天文学者は、画像、スペクトル、時系列を含む膨大なマルチモーダルデータのリポジトリを取得した。
これらのデータソースは、体系的に統合されることはめったにない。
この研究は、X線スペクトルと科学文献から抽出された領域知識を整合させるために設計された対照的な学習フレームワークを導入する。
論文 参考訳(メタデータ) (2026-03-04T19:04:45Z) - OmniSpectra: A Unified Foundation Model for Native Resolution Astronomical Spectra [4.254099382808598]
オムニスペクトル(OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra, OmniSpectra。
固定長の入力サイズや構成に制限のある従来のモデルとは異なり、OmniSpectraは元のサイズで任意の長さのスペクトルを処理する。
この伝達学習能力により、このモデルは、星や銀河の性質予測や、源の分類、赤方偏移の推定など、様々な天文学的タスクにおける最先端のモデルとなっている。
論文 参考訳(メタデータ) (2026-01-21T04:39:32Z) - DiffSpectra: Molecular Structure Elucidation from Spectra using Diffusion Models [68.19129717255053]
本稿では、分子構造解明を条件生成プロセスとして定式化する生成フレームワークであるDiffSpectraについて述べる。
我々の実験では、DiffSpectraが分子構造を正確に解明し、40.76%のトップ-1と99.49%のトップ10を達成している。
論文 参考訳(メタデータ) (2025-07-09T13:57:20Z) - SpecCLIP: Aligning and Translating Spectroscopic Measurements for Stars [1.4217538206528657]
我々は、LLMにインスパイアされた方法論を恒星スペクトル分析に拡張する基盤モデルフレームワークであるSpecCLIPを提案する。
大規模データセットの基盤モデルをトレーニングすることで、さまざまな下流アプリケーションをサポートする堅牢で情報に富んだ埋め込みを学ぶことが私たちのゴールです。
これらのモデルを中規模ラベル付きデータセットに微調整することで、恒星パラメータ推定や化学特性決定といったタスクへの適応性が向上することを示した。
論文 参考訳(メタデータ) (2025-07-02T17:49:52Z) - CARL: Camera-Agnostic Representation Learning for Spectral Image Analysis [69.02751635551724]
スペクトルイメージングは、医療や都市景観の理解など、様々な領域で有望な応用を提供する。
スペクトルカメラのチャネル次元と捕獲波長のばらつきは、AI駆動方式の開発を妨げる。
本稿では,RGB,マルチスペクトル,ハイパースペクトル画像を用いたカメラ非依存表現学習モデルCARLを紹介する。
論文 参考訳(メタデータ) (2025-04-27T13:06:40Z) - Shared Stochastic Gaussian Process Latent Variable Models: A Multi-modal Generative Model for Quasar Spectra [2.3099448395832956]
我々は、観測されたスペクトルの特徴と銀河や太陽系外惑星などの天体の科学的性質の両方を含むデータセットの天体物理学への応用に焦点をあてる。
クエーサーとして知られる非常に明るい銀河のスペクトルとその性質を、複数の観測空間で研究する。
単一のデータポイントは、それぞれ異なる可能性を持つ異なる観察のクラスによって特徴づけられる。
論文 参考訳(メタデータ) (2025-02-27T06:57:23Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - SpectralGPT: Spectral Remote Sensing Foundation Model [60.023956954916414]
SpectralGPTという名前のユニバーサルRS基盤モデルは、新しい3D生成事前学習変換器(GPT)を用いてスペクトルRS画像を処理するために構築されている。
既存の基礎モデルと比較して、SpectralGPTは、様々なサイズ、解像度、時系列、領域をプログレッシブトレーニング形式で対応し、広範なRSビッグデータのフル活用を可能にする。
我々の評価では、事前訓練されたスペクトルGPTモデルによる顕著な性能向上が強調され、地球科学分野におけるスペクトルRSビッグデータ応用の進展に有意な可能性を示唆している。
論文 参考訳(メタデータ) (2023-11-13T07:09:30Z) - HoloNets: Spectral Convolutions do extend to Directed Graphs [59.851175771106625]
従来の知恵は、スペクトル畳み込みネットワークは無向グラフ上にしか展開できないと規定している。
ここでは、このグラフフーリエ変換への伝統的な依存が超フルであることを示す。
本稿では,新たに開発されたフィルタの周波数応答解釈を行い,フィルタ表現に使用するベースの影響を調査し,ネットワークを基盤とする特性演算子との相互作用について議論する。
論文 参考訳(メタデータ) (2023-10-03T17:42:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。