論文の概要: Image-Based Multi-Survey Classification of Light Curves with a Pre-Trained Vision Transformer
- arxiv url: http://arxiv.org/abs/2507.11711v1
- Date: Tue, 15 Jul 2025 20:30:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.141797
- Title: Image-Based Multi-Survey Classification of Light Curves with a Pre-Trained Vision Transformer
- Title(参考訳): 事前学習型視覚変換器を用いた光曲線のイメージベースマルチサーベイ分類
- Authors: Daniel Moreno-Cartagena, Guillermo Cabrera-Vives, Alejandra M. Muñoz Arancibia, Pavlos Protopapas, Francisco Förster, Márcio Catelan, A. Bayo, Pablo A. Estévez, P. Sánchez-Sáez, Franz E. Bauer, M. Pavez-Herrera, L. Hernández-García, Gonzalo Rojas,
- Abstract要約: 我々は、マルチサーベイ環境での光度分類に、事前訓練された視覚変換器であるSwin Transformer V2の使用について検討する。
Zwicky Transient Facility (ZTF) とAsteroid Terrestrial-impact Last Alert System (ATLAS) のデータを統合するためのさまざまな戦略の評価を行った。
- 参考スコア(独自算出の注目度): 31.76431580841178
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore the use of Swin Transformer V2, a pre-trained vision Transformer, for photometric classification in a multi-survey setting by leveraging light curves from the Zwicky Transient Facility (ZTF) and the Asteroid Terrestrial-impact Last Alert System (ATLAS). We evaluate different strategies for integrating data from these surveys and find that a multi-survey architecture which processes them jointly achieves the best performance. These results highlight the importance of modeling survey-specific characteristics and cross-survey interactions, and provide guidance for building scalable classifiers for future time-domain astronomy.
- Abstract(参考訳): 我々は、ZTF(Zwicky Transient Facility)とATLAS(Asteroid Terrestrial-impact Last Alert System)からの光曲線を利用して、多サーベイ環境での光度分類に、事前訓練された視覚変換器であるSwin Transformer V2の使用を探求する。
これらの調査からデータを統合するためのさまざまな戦略を評価し、それらを共同で処理するマルチサーベイアーキテクチャが最高のパフォーマンスを達成することを確かめる。
これらの結果は,調査固有の特徴とクロスサーベイ相互作用をモデル化することの重要性を強調し,将来的な時間領域天文学のためのスケーラブルな分類器を構築するためのガイダンスを提供する。
関連論文リスト
- AetherVision-Bench: An Open-Vocabulary RGB-Infrared Benchmark for Multi-Angle Segmentation across Aerial and Ground Perspectives [2.0293118701268154]
身近なAIシステムは、認識能力を高めて、地上車両やドローンの自律的なナビゲーションを変革している。
AetherVision-Benchは空中および地上の多角的セグメンテーションのベンチマークである。
提案したベンチマークを用いて最先端のOVSSモデルを評価し,ゼロショット転送モデルの性能に影響を及ぼす要因について検討する。
論文 参考訳(メタデータ) (2025-06-04T08:41:19Z) - HyTAS: A Hyperspectral Image Transformer Architecture Search Benchmark and Analysis [7.116403133334646]
ハイパースペクトルイメージングのためのトランスフォーマーアーキテクチャ探索のための最初のベンチマークであるHyTASを提案する。
5つの異なるデータセットに対して最適なトランスフォーマーを識別するための12の異なる手法を評価する。
ハイパースペクトル変換器のサーチ性能について広範な因子分析を行う。
論文 参考訳(メタデータ) (2024-07-23T08:18:43Z) - Geometric Features Enhanced Human-Object Interaction Detection [11.513009304308724]
我々は、新しいエンドツーエンド変換方式HOI検出モデル、すなわち幾何学的特徴強化HOI検出器(GeoHOI)を提案する。
モデルの1つの重要な部分は、UniPointNetと呼ばれる新しい統合された自己教師付きキーポイント学習方法である。
GeoHOIはトランスフォーマーをベースとしたHOI検出器を効果的にアップグレードする。
論文 参考訳(メタデータ) (2024-06-26T18:52:53Z) - Transformers Fusion across Disjoint Samples for Hyperspectral Image Classification [2.1223532600703385]
3Dスウィントランス(3D-ST)は、画像内の複雑な空間的関係を捉えるのに優れる。
SSTは、自己アテンション機構による長距離依存関係のモデリングを専門とする。
本稿では、ハイパースペクトル画像(HSI)の分類性能を大幅に向上させるために、これらの2つの変換器の注意融合を導入する。
論文 参考訳(メタデータ) (2024-05-02T08:49:01Z) - A Comprehensive Survey for Hyperspectral Image Classification: The Evolution from Conventional to Transformers and Mamba Models [25.18873183963132]
ハイパースペクトル画像分類(HSC)は、HSデータの高次元性と複雑な性質のため、重要な課題を提示する。
ディープラーニング(DL)技術は、これらの課題に対処するための堅牢なソリューションとして現れています。
我々は,HSCのためのDLにおける重要な概念,方法論,および最先端のアプローチを体系的に検討した。
論文 参考訳(メタデータ) (2024-04-23T12:00:20Z) - DAMSDet: Dynamic Adaptive Multispectral Detection Transformer with
Competitive Query Selection and Adaptive Feature Fusion [82.2425759608975]
赤外可視物体検出は、赤外画像と可視画像の相補的情報を融合することにより、フルデイ物体検出の堅牢化を目指している。
本稿では,この2つの課題に対処する動的適応型マルチスペクトル検出変換器(DAMSDet)を提案する。
4つの公開データセットの実験は、他の最先端の手法と比較して大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-01T07:03:27Z) - Leveraging the Power of Data Augmentation for Transformer-based Tracking [64.46371987827312]
トラッキング用にカスタマイズされた2つのデータ拡張手法を提案する。
まず、動的探索半径機構と境界サンプルのシミュレーションにより、既存のランダムトリミングを最適化する。
第2に,背景干渉などの問題に対するモデルを可能にする,トークンレベルの機能混在強化戦略を提案する。
論文 参考訳(メタデータ) (2023-09-15T09:18:54Z) - ViT-Calibrator: Decision Stream Calibration for Vision Transformer [49.60474757318486]
本稿では、一般的な視覚変換器の性能を高めるための、決定ストリームと呼ばれる新しいパラダイムを提案する。
異なるトークンと複数の次元の関連係数の相関関係を探索し,学習過程における情報伝達機構について光を当てた。
論文 参考訳(メタデータ) (2023-04-10T02:40:24Z) - Demystify Transformers & Convolutions in Modern Image Deep Networks [80.16624587948368]
本稿では,一般のコンボリューションとアテンション演算子の真の利益を,詳細な研究により同定することを目的とする。
注意や畳み込みのようなこれらの特徴変換モジュールの主な違いは、それらの空間的特徴集約アプローチにある。
様々なSTMが統合されたフレームワークに統合され、包括的な比較分析を行う。
論文 参考訳(メタデータ) (2022-11-10T18:59:43Z) - Structural Prior Guided Generative Adversarial Transformers for
Low-Light Image Enhancement [51.22694467126883]
低照度画像強調を実現するために,SPGAT (Structure Prior Guided Generative Adversarial Transformer) を提案する。
このジェネレータはU字型のトランスフォーマーをベースとしており、非局所的な情報を探り、画像の鮮明な復元に役立てている。
より現実的な画像を生成するために,生成器と識別器のスキップ接続を構築することによって,新しい構造的事前学習手法を開発した。
論文 参考訳(メタデータ) (2022-07-16T04:05:40Z) - Rich CNN-Transformer Feature Aggregation Networks for Super-Resolution [50.10987776141901]
近年の視覚変換器と自己注意は,様々なコンピュータビジョンタスクにおいて有望な成果を上げている。
我々は,CNNの局所的特徴とトランスフォーマーが捉えた長距離依存性を活用する,超解像(SR)タスクのための効果的なハイブリッドアーキテクチャを提案する。
提案手法は,多数のベンチマークデータセットから最先端のSR結果を得る。
論文 参考訳(メタデータ) (2022-03-15T06:52:25Z) - ViTAEv2: Vision Transformer Advanced by Exploring Inductive Bias for
Image Recognition and Beyond [76.35955924137986]
我々は、内在性IBを畳み込み、すなわちViTAEから探索するビジョントランスフォーマーを提案する。
ViTAEはいくつかの空間ピラミッド縮小モジュールを備えており、入力イメージをリッチなマルチスケールコンテキストでトークンに埋め込む。
我々は、ImageNet検証セット上で88.5%のTop-1分類精度と、ImageNet実検証セット上で最高の91.2%のTop-1分類精度を得る。
論文 参考訳(メタデータ) (2022-02-21T10:40:05Z) - Paying Attention to Astronomical Transients: Introducing the Time-series
Transformer for Photometric Classification [6.586394734694152]
本稿では,自然言語処理のためのトランスフォーマーアーキテクチャを提案する。
時系列変換器をフォトメトリック分類のタスクに適用し、エキスパートドメイン知識の信頼性を最小化する。
我々は、光度LSST天文時系列分類チャレンジのデータを用いて、不均衡なデータに対する0.507の対数ロスを達成する。
論文 参考訳(メタデータ) (2021-05-13T10:16:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。