論文の概要: DINOv3 as a Frozen Encoder for CRPS-Oriented Probabilistic Rainfall Nowcasting
- arxiv url: http://arxiv.org/abs/2511.10894v2
- Date: Wed, 19 Nov 2025 17:48:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.421254
- Title: DINOv3 as a Frozen Encoder for CRPS-Oriented Probabilistic Rainfall Nowcasting
- Title(参考訳): CRPS配向確率降雨用冷凍エンコーダDINOv3
- Authors: Luciano Araujo Dourado Filho, Almir Moreira da Silva Neto, Anthony Miyaguchi, Rodrigo Pereira David, Rodrigo Tripodi Calumby, Lukáš Picek,
- Abstract要約: 予め訓練された衛星ビジョンエンコーダにビデオプロジェクタを取り付け、エンコーダトークンを離散経験CDFにマッピングする。
代替として、3D-UNETベースラインは、合計ランク確率スコアと画素ごとのガンマ・ハードル目標で訓練されている。
Weather4Cast 2025 ベンチマークでは、提案手法は CRPS 3.5102 で有望な性能を達成した。
- 参考スコア(独自算出の注目度): 0.4618037115403289
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a competitive and computationally efficient approach to probabilistic rainfall nowcasting. A video projector (V-JEPA Vision Transformer) associated to a lightweight probabilistic head is attached to a pre-trained satellite vision encoder (DINOv3-SAT493M) to map encoder tokens into a discrete empirical CDF (eCDF) over 4-hour accumulated rainfall. The projector-head is optimized end-to-end over the Ranked Probability Score (RPS). As an alternative, 3D-UNET baselines trained with an aggregate Rank Probability Score and a per-pixel Gamma-Hurdle objective are used. On the Weather4Cast 2025 benchmark, the proposed method achieved a promising performance, with a CRPS of 3.5102, which represents $\approx$ 26% in effectiveness gain against the best 3D-UNET.
- Abstract(参考訳): 本稿では,確率的降雨流に対する競争的かつ計算学的に効率的なアプローチを提案する。
軽量な確率的頭部に付随するビデオプロジェクタ(V-JEPA Vision Transformer)を、事前訓練された衛星ビジョンエンコーダ(DINOv3-SAT493M)に取り付け、エンコーダトークンを4時間蓄積した降雨で離散的な経験CDF(eCDF)にマッピングする。
プロジェクタヘッドは、ランク付き確率スコア(RPS)よりもエンドツーエンドに最適化されている。
代替として、3D-UNETベースラインは、合計ランク確率スコアと画素ごとのガンマ・ハードル目標で訓練されている。
Weather4Cast 2025 ベンチマークでは,提案手法は 3.5102 の CRPS で有望な性能を達成した。
関連論文リスト
- FMOcc: TPV-Driven Flow Matching for 3D Occupancy Prediction with Selective State Space Model [1.3220884102442592]
本稿では,フローマッチング選択状態空間モデルを用いた3次元3次元占有予測システムFMOccを提案する。
Occ3D-nuScenesバリデーションで43.1%のRayIoUと39.8%のmIoU,5.4G推論メモリと330ms推論時間でOpenOcc上で42.6%のRayIoUを達成した。
論文 参考訳(メタデータ) (2025-07-03T02:58:39Z) - Representing 3D Shapes With 64 Latent Vectors for 3D Diffusion Models [21.97308739556984]
COD-VAEは3D形状を1D潜伏ベクトルからなるCampact集合に符号化する。
その結果,COD-VAEは品質を維持しつつ,ベースラインの16倍の圧縮を実現していることがわかった。
論文 参考訳(メタデータ) (2025-03-11T06:29:39Z) - Rate-Distortion Optimized Skip Coding of Region Adaptive Hierarchical Transform Coefficients for MPEG G-PCC [13.122745400640305]
3次元(3D)点雲は3Dオブジェクトやシーンを表現するためにますます人気が高まっている。
この課題に対処するため、Moving Picture Experts Groupは、GeometryベースのPoint Cloud Compression(G-PCC)標準を積極的に開発している。
RAHTの適応スキップ手法を提案し,最後の数層の残余を符号化するか否かを適応的に決定する。
論文 参考訳(メタデータ) (2024-12-07T07:43:44Z) - Hourglass Tokenizer for Efficient Transformer-Based 3D Human Pose Estimation [73.31524865643709]
本稿では,Hourglass Tokenizer (HoT) と呼ばれるプラグアンドプレイのプルーニング・アンド・リカバリフレームワークを提案する。
私たちのHoDTは、冗長なフレームのポーズトークンのプルーニングから始まり、フル長のトークンを復元することで終了します。
提案手法は,従来のVPTモデルと比較して高い効率性と推定精度を両立させることができる。
論文 参考訳(メタデータ) (2023-11-20T18:59:51Z) - FastPillars: A Deployment-friendly Pillar-based 3D Detector [63.0697065653061]
既存のBEVベースの(つまりバードアイビュー)検出器は、トレーニングと推論を高速化するためにスパース・コンボリューション(SPConv)を好む。
FastPillarsは、CenterPoint(SPConvベース)よりも1.8倍のスピードアップと3.8mAPH/L2の改善で、Openデータセットの最先端の精度を提供する
論文 参考訳(メタデータ) (2023-02-05T12:13:27Z) - Convex Hull Prediction for Adaptive Video Streaming by Recurrent Learning [38.574550778712236]
本稿では,コンテンツ認識凸船体予測の深層学習に基づく手法を提案する。
再帰的畳み込みネットワーク(RCN)を用いて,映像の複雑さを暗黙的に解析し,その凸殻を予測する。
提案するモデルでは, 最適凸殻の近似精度が向上し, 既存の手法と比較して, 競争時間の節約が期待できる。
論文 参考訳(メタデータ) (2022-06-10T05:11:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。