論文の概要: DINOv3 as a Frozen Encoder for CRPS-Oriented Probabilistic Rainfall Nowcasting
- arxiv url: http://arxiv.org/abs/2511.10894v2
- Date: Wed, 19 Nov 2025 17:48:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.421254
- Title: DINOv3 as a Frozen Encoder for CRPS-Oriented Probabilistic Rainfall Nowcasting
- Title(参考訳): CRPS配向確率降雨用冷凍エンコーダDINOv3
- Authors: Luciano Araujo Dourado Filho, Almir Moreira da Silva Neto, Anthony Miyaguchi, Rodrigo Pereira David, Rodrigo Tripodi Calumby, Lukáš Picek,
- Abstract要約: 予め訓練された衛星ビジョンエンコーダにビデオプロジェクタを取り付け、エンコーダトークンを離散経験CDFにマッピングする。
代替として、3D-UNETベースラインは、合計ランク確率スコアと画素ごとのガンマ・ハードル目標で訓練されている。
Weather4Cast 2025 ベンチマークでは、提案手法は CRPS 3.5102 で有望な性能を達成した。
- 参考スコア(独自算出の注目度): 0.4618037115403289
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a competitive and computationally efficient approach to probabilistic rainfall nowcasting. A video projector (V-JEPA Vision Transformer) associated to a lightweight probabilistic head is attached to a pre-trained satellite vision encoder (DINOv3-SAT493M) to map encoder tokens into a discrete empirical CDF (eCDF) over 4-hour accumulated rainfall. The projector-head is optimized end-to-end over the Ranked Probability Score (RPS). As an alternative, 3D-UNET baselines trained with an aggregate Rank Probability Score and a per-pixel Gamma-Hurdle objective are used. On the Weather4Cast 2025 benchmark, the proposed method achieved a promising performance, with a CRPS of 3.5102, which represents $\approx$ 26% in effectiveness gain against the best 3D-UNET.
- Abstract(参考訳): 本稿では,確率的降雨流に対する競争的かつ計算学的に効率的なアプローチを提案する。
軽量な確率的頭部に付随するビデオプロジェクタ(V-JEPA Vision Transformer)を、事前訓練された衛星ビジョンエンコーダ(DINOv3-SAT493M)に取り付け、エンコーダトークンを4時間蓄積した降雨で離散的な経験CDF(eCDF)にマッピングする。
プロジェクタヘッドは、ランク付き確率スコア(RPS)よりもエンドツーエンドに最適化されている。
代替として、3D-UNETベースラインは、合計ランク確率スコアと画素ごとのガンマ・ハードル目標で訓練されている。
Weather4Cast 2025 ベンチマークでは,提案手法は 3.5102 の CRPS で有望な性能を達成した。
関連論文リスト
- FireSentry: A Multi-Modal Spatio-temporal Benchmark Dataset for Fine-Grained Wildfire Spread Forecasting [41.82363110982653]
本稿では,サブメーター空間とサブ秒時間分解能を特徴とする地域規模のマルチモーダル山火事データセットFireSentryを提案する。
FireSentryは、可視および赤外線のビデオストリーム、その場での環境測定、手動で検証されたファイアマスクを提供する。
FireSentry上に構築され、物理に基づく、データ駆動、生成モデルを含む包括的なベンチマークを構築します。
論文 参考訳(メタデータ) (2025-12-03T02:02:47Z) - RadProPoser: A Framework for Human Pose Estimation with Uncertainty Quantification from Raw Radar Data [1.5318029014836756]
複素数値レーダテンソルを処理する確率的エンコーダデコーダアーキテクチャであるRadProPoserを紹介する。
変分推論をキーポイント回帰に組み込むことで、RadProPoserは26の3次元関節位置を共同で予測する。
RadProPoserは、光学式モーションキャプチャー地上真実を用いて、45度の角度で5.678cmの6.425cmの総合平均接合位置誤差(MPJPE)を達成した。
論文 参考訳(メタデータ) (2025-08-05T15:46:05Z) - FMOcc: TPV-Driven Flow Matching for 3D Occupancy Prediction with Selective State Space Model [1.3220884102442592]
本稿では,フローマッチング選択状態空間モデルを用いた3次元3次元占有予測システムFMOccを提案する。
Occ3D-nuScenesバリデーションで43.1%のRayIoUと39.8%のmIoU,5.4G推論メモリと330ms推論時間でOpenOcc上で42.6%のRayIoUを達成した。
論文 参考訳(メタデータ) (2025-07-03T02:58:39Z) - Speedy MASt3R [68.47052557089631]
MASt3Rは、DUSt3Rを活用して高速な相互マッチング方式を導入することで、画像マッチングを3Dタスクとして再定義する。
高速MASt3Rは、精度を犠牲にすることなく、推論時間(画像ペアあたり198msから91ms)を54%削減する。
この進歩により、リアルタイムな3D理解が可能になり、複合現実ナビゲーションや大規模3Dシーン再構築といったアプリケーションに恩恵をもたらす。
論文 参考訳(メタデータ) (2025-03-13T03:56:22Z) - Representing 3D Shapes With 64 Latent Vectors for 3D Diffusion Models [21.97308739556984]
COD-VAEは3D形状を1D潜伏ベクトルからなるCampact集合に符号化する。
その結果,COD-VAEは品質を維持しつつ,ベースラインの16倍の圧縮を実現していることがわかった。
論文 参考訳(メタデータ) (2025-03-11T06:29:39Z) - OccProphet: Pushing Efficiency Frontier of Camera-Only 4D Occupancy Forecasting with Observer-Forecaster-Refiner Framework [22.313380621399517]
そこで本稿では,計算要求をはるかに小さくして占有率予測を効率的に学習する新しいフレームワークOccProphetを提案する。
OccProphetは、Observer、Forecaster、Refinerの3つの軽量コンポーネントで構成されている。
計算コストの58%$sim$78%を2.6$times$ speedupで削減する。
論文 参考訳(メタデータ) (2025-02-21T03:21:48Z) - Rate-Distortion Optimized Skip Coding of Region Adaptive Hierarchical Transform Coefficients for MPEG G-PCC [13.122745400640305]
3次元(3D)点雲は3Dオブジェクトやシーンを表現するためにますます人気が高まっている。
この課題に対処するため、Moving Picture Experts Groupは、GeometryベースのPoint Cloud Compression(G-PCC)標準を積極的に開発している。
RAHTの適応スキップ手法を提案し,最後の数層の残余を符号化するか否かを適応的に決定する。
論文 参考訳(メタデータ) (2024-12-07T07:43:44Z) - PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion [80.79938369319152]
我々は,PCF(Probabilis-tic Contrastive Fusion)に基づくPCF-Liftという新しいパイプラインを設計する。
私たちのPCFリフトは、ScanNetデータセットやMessy Roomデータセット(シーンレベルのPQが4.4%改善)など、広く使用されているベンチマークにおいて、最先端の手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-10-14T16:06:59Z) - Hourglass Tokenizer for Efficient Transformer-Based 3D Human Pose Estimation [73.31524865643709]
本稿では,Hourglass Tokenizer (HoT) と呼ばれるプラグアンドプレイのプルーニング・アンド・リカバリフレームワークを提案する。
私たちのHoDTは、冗長なフレームのポーズトークンのプルーニングから始まり、フル長のトークンを復元することで終了します。
提案手法は,従来のVPTモデルと比較して高い効率性と推定精度を両立させることができる。
論文 参考訳(メタデータ) (2023-11-20T18:59:51Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Self-Distilled Masked Auto-Encoders are Efficient Video Anomaly
Detectors [117.61449210940955]
ビデオフレームレベルで適用された軽量マスク付きオートエンコーダ(AE)に基づく効率的な異常事象検出モデルを提案する。
動き勾配に基づく重みトークンへのアプローチを導入し、静的背景シーンから前景オブジェクトへ焦点を移す。
トレーニングビデオの強化のために合成異常事象を生成し,マスク付きAEモデルを用いてオリジナルのフレームを共同で再構築する。
論文 参考訳(メタデータ) (2023-06-21T06:18:05Z) - FastPillars: A Deployment-friendly Pillar-based 3D Detector [63.0697065653061]
既存のBEVベースの(つまりバードアイビュー)検出器は、トレーニングと推論を高速化するためにスパース・コンボリューション(SPConv)を好む。
FastPillarsは、CenterPoint(SPConvベース)よりも1.8倍のスピードアップと3.8mAPH/L2の改善で、Openデータセットの最先端の精度を提供する
論文 参考訳(メタデータ) (2023-02-05T12:13:27Z) - It Takes Two: Masked Appearance-Motion Modeling for Self-supervised
Video Transformer Pre-training [76.69480467101143]
自己監督型ビデオトランスフォーマーの事前トレーニングは、最近マスク・アンド・予測パイプラインの恩恵を受けている。
本稿では,映像中の動きの手がかりを余分な予測対象として明示的に調査し,マスケッド・出現運動モデリングフレームワークを提案する。
一般的なビデオ表現を学習し、Kinects-400で82.3%、Something V2で71.3%、UCF101で91.5%、HMDB51で62.5%を達成する。
論文 参考訳(メタデータ) (2022-10-11T08:05:18Z) - Convex Hull Prediction for Adaptive Video Streaming by Recurrent Learning [38.574550778712236]
本稿では,コンテンツ認識凸船体予測の深層学習に基づく手法を提案する。
再帰的畳み込みネットワーク(RCN)を用いて,映像の複雑さを暗黙的に解析し,その凸殻を予測する。
提案するモデルでは, 最適凸殻の近似精度が向上し, 既存の手法と比較して, 競争時間の節約が期待できる。
論文 参考訳(メタデータ) (2022-06-10T05:11:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。