論文の概要: Region-Conditioned Orthogonal 3D U-Net for Weather4Cast Competition
- arxiv url: http://arxiv.org/abs/2212.02059v1
- Date: Mon, 5 Dec 2022 06:50:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 17:23:13.162768
- Title: Region-Conditioned Orthogonal 3D U-Net for Weather4Cast Competition
- Title(参考訳): 気象4Castコンペティションのための地域指定直交3次元U-Net
- Authors: Taehyeon Kim, Shinhwan Kang, Hyeonjeong Shin, Deukryeol Yoon, Seongha
Eom, Kijung Shin, Se-Young Yun
- Abstract要約: 領域条件付き層と1x1x1畳み込み層により, 汎用の3次元U-Netを著しく改善できることを示す。
ベースラインアルゴリズムは、1%未満のパラメータで19.54%向上し、コアテストリーダーボードでは4位となった。
- 参考スコア(独自算出の注目度): 18.218156420265977
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Weather4Cast competition (hosted by NeurIPS 2022) required competitors to
predict super-resolution rain movies in various regions of Europe when
low-resolution satellite contexts covering wider regions are given. In this
paper, we show that a general baseline 3D U-Net can be significantly improved
with region-conditioned layers as well as orthogonality regularizations on
1x1x1 convolutional layers. Additionally, we facilitate the generalization with
a bag of training strategies: mixup data augmentation, self-distillation, and
feature-wise linear modulation (FiLM). Presented modifications outperform the
baseline algorithms (3D U-Net) by up to 19.54% with less than 1% additional
parameters, which won the 4th place in the core test leaderboard.
- Abstract(参考訳): NeurIPS 2022が主催するWeather4Castコンペティションでは、より広い地域をカバーする低解像度の衛星コンテキストが与えられる場合に、ヨーロッパ各地の超高解像度降雨映画を予測することが必要とされた。
本稿では,領域条件層と1x1x1畳み込み層上の直交正規化により,一般のベースライン3d u-netを著しく改善できることを示す。
さらに, ミックスアップデータ拡張, 自己蒸留, 特徴点線形変調(フィルム)など, 訓練戦略の袋で一般化を促進する。
提案された修正はベースラインアルゴリズム(3D U-Net)を最大19.54%まで上回り、1%以上のパラメータが追加され、コアテストリーダーボードでは4位となった。
関連論文リスト
- SHARP-Net: A Refined Pyramid Network for Deficiency Segmentation in Culverts and Sewer Pipes [1.663204995903499]
SHARP-Netはセマンティックセグメンテーションのための新しいアーキテクチャである。
Inceptionのようなブロックとさまざまなフィルタサイズを備えたボトムアップパスを統合している。
ネットワーク全体を通して、複雑さを減らすために深度的に分離可能な畳み込みが使用される。
論文 参考訳(メタデータ) (2024-08-02T23:55:04Z) - Revisiting Multi-modal 3D Semantic Segmentation in Real-world Autonomous
Driving [16.402708657215804]
既存のマルチモーダル手法では,1)効率的な展開とリアルタイム実行の難しさ,2)LiDARとカメラのキャリブレーションが弱い場合の劇的な性能劣化という2つの課題に直面している。
我々は,LiDARのみのCPGNetを拡張した新しいマルチモーダル融合フレームワークであるCPGNet-LCFを提案する。
論文 参考訳(メタデータ) (2023-10-13T02:43:35Z) - RainUNet for Super-Resolution Rain Movie Prediction under
Spatio-temporal Shifts [22.972610820962625]
本稿では、Weather4cast 2022 Challenge Stage 2に対する解決策を提案する。
この課題の目標は、地上レーダーから得られる将来の高解像度降雨事象を予測することである。
本稿では,課題に適したデータ前処理を行い,新しいRainUNetを用いて降雨映画を予測する手法を提案する。
論文 参考訳(メタデータ) (2022-12-07T23:42:39Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Semantic Segmentation by Early Region Proxy [53.594035639400616]
本稿では,学習可能な領域のテッセルレーションとしてイメージを解釈することから始まる,新規で効率的なモデリングについて述べる。
領域のコンテキストをモデル化するために,Transformerを用いてシーケンス・ツー・シーケンス方式で領域を符号化する。
現在、符号化された領域埋め込みの上に、領域ごとのセマンティックセグメンテーションを行う。
論文 参考訳(メタデータ) (2022-03-26T10:48:32Z) - LiDAR-based 4D Panoptic Segmentation via Dynamic Shifting Network [56.71765153629892]
本稿では,ポイントクラウド領域における効果的な単視分割フレームワークとして機能する動的シフトネットワーク(DS-Net)を提案する。
提案するDS-Netは,両タスクの現在の最先端手法よりも優れた精度を実現する。
DS-Netを4次元パノプティカルLiDARセグメンテーションに拡張し、一列のLiDARフレーム上で時間的に統一されたインスタンスクラスタリングを行う。
論文 参考訳(メタデータ) (2022-03-14T15:25:42Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR
Segmentation [81.02742110604161]
大規模運転シーンのLiDARセグメンテーションのための最先端の手法は、しばしば点雲を2次元空間に投影し、2D畳み込みによって処理する。
そこで我々は,3次元幾何学的パタンを探索するために,円筒分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
提案手法はセマンティックKITTIのリーダーボードにおいて第1位を獲得し,既存のnuScenesの手法を約4%のマージンで上回っている。
論文 参考訳(メタデータ) (2020-11-19T18:53:11Z) - Dynamic Region-Aware Convolution [85.20099799084026]
本稿では,複数のフィルタを対応する空間領域に自動的に割り当てる動的領域認識畳み込み(DRConv)を提案する。
ImageNet分類において、DRConvベースのShuffleNetV2-0.5xは6.3%の相対的な改善と46M乗算加算レベルで67.1%の最先端性能を達成する。
論文 参考訳(メタデータ) (2020-03-27T05:49:57Z) - Lipreading using Temporal Convolutional Networks [57.41253104365274]
現在の単語認識モデルは,残差ネットワークと双方向Gated Recurrent Unit層で構成されている。
このモデルの限界に対処し、その性能をさらに向上させる変更を提案する。
提案モデルでは,これらのデータセットにおいてそれぞれ1.2%と3.2%の絶対的な改善が得られた。
論文 参考訳(メタデータ) (2020-01-23T17:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。