Fugu-MT 論文翻訳(概要): HOPE: Hierarchical Spatial-temporal Network for Occupancy Flow Prediction

論文の概要: HOPE: Hierarchical Spatial-temporal Network for Occupancy Flow Prediction

arxiv url: http://arxiv.org/abs/2206.10118v1
Date: Tue, 21 Jun 2022 05:25:58 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-22 16:53:42.951340
Title: HOPE: Hierarchical Spatial-temporal Network for Occupancy Flow Prediction
Title（参考訳）: HOPE:階層型時空間ネットワークによる活動フロー予測
Authors: Yihan Hu, Wenxin Shao, Bo Jiang, Jiajie Chen, Siqi Chai, Zhening Yang, Jingyu Qian, Helong Zhou, Qiang Liu
Abstract要約: CVPR 2022のオープンチャレンジにおけるOccupancy and Flow Predictionチャレンジに対する私たちのソリューションを紹介します。我々は,空間時間エンコーダ,潜伏変数に富んだマルチスケールアグリゲータ,階層型3Dデコーダを備えた新しい階層型空間時空間ネットワークを開発した。本手法は,フローグラウンドのAUCを0.8389で達成し,他のすべてのチームよりも優れた性能を発揮する。
参考スコア（独自算出の注目度）: 10.02342218798102
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this report, we introduce our solution to the Occupancy and Flow Prediction challenge in the Waymo Open Dataset Challenges at CVPR 2022, which ranks 1st on the leaderboard. We have developed a novel hierarchical spatial-temporal network featured with spatial-temporal encoders, a multi-scale aggregator enriched with latent variables, and a recursive hierarchical 3D decoder. We use multiple losses including focal loss and modified flow trace loss to efficiently guide the training process. Our method achieves a Flow-Grounded Occupancy AUC of 0.8389 and outperforms all the other teams on the leaderboard.
Abstract（参考訳）: 本報告では, cvpr 2022 における waymo open dataset challenge における占有とフロー予測の課題に対するソリューションについて紹介する。本研究では,空間時間エンコーダ,潜伏変数に富んだマルチスケールアグリゲータ,再帰的階層型3Dデコーダを備えた新しい階層型空間時間ネットワークを開発した。トレーニングプロセスの効率的な指導には,焦点損失やフロートレース損失の修正など,複数の損失を用いる。本手法は0.8389のフローグラウンド占有率aucを達成し,他のすべてのチームよりも優れる。

関連論文リスト

FLARES: Fast and Accurate LiDAR Multi-Range Semantic Segmentation [52.89847760590189]
3Dシーンの理解は、自動運転における重要な課題である。近年の手法では、レンジビュー表現を利用して処理効率を向上している。範囲ビューに基づくLiDARセマンティックセマンティックセグメンテーションのためのワークフローを再設計する。
論文参考訳（メタデータ） (2025-02-13T12:39:26Z)
ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文参考訳（メタデータ） (2024-11-12T11:32:56Z)
FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45～9.39倍の高速化を実現可能であることを示す。
論文参考訳（メタデータ） (2024-10-16T16:13:19Z)
Neural Eulerian Scene Flow Fields [59.57980592109722]
EulerFlowは、複数のドメインをチューニングすることなく、最初から動作します。長期間の地平線上での推定ODEを解くことで、創発的な3次元点追跡挙動を示す。 2024年のArgoverse 2 Scene Flow Challengeでは、すべての先行技術より優れています。
論文参考訳（メタデータ） (2024-10-02T20:56:45Z)
A Lightweight Spatiotemporal Network for Online Eye Tracking with Event Camera [0.8576354642891824]
イベントベースのデータは、効率性と低レイテンシが重要であるエッジコンピューティング環境で一般的に発生する。このようなデータと対話し,その時間的豊かさを活用するために,因果畳み込みネットワークを提案する。我々は,AIS 2024イベントベースのアイトラッキング課題に適用し,Kaggleプライベートテストセットで0.9916 p10の精度を達成した。
論文参考訳（メタデータ） (2024-04-13T00:13:20Z)
Active search and coverage using point-cloud reinforcement learning [50.741409008225766]
本稿では,目的探索とカバレッジのためのエンドツーエンドの深層強化学習ソリューションを提案する。 RLの深い階層的特徴学習は有効であり、FPS(Fastthest Point sample)を用いることで点数を削減できることを示す。また、ポイントクラウドに対するマルチヘッドの注意がエージェントの学習を高速化する上で有効であるが、同じ結果に収束することを示す。
論文参考訳（メタデータ） (2023-12-18T18:16:30Z)
Spatio-Temporal Contrastive Self-Supervised Learning for POI-level Crowd Flow Inference [23.8192952068949]
S-temporal data(CSST)のための新しいコントラスト型自己学習フレームワークを提案する。提案手法は,POI(Points of Interest)とその距離に基づく空間隣接グラフの構築から始める。我々は、類似した事例から対象部分グラフの表現を予測するために、スワップした予測手法を採用する。実世界の2つのデータセットで実施した実験では、広範囲のノイズデータに基づいて事前トレーニングされたCSSTが、ゼロからトレーニングされたモデルより一貫して優れていることを示した。
論文参考訳（メタデータ） (2023-09-06T02:51:24Z)
Long-Short Temporal Co-Teaching for Weakly Supervised Video Anomaly Detection [14.721615285883423]
弱教師付き異常検出(WS-VAD)はビデオレベルのアノテーションだけでVADモデルを学習することを目的とした課題である。提案手法は,異なる期間の異常や微妙な異常に対処できる。
論文参考訳（メタデータ） (2023-03-31T13:28:06Z)
Pyramid Correlation based Deep Hough Voting for Visual Object Tracking [16.080776515556686]
我々は、ピラミド相関に基づくDeep Hough Voting(PCDHV用ショート)という、投票に基づく分類専用追跡アルゴリズムを提案する。具体的には、埋め込み特徴に微細な局所構造と大域的空間的文脈を持たせるために、ピラミド相関モジュールを革新的に構築する。精巧に設計されたDeep Hough Votingモジュールがさらに引き継ぎ、ピクセルの長距離依存を隅々まで知覚する。
論文参考訳（メタデータ） (2021-10-15T10:37:00Z)
Hierarchical Attention Learning of Scene Flow in 3D Point Clouds [28.59260783047209]
本稿では,2つの連続する3次元点雲からのシーンフロー推定の問題について検討する。隣接フレームにおける点特徴の相関を学習するために, 二重注意を有する新しい階層型ニューラルネットワークを提案する。実験の結果,提案したネットワークは3次元シーンフロー推定の最先端性能より優れていた。
論文参考訳（メタデータ） (2020-10-12T14:56:08Z)
2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文参考訳（メタデータ） (2020-08-10T09:50:28Z)
Learning to Hash with Graph Neural Networks for Recommender Systems [103.82479899868191]
グラフ表現学習は、大規模に高品質な候補探索をサポートすることに多くの注目を集めている。ユーザ・イテム相互作用ネットワークにおけるオブジェクトの埋め込みベクトルの学習の有効性にもかかわらず、連続的な埋め込み空間におけるユーザの好みを推測する計算コストは膨大である。連続的かつ離散的なコードとを協調的に学習するための,単純かつ効果的な離散表現学習フレームワークを提案する。
論文参考訳（メタデータ） (2020-03-04T06:59:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。