論文の概要: Joint Forecasting of Features and Feature Motion for Dense Semantic
Future Prediction
- arxiv url: http://arxiv.org/abs/2101.10777v1
- Date: Tue, 26 Jan 2021 13:30:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-13 19:52:20.857016
- Title: Joint Forecasting of Features and Feature Motion for Dense Semantic
Future Prediction
- Title(参考訳): 密接な意味的未来予測のための特徴量と特徴運動の合同予測
- Authors: Josip \v{S}ari\'c and Sacha Vra\v{z}i\'c and Sini\v{s}a \v{S}egvi\'c
- Abstract要約: アプローチは、F2M(Feature-to-motion)とF2F(Feature-to-Feature)の2つのモジュールで構成される。
複合F2MFアプローチは、タスクに依存しない方法でノベルティの効果から運動の効果を分離する。
セマンティックセグメンテーション、インスタンスレベルのセグメンテーション、パンオプティカルセグメンテーションの3つの高密度予測タスクの実験を行います。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a novel dense semantic forecasting approach which is applicable to
a variety of architectures and tasks. The approach consists of two modules.
Feature-to-motion (F2M) module forecasts a dense deformation field which warps
past features into their future positions. Feature-to-feature (F2F) module
regresses the future features directly and is therefore able to account for
emergent scenery. The compound F2MF approach decouples effects of motion from
the effects of novelty in a task-agnostic manner. We aim to apply F2MF
forecasting to the most subsampled and the most abstract representation of a
desired single-frame model. Our implementations take advantage of deformable
convolutions and pairwise correlation coefficients across neighbouring time
instants. We perform experiments on three dense prediction tasks: semantic
segmentation, instance-level segmentation, and panoptic segmentation. The
results reveal state-of-the-art forecasting accuracy across all three
modalities on the Cityscapes dataset.
- Abstract(参考訳): 本稿では,様々なアーキテクチャやタスクに適用可能な,新しい意味予測手法を提案する。
アプローチは2つのモジュールで構成される。
特徴と動き(F2M)モジュールは、過去の特徴を将来の位置に警告する高密度変形場を予測します。
F2F(Feature-to-Feature)モジュールは、将来の機能を直接回帰するため、創発的なシーンを説明できる。
複合F2MFアプローチは、タスクに依存しない方法でノベルティの効果から運動の効果を分離する。
我々は、F2MF予測を最もサブサンプル化され、望まれる単一フレームモデルの最も抽象的な表現に適用することを目指している。
我々の実装では、変形可能な畳み込みと対関係係数を隣り合った時間インスタント間で活用する。
セマンティックセグメンテーション、インスタンスレベルのセグメンテーション、パンオプティカルセグメンテーションの3つの高密度予測タスクの実験を行います。
結果は、Cityscapesデータセット上の3つのモードすべてにわたる最先端の予測精度を明らかにした。
関連論文リスト
- Joint Forecasting of Panoptic Segmentations with Difference Attention [72.03470153917189]
シーン内の全てのオブジェクトを共同で予測する新しいパノプティックセグメンテーション予測モデルについて検討する。
提案したモデルをCityscapesとAIODriveデータセット上で評価する。
論文 参考訳(メタデータ) (2022-04-14T17:59:32Z) - Functional Mixtures-of-Experts [0.6882042556551609]
本稿では,新しい機能的ME(FME)モデルについて述べる。
我々は、ラッソ様の正則化最大値パラメータ推定のための専用予測-最大化アルゴリズムを開発する。
提案するFMEモデルとEM-Lassoアルゴリズムは、シミュレーションシナリオおよび2つの実データ集合への応用について研究する。
論文 参考訳(メタデータ) (2022-02-04T17:32:28Z) - MUSE-VAE: Multi-Scale VAE for Environment-Aware Long Term Trajectory
Prediction [28.438787700968703]
条件付きMUSEは、現在の最先端技術と比較して、多様かつ同時に正確な予測を提供する。
我々は、新しい合成データセットであるPFSDと同様に、nuScenesとSDDベンチマークに関する包括的な実験を通してこれらのアサーションを実証する。
論文 参考訳(メタデータ) (2022-01-18T18:40:03Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Collaborative Uncertainty in Multi-Agent Trajectory Forecasting [35.013892666040846]
本稿では,対話モジュールから生じる不確実性をモデル化する新しい概念であるコラボレーティブ不確実性(CU)を提案する。
我々は、将来の軌跡とそれに対応する不確実性を学ぶための予測モデルを構築するための一般的なCUベースのフレームワークを構築した。
いずれの場合も、2つの合成データセットと2つの大規模軌跡予測ベンチマークについて広範な実験を行う。
論文 参考訳(メタデータ) (2021-10-26T18:27:22Z) - EAN: Event Adaptive Network for Enhanced Action Recognition [66.81780707955852]
本稿では,映像コンテンツの動的性質を調査するための統合された行動認識フレームワークを提案する。
まず、局所的な手がかりを抽出する際に、動的スケールの時空間カーネルを生成し、多様な事象を適応的に適合させる。
第2に、これらのキューを正確にグローバルなビデオ表現に集約するために、トランスフォーマーによって選択されたいくつかの前景オブジェクト間のインタラクションのみをマイニングすることを提案する。
論文 参考訳(メタデータ) (2021-07-22T15:57:18Z) - Similarity-Aware Fusion Network for 3D Semantic Segmentation [87.51314162700315]
本研究では,3次元セマンティックセグメンテーションのための2次元画像と3次元点雲を適応的に融合する類似性認識融合ネットワーク(SAFNet)を提案する。
我々は、入力とバックプロジェクションされた(2Dピクセルから)点雲の間の幾何学的および文脈的類似性を初めて学習する、後期融合戦略を採用している。
SAFNetは、様々なデータ完全性にまたがって、既存の最先端の核融合ベースのアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2021-07-04T09:28:18Z) - Recursive Contour Saliency Blending Network for Accurate Salient Object
Detection [0.0]
本研究では,有能な物体検出におけるエッジ品質向上のためのネットワークを設計した。
輪郭と塩分を交換するための輪郭・塩分混合モジュールを提案した。
我々のモデルは軽量で高速で、パラメータはわずか279万、リアルタイム推論は31FPSである。
論文 参考訳(メタデータ) (2021-05-28T14:19:54Z) - Panoptic Segmentation Forecasting [71.75275164959953]
我々の目標は、最近の観測結果から近い将来の予測を行うことです。
この予測能力、すなわち予測能力は、自律的なエージェントの成功に不可欠なものだと考えています。
そこで我々は,2成分モデルを構築した。一方のコンポーネントは,オードメトリーを予測して背景物の力学を学習し,他方のコンポーネントは検出された物の力学を予測する。
論文 参考訳(メタデータ) (2021-04-08T17:59:16Z) - Interactive Fusion of Multi-level Features for Compositional Activity
Recognition [100.75045558068874]
インタラクティブな融合によってこの目標を達成する新しいフレームワークを提案する。
本フレームワークは,位置から出現までの特徴抽出,意味的特徴の相互作用,意味から位置への予測という3つのステップで実装する。
我々は,2つの行動認識データセット,SomethingとCharadesに対するアプローチを評価した。
論文 参考訳(メタデータ) (2020-12-10T14:17:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。