論文の概要: F2SD: A dataset for end-to-end group detection algorithms
- arxiv url: http://arxiv.org/abs/2211.11001v1
- Date: Sun, 20 Nov 2022 15:42:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 20:22:53.563200
- Title: F2SD: A dataset for end-to-end group detection algorithms
- Title(参考訳): F2SD: エンドツーエンドグループ検出アルゴリズムのためのデータセット
- Authors: Giang Hoang, Tuan Nguyen Dinh, Tung Cao Hoang, Son Le Duy, Keisuke
Hihara, Yumeka Utada, Akihiko Torii, Naoki Izumi, Long Tran Quoc
- Abstract要約: 我々は、F2SD(F-formation Simulation dataset)と呼ばれる、F-formation Detectionのためのシミュレーション画像の大規模データセットを開発した。
F2SDには、GTA-5からシミュレートされた6万近い画像が含まれており、バウンディングボックスと画像の向き情報がある。
このような大規模なシミュレートされたデータセットを現実的に構築することは困難である。
- 参考スコア(独自算出の注目度): 3.3117512968892355
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The lack of large-scale datasets has been impeding the advance of deep
learning approaches to the problem of F-formation detection. Moreover, most
research works on this problem rely on input sensor signals of object location
and orientation rather than image signals. To address this, we develop a new,
large-scale dataset of simulated images for F-formation detection, called
F-formation Simulation Dataset (F2SD). F2SD contains nearly 60,000 images
simulated from GTA-5, with bounding boxes and orientation information on
images, making it useful for a wide variety of modelling approaches. It is also
closer to practical scenarios, where three-dimensional location and orientation
information are costly to record. It is challenging to construct such a
large-scale simulated dataset while keeping it realistic. Furthermore, the
available research utilizes conventional methods to detect groups. They do not
detect groups directly from the image. In this work, we propose (1) a
large-scale simulation dataset F2SD and a pipeline for F-formation simulation,
(2) a first-ever end-to-end baseline model for the task, and experiments on our
simulation dataset.
- Abstract(参考訳): 大規模データセットの欠如は、f-formation検出問題に対するディープラーニングアプローチの進歩を妨げている。
さらに、この問題に関するほとんどの研究は、画像信号よりも物体の位置と向きの入力センサー信号に頼っている。
そこで我々は,F-formation Simulation Dataset (F2SD) と呼ばれる,F-formation Detectionのためのシミュレーション画像の大規模データセットを開発した。
F2SDは、GTA-5からシミュレートされた6万近い画像を含み、バウンディングボックスと画像の向き情報を備えているため、様々なモデリングアプローチに有用である。
また、3次元の位置と方向の情報を記録するのにコストがかかる現実的なシナリオに近い。
このような大規模なシミュレーションデータセットを現実的に構築することは困難である。
さらに,従来のグループ検出手法も活用している。
画像から直接グループを検出することはない。
本研究では,(1)大規模シミュレーションデータセットf2sdとf-formationシミュレーション用パイプライン,(2)タスクのエンドツーエンドベースラインモデル,およびシミュレーションデータセットに関する実験を提案する。
関連論文リスト
- VFMM3D: Releasing the Potential of Image by Vision Foundation Model for Monocular 3D Object Detection [80.62052650370416]
モノクル3Dオブジェクト検出は、自律運転やロボティクスなど、さまざまなアプリケーションにおいて重要な役割を担っている。
本稿では,VFMM3Dを提案する。VFMM3Dは,ビジョンファウンデーションモデル(VFM)の機能を利用して,単一ビュー画像を正確にLiDARポイントクラウド表現に変換する,革新的なフレームワークである。
論文 参考訳(メタデータ) (2024-04-15T03:12:12Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph
Transformers [50.576354045312115]
直接画像からグラフへの変換は、単一のモデルにおけるオブジェクトの検出と関係予測を解決するための課題である。
画像-グラフ変換器のクロスドメインおよびクロス次元変換学習を可能にする一連の手法を提案する。
そこで我々は,2次元の衛星画像上でモデルを事前学習し,それを2次元および3次元の異なるターゲット領域に適用する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - Quantifying the LiDAR Sim-to-Real Domain Shift: A Detailed Investigation
Using Object Detectors and Analyzing Point Clouds at Target-Level [1.1999555634662635]
自律運転のためのニューラルネットワークに基づくLiDARオブジェクト検出アルゴリズムは、トレーニング、検証、テストのために大量のデータを必要とする。
ニューラルネットワークのトレーニングにシミュレーションデータを使用することで、シーン、シナリオ、分布の違いによるトレーニングデータとテストデータのドメインシフトが生じることを示す。
論文 参考訳(メタデータ) (2023-03-03T12:52:01Z) - PCGen: Point Cloud Generator for LiDAR Simulation [10.692184635629792]
既存の方法は、実点雲よりもノイズが多く、完全なデータを生成する。
我々はFPAレイキャストと代理モデルレイドロップを提案する。
最小限のトレーニングデータによって、代理モデルは異なる地理やシーンに一般化することができる。
その結果、シミュレーションデータにより訓練されたオブジェクト検出モデルは、実際のデータトレーニングモデルと同じような結果が得られることがわかった。
論文 参考訳(メタデータ) (2022-10-17T04:13:21Z) - SimuShips -- A High Resolution Simulation Dataset for Ship Detection
with Precise Annotations [0.0]
畳み込みニューラルネットワーク(CNN)に基づく最先端の障害物検出アルゴリズム
SimuShipsは、海洋環境向けに公開されているシミュレーションベースのデータセットである。
論文 参考訳(メタデータ) (2022-09-22T07:33:31Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Positional Encoding Augmented GAN for the Assessment of Wind Flow for
Pedestrian Comfort in Urban Areas [0.41998444721319217]
本研究は,CFDを用いた3次元フローフィールドの計算から,建物のフットプリント上の2次元画像から画像への変換に基づく問題まで,歩行者の高さレベルでのフローフィールドの予測に至るまでの課題を言い換える。
本稿では,画像から画像への変換タスクの最先端を表現したPix2PixやCycleGANなど,GAN(Generative Adversarial Network)の利用について検討する。
論文 参考訳(メタデータ) (2021-12-15T19:37:11Z) - PREPRINT: Comparison of deep learning and hand crafted features for
mining simulation data [7.214140640112874]
本稿では,高次元データセットから有意な結果を自動抽出する作業について述べる。
このようなデータを処理することができる深層学習手法を提案し、シミュレーションデータに関する関連するタスクを解決するように訓練することができる。
16,000フローフィールドを含む翼まわりの流れ場の2次元シミュレーションの大規模なデータセットをコンパイルし,比較を行った。
論文 参考訳(メタデータ) (2021-03-11T09:28:00Z) - FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation [54.666329929930455]
単一RGBD画像からの6次元ポーズ推定のための双方向融合ネットワークであるFFB6Dを提案する。
表現学習と出力表現選択のための表現情報と幾何学情報を組み合わせることを学ぶ。
提案手法は,いくつかのベンチマークにおいて,最先端の手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-03-03T08:07:29Z) - Fed-Sim: Federated Simulation for Medical Imaging [131.56325440976207]
本稿では、2つの学習可能なニューラルモジュールからなる物理駆動型生成手法を提案する。
データ合成フレームワークは、複数のデータセットの下流セグメンテーション性能を改善する。
論文 参考訳(メタデータ) (2020-09-01T19:17:46Z) - SimAug: Learning Robust Representations from Simulation for Trajectory
Prediction [78.91518036949918]
本研究では,シミュレーション学習データの拡張により,ロバスト表現を学習する新しい手法を提案する。
我々は,SimAugが実世界の3つのベンチマークで有望な結果を得ることを示す。
論文 参考訳(メタデータ) (2020-04-04T21:22:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。