論文の概要: BadmintonGRF: A Multimodal Dataset and Benchmark for Markerless Ground Reaction Force Estimation in Badminton
- arxiv url: http://arxiv.org/abs/2605.01876v1
- Date: Sun, 03 May 2026 13:39:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.977263
- Title: BadmintonGRF: A Multimodal Dataset and Benchmark for Markerless Ground Reaction Force Estimation in Badminton
- Title(参考訳): Badminton GRF:Badmintonにおけるマルチモーダルデータセットとマーカーレス地中反応力推定のためのベンチマーク
- Authors: Kuoye Niu, Jianwei Li, Shengze Cai, Yong Ma, Mengyao Jia, Lishun Shen, Zhenheng Zhang, Yuxin Peng, Xian Song,
- Abstract要約: BadmintonGRFは、120 FPSで8つの同期RGBビュー、Kistler力板4つ、ハードウェアジャンロックなしでのViconモーションキャプチャ(C3D)を記録している。
アライメントは、人間認証イベント、自動品質保証、カメラごとのタイムオフセットと不確実性メタデータを組み合わせる。
Tier 1 は CC BY-NC 4.0 でポーズ、時間順の GRF 、メタデータ、分割を配布し、RGB や C3D を使わずに主要なベンチマークを可能にする。
Tier 2は、外見や完全なキネマティクスを必要とする研究のために、制御されたアクセス下で生のRGBとC3Dを提供する。
- 参考スコア(独自算出の注目度): 41.68908235017758
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal resources for non-periodic court sports with laboratory-grade sensing remain scarce: few publicly pair instrumented ground reaction force (GRF) with high-frame-rate multi-view video, limiting markerless load estimation in realistic training settings. BadmintonGRF records eight synchronized RGB views at ~120 FPS, four Kistler force plates, and Vicon motion capture (C3D) without hardware genlock across modalities; alignment combines human-verified events, automated quality assurance, and per-camera time offsets with uncertainty metadata. Tier 1 distributes pose, time-aligned GRF, metadata, and splits under CC BY-NC 4.0, enabling the primary benchmark without raw RGB or C3D; we report a Tier 1 task that maps 2D pose to GRF. Tier 2 provides raw RGB and C3D under controlled access for studies that require appearance or full kinematics. The public release contains 17,425 impact-segment archives in the 10-subject benchmark tree (156 instrumented trials; raw multi-view RGB alone exceeds 1 TB); benchmark loader gates retain 12,867 view-specific instances and 1,732 unique impacts after multi-view deduplication. We are not aware of prior public badminton corpora that combine this sensing layout with audited video--GRF alignment for impact-centric GRF estimation. We distribute preprocessing code, leave-one-subject-out splits, ten reference baselines, and optional late fusion (one deterministic test-time pass per instance; no test-time augmentation), with a within-trial diagnostic in the supplementary material.
- Abstract(参考訳): 実験室グレードのセンシングを備えた非周期的なコートスポーツのためのマルチモーダルリソースは、高フレームレートのマルチビュービデオと、現実的なトレーニング環境でのマーカーレス負荷推定を制限する、公開対の地上反応力(GRF)がほとんどない。
BadmintonGRFは、120 FPSの8つの同期RGBビュー、Kistlerの4つの力板、ハードウェアジャンロックのないViconモーションキャプチャ(C3D)を記録している。
Tier 1 は CC BY-NC 4.0 でポーズ,時系列 GRF ,メタデータ,分割を分配し,RGB や C3D を使わずに一次ベンチマークを行えるようにした。
Tier 2は、外見や完全なキネマティクスを必要とする研究のために、制御されたアクセス下で生のRGBとC3Dを提供する。
公開リリースには、10サブオブジェクトのベンチマークツリーに17,425のインパクトセグメンテーションアーカイブが含まれている(計156回の試験、生のマルチビューRGBは1TBを超える)。
我々は、このセンシングレイアウトと監査されたビデオ-GRFアライメントを組み合わせて、衝撃中心のGRF推定を行う、以前のパブリックバドミントンコーパスを知らない。
予備処理コード, 1 件の分割, 10 件の基準ベースライン, オプションの遅延融合(インスタンス毎に1 件の決定論的テストタイムパス, テストタイム拡張なし) を補充材料に内科的診断と共に配布する。
関連論文リスト
- DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing [67.77471070868852]
DeepGen 1.0は、画像生成と編集のための軽量な5B統一モデルである。
わずか5000万のサンプルでトレーニングされており、WISEでは80BのHunyuan Imageを28%、UniREditBenchでは27BのQwen-Image-Editを37%上回っている。
トレーニングコード、ウェイト、データセットをオープンソース化することで、統合マルチモーダルリサーチを民主化する、効率的で高性能な代替手段を提供します。
論文 参考訳(メタデータ) (2026-02-12T17:44:24Z) - Li-ViP3D++: Query-Gated Deformable Camera-LiDAR Fusion for End-to-End Perception and Trajectory Prediction [0.0]
Li-ViP3D++はクエリベースである。
エンドツーエンドのアテンションフレームワーク。
生のセンサーデータからの知覚と軌道予測。
論文 参考訳(メタデータ) (2026-01-28T15:53:32Z) - SDG-Track: A Heterogeneous Observer-Follower Framework for High-Resolution UAV Tracking on Embedded Platforms [11.029096488950414]
エッジデバイス上での小型無人航空機(UAV)のリアルタイム追跡は、根本的な解像度と速度の衝突に直面している。
本稿では,この競合を解消するためにObserver-Followerアーキテクチャを採用するスパース検出ガイドトラッカーを提案する。
地上対空追跡実験では、SDG-Trackはフレーム毎の検出精度の97.2%を維持しながら35.1 FPSシステムスループットを達成した。
論文 参考訳(メタデータ) (2025-12-04T15:11:43Z) - SwiTrack: Tri-State Switch for Cross-Modal Object Tracking [74.15663758681849]
クロスモーダルオブジェクトトラッキング(CMOT)は、ビデオストリームが異なるモード間で切り替える間、ターゲットの一貫性を維持する新しいタスクである。
SwiTrackは3つの特別なストリームを配置することでCMOTを再定義する新しいステートスイッチングフレームワークである。
論文 参考訳(メタデータ) (2025-11-20T10:52:54Z) - ViDSOD-100: A New Dataset and a Baseline Model for RGB-D Video Salient Object Detection [51.16181295385818]
まず、注釈付きRGB-D video SODOD(DSOD-100)データセットを収集し、合計9,362フレーム内に100の動画を含む。
各ビデオのフレームはすべて、高品質なサリエンシアノテーションに手動で注釈付けされる。
本稿では,RGB-Dサリアンオブジェクト検出のための新しいベースラインモデル,attentive triple-fusion network (ATF-Net)を提案する。
論文 参考訳(メタデータ) (2024-06-18T12:09:43Z) - CRSOT: Cross-Resolution Object Tracking using Unaligned Frame and Event
Cameras [43.699819213559515]
既存のRGB-DVSトラッキング用のデータセットは、DVS346カメラで収集される。
我々は、特別に構築されたデータ取得システムを用いて収集された、最初の不整合フレームイベントデータセットCRSOTを構築した。
ゆるやかなRGBイベントデータを用いても、ロバストなトラッキングを実現することのできる、新しい非整列オブジェクト追跡フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-05T14:20:22Z) - Visible-Thermal UAV Tracking: A Large-Scale Benchmark and New Baseline [80.13652104204691]
本稿では,可視熱UAV追跡(VTUAV)のための高多様性の大規模ベンチマークを構築する。
本稿では, フレームレベルの属性を, チャレンジ固有のトラッカーの可能性を利用するための粗粒度属性アノテーションを提案する。
さらに,様々なレベルでRGB-Tデータを融合するHMFT(Hierarchical Multi-modal Fusion Tracker)という新しいRGB-Tベースラインを設計する。
論文 参考訳(メタデータ) (2022-04-08T15:22:33Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。