論文の概要: Computer Vision for Objects used in Group Work: Challenges and Opportunities
- arxiv url: http://arxiv.org/abs/2507.00224v1
- Date: Mon, 30 Jun 2025 19:51:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:58.733844
- Title: Computer Vision for Objects used in Group Work: Challenges and Opportunities
- Title(参考訳): グループワークにおける物体のコンピュータビジョン : 課題と機会
- Authors: Changsoo Jung, Sheikh Mannan, Jack Fitzgerald, Nathaniel Blanchard,
- Abstract要約: FiboSBは、手持ちの小さなキューブと体重計を備えた対話的なタスクを3人のグループが解決する、新しくて挑戦的な6Dポーズビデオデータセットである。
このセットアップは、すべての参加者を捉えるためにグループを遠くからホリスティックに記録するため、6Dのポーズに固有の課題を提起する。
我々は、FiboSB上での4つの最先端6Dポーズ推定手法を評価し、協調グループ作業における現在のアルゴリズムの限界を明らかにする。
- 参考スコア(独自算出の注目度): 3.971437232792383
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Interactive and spatially aware technologies are transforming educational frameworks, particularly in K-12 settings where hands-on exploration fosters deeper conceptual understanding. However, during collaborative tasks, existing systems often lack the ability to accurately capture real-world interactions between students and physical objects. This issue could be addressed with automatic 6D pose estimation, i.e., estimation of an object's position and orientation in 3D space from RGB images or videos. For collaborative groups that interact with physical objects, 6D pose estimates allow AI systems to relate objects and entities. As part of this work, we introduce FiboSB, a novel and challenging 6D pose video dataset featuring groups of three participants solving an interactive task featuring small hand-held cubes and a weight scale. This setup poses unique challenges for 6D pose because groups are holistically recorded from a distance in order to capture all participants -- this, coupled with the small size of the cubes, makes 6D pose estimation inherently non-trivial. We evaluated four state-of-the-art 6D pose estimation methods on FiboSB, exposing the limitations of current algorithms on collaborative group work. An error analysis of these methods reveals that the 6D pose methods' object detection modules fail. We address this by fine-tuning YOLO11-x for FiboSB, achieving an overall mAP_50 of 0.898. The dataset, benchmark results, and analysis of YOLO11-x errors presented here lay the groundwork for leveraging the estimation of 6D poses in difficult collaborative contexts.
- Abstract(参考訳): 対話的かつ空間的に認識される技術は、特にK-12環境では、深い概念的理解を促進する。
しかし、協調作業の間、既存のシステムは学生と物理的オブジェクトの間の現実世界の相互作用を正確に捉える能力に欠けることが多い。
この問題は、RGB画像やビデオからオブジェクトの位置と向きを推定する6Dポーズの自動推定で対処できる。
物理的オブジェクトと相互作用する協調グループでは、6Dポーズ推定により、AIシステムはオブジェクトとエンティティを関連付けることができる。
本研究の一環として,手持ちの小さなキューブと体重計を備えた対話型タスクを3人の参加者のグループが解決する,斬新で挑戦的な6DポーズビデオデータセットであるFiboSBを紹介した。
このセットアップは、すべての参加者を捉えるために、グループを遠くから水平に記録しているため、6Dのポーズ推定が本質的に非自明なため、6Dのポーズ推定に固有の課題を提起する。
本研究では、FiboSB上での4つの最先端6Dポーズ推定手法を評価し、協調グループ作業における現在のアルゴリズムの限界を明らかにした。
これらの手法の誤差解析により、6Dポーズ手法のオブジェクト検出モジュールがフェールすることを明らかにする。
我々は、FiboSBのYOLO11-xを微調整し、0.898の総mAP_50を達成することでこの問題に対処する。
ここで提示したデータセット、ベンチマーク結果、YOLO11-xエラーの解析は、難しい共同作業環境での6Dポーズの推定を活用するための基礎となる。
関連論文リスト
- Any6D: Model-free 6D Pose Estimation of Novel Objects [76.30057578269668]
我々は,6次元オブジェクトのポーズ推定のためのモデルフリーフレームワークであるAny6Dを紹介する。
新たなシーンでは、未知の物体の6Dポーズと大きさを推定するために、1枚のRGB-Dアンカー画像しか必要としない。
提案手法を5つの挑戦的データセットで評価する。
論文 参考訳(メタデータ) (2025-03-24T13:46:21Z) - PickScan: Object discovery and reconstruction from handheld interactions [99.99566882133179]
シーンの3次元表現を再構成する対話誘導型クラス依存型手法を開発した。
我々の主な貢献は、操作対象のインタラクションを検出し、操作対象のマスクを抽出する新しいアプローチである。
相互作用ベースとクラス非依存のベースラインであるCo-Fusionと比較すると、これはシャムファー距離の73%の減少に相当する。
論文 参考訳(メタデータ) (2024-11-17T23:09:08Z) - Review on 6D Object Pose Estimation with the focus on Indoor Scene
Understanding [0.0]
6Dオブジェクトのポーズ推定問題はコンピュータビジョンとロボティクスの分野で広く研究されている。
議論の一環として、我々は6Dオブジェクトのポーズ推定が3Dシーンの理解にどのように役立つかに焦点を当てる。
論文 参考訳(メタデータ) (2022-12-04T20:45:46Z) - Imitrob: Imitation Learning Dataset for Training and Evaluating 6D
Object Pose Estimators [20.611000416051546]
本稿では,標準RGBカメラで捉えたタスクデモにおける手持ちツールの6次元ポーズ推定のためのトレーニングと評価のためのデータセットを提案する。
このデータセットには、9つの異なるツールと12の操作タスクのイメージシーケンスが含まれており、2つのカメラ視点、4人の被写体、そして左右手である。
論文 参考訳(メタデータ) (2022-09-16T14:43:46Z) - Unseen Object 6D Pose Estimation: A Benchmark and Baselines [62.8809734237213]
本稿では,新しい物体の6次元ポーズ推定をアルゴリズムで行えるようにするための新しいタスクを提案する。
実画像と合成画像の両方でデータセットを収集し、テストセットで最大48個の未確認オブジェクトを収集する。
エンド・ツー・エンドの3D対応ネットワークをトレーニングすることにより、未確認物体と部分ビューRGBD画像との対応点を高精度かつ効率的に見つけることができる。
論文 参考訳(メタデータ) (2022-06-23T16:29:53Z) - FS6D: Few-Shot 6D Pose Estimation of Novel Objects [116.34922994123973]
6Dオブジェクトポーズ推定ネットワークは、多数のオブジェクトインスタンスにスケールする能力に制限がある。
本研究では,未知の物体の6次元ポーズを,余分な訓練を伴わずにいくつかの支援ビューで推定する。
論文 参考訳(メタデータ) (2022-03-28T10:31:29Z) - VIPose: Real-time Visual-Inertial 6D Object Pose Tracking [3.44942675405441]
本稿では,オブジェクトのポーズ追跡問題にリアルタイムに対処するために,VIPoseと呼ばれる新しいディープニューラルネットワーク(DNN)を提案する。
重要な貢献は、オブジェクトの相対的な6Dポーズを予測するために視覚的および慣性的特徴を融合する新しいDNNアーキテクチャの設計である。
このアプローチでは、最先端技術に匹敵する精度性能を示すが、リアルタイムであることにはさらなるメリットがある。
論文 参考訳(メタデータ) (2021-07-27T06:10:23Z) - CPS++: Improving Class-level 6D Pose and Shape Estimation From Monocular
Images With Self-Supervised Learning [74.53664270194643]
現代のモノクロ6Dポーズ推定手法は、少数のオブジェクトインスタンスにしか対応できない。
そこで本研究では,計量形状検索と組み合わせて,クラスレベルのモノクル6次元ポーズ推定手法を提案する。
1枚のRGB画像から正確な6Dポーズとメートル法形状を抽出できることを実験的に実証した。
論文 参考訳(メタデータ) (2020-03-12T15:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。