論文の概要: REFORM: Recognizing F-formations for Social Robots
- arxiv url: http://arxiv.org/abs/2008.07668v1
- Date: Mon, 17 Aug 2020 23:32:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 04:26:22.368973
- Title: REFORM: Recognizing F-formations for Social Robots
- Title(参考訳): リフォーム:社会ロボットのF-formation認識
- Authors: Hooman Hedayati, Annika Muehlbradt, Daniel J. Szafir, Sean Andrist
- Abstract要約: 本稿では,人やエージェントの位置や方向を検知するデータ駆動型手法であるREFORMを紹介する。
ReFORMは最先端のF-formation検出アルゴリズムよりも精度が向上した。
- 参考スコア(独自算出の注目度): 4.833815605196964
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognizing and understanding conversational groups, or F-formations, is a
critical task for situated agents designed to interact with humans.
F-formations contain complex structures and dynamics, yet are used intuitively
by people in everyday face-to-face conversations. Prior research exploring ways
of identifying F-formations has largely relied on heuristic algorithms that may
not capture the rich dynamic behaviors employed by humans. We introduce REFORM
(REcognize F-FORmations with Machine learning), a data-driven approach for
detecting F-formations given human and agent positions and orientations. REFORM
decomposes the scene into all possible pairs and then reconstructs F-formations
with a voting-based scheme. We evaluated our approach across three datasets:
the SALSA dataset, a newly collected human-only dataset, and a new set of acted
human-robot scenarios, and found that REFORM yielded improved accuracy over a
state-of-the-art F-formation detection algorithm. We also introduce symmetry
and tightness as quantitative measures to characterize F-formations.
Supplementary video: https://youtu.be/Fp7ETdkKvdA , Dataset available at:
github.com/cu-ironlab/Babble
- Abstract(参考訳): 会話型グループ(f-formations)の認識と理解は、人間と相互作用するように設計されたエージェントにとって重要なタスクである。
F-formationsは複雑な構造やダイナミクスを含むが、日々の対面会話で直感的に使用される。
F型鑑定の方法を探る以前の研究は、人間によって使われるリッチな動的な振る舞いを捉えないヒューリスティックなアルゴリズムに大きく依存していた。
本稿では、人間とエージェントの位置と向きをデータ駆動で検出するREFORM(Recognite F-Formations with Machine Learning)を提案する。
改革はシーンを全ての可能なペアに分解し、投票ベースのスキームでf-フォーメーションを再構築する。
我々は、SALSAデータセット、新たに収集された人間のみのデータセット、新しい行動可能な人間ロボットシナリオの3つのデータセットにまたがってアプローチを評価し、ReFORMが最先端のFフォーム検出アルゴリズムよりも精度が向上していることを発見した。
また、F型を特徴づける定量的尺度として対称性と強靭性を導入する。
補足ビデオ:https://youtu.be/Fp7ETdkKvdA , Dataset available at: github.com/cu-ironlab/Babble
関連論文リスト
- Belief Revision: The Adaptability of Large Language Models Reasoning [63.0281286287648]
本稿では,LMの信念修正能力をテストするための新しいデータセットであるBelief-Rを紹介する。
このタスクは、人間が事前の推論を抑える方法にインスパイアされ、新しく提案されたデルタ推論フレームワーク内のLMを評価する。
様々なプロンプト戦略にまたがる$sim$30 LMを評価した結果,LMは一般的に,新たな情報に反応して信念を適切に修正するのに苦慮していることがわかった。
論文 参考訳(メタデータ) (2024-06-28T09:09:36Z) - PolyFit: A Peg-in-hole Assembly Framework for Unseen Polygon Shapes via
Sim-to-real Adaptation [4.875369637162596]
PolyFitは5-DoFペグインホールアセンブリ用に設計された教師あり学習フレームワークである。
F/Tデータを正確な外因性ポーズ推定に利用し、ペグのポーズを調整して不一致を是正する。
穴内成功率は97.3%と96.3%で、シミュレーションでは目に見えない形状である。
論文 参考訳(メタデータ) (2023-12-05T06:28:33Z) - Generalized Face Forgery Detection via Adaptive Learning for Pre-trained Vision Transformer [54.32283739486781]
適応学習パラダイムの下で,textbfForgery-aware textbfAdaptive textbfVision textbfTransformer(FA-ViT)を提案する。
FA-ViTは、クロスデータセット評価において、Celeb-DFおよびDFDCデータセット上で93.83%と78.32%のAUCスコアを達成する。
論文 参考訳(メタデータ) (2023-09-20T06:51:11Z) - A Comprehensive Survey on Pretrained Foundation Models: A History from
BERT to ChatGPT [0.0]
事前訓練された基礎モデル(PFM)は、異なるデータモダリティを持つ様々な下流タスクの基礎と見なされている。
この研究は、テキスト、画像、グラフ、その他のデータモダリティにおける最近の研究の進歩、課題、および PFM の機会を包括的にレビューする。
論文 参考訳(メタデータ) (2023-02-18T20:51:09Z) - F2SD: A dataset for end-to-end group detection algorithms [3.3117512968892355]
我々は、F2SD(F-formation Simulation dataset)と呼ばれる、F-formation Detectionのためのシミュレーション画像の大規模データセットを開発した。
F2SDには、GTA-5からシミュレートされた6万近い画像が含まれており、バウンディングボックスと画像の向き情報がある。
このような大規模なシミュレートされたデータセットを現実的に構築することは困難である。
論文 参考訳(メタデータ) (2022-11-20T15:42:22Z) - Predicting Loose-Fitting Garment Deformations Using Bone-Driven Motion
Networks [63.596602299263935]
本稿では,骨駆動型モーションネットワークを用いて,ゆるやかな衣服メッシュの変形を対話的に予測する学習アルゴリズムを提案する。
提案手法は,メッシュ変形の予測精度を約20%,ハウスドルフ距離とSTEDで約10%向上させる。
論文 参考訳(メタデータ) (2022-05-03T07:54:39Z) - Rethinking Architecture Design for Tackling Data Heterogeneity in
Federated Learning [53.73083199055093]
注意に基づくアーキテクチャ(例えばTransformers)は、分散シフトに対してかなり堅牢であることを示す。
我々の実験は、畳み込みネットワークをトランスフォーマーに置き換えることによって、過去のデバイスを壊滅的に忘れることを大幅に減らせることを示した。
論文 参考訳(メタデータ) (2021-06-10T21:04:18Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z) - Let me join you! Real-time F-formation recognition by a socially aware
robot [2.8101673772585745]
本稿では,エゴビジョンカメラの連続画像ストリームからリアルタイムに社会集団を検出する新しいアーキテクチャを提案する。
会合や討論などの社会集会におけるF-formationを検出し,社会集団への参加を望む場合,ロボットのアプローチ角を予測する。
また,グループの一員ではない人など,アウトリーチも検知する。
論文 参考訳(メタデータ) (2020-08-23T17:46:08Z) - Joint Inference of States, Robot Knowledge, and Human (False-)Beliefs [90.20235972293801]
本稿では,人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)・人間(時間的)の認知能力が,ロボットとの相互作用にどのように影響するかを理解するために,対象状態,ロボット知識,人間(時間的)の認知能力の表現にグラフィカルモデルを採用することを提案する。
推論アルゴリズムは、複数のビューにまたがる全てのロボットから個別のpgを融合し、単一のビューから発生したエラーを克服するより効果的な推論能力を得る。
論文 参考訳(メタデータ) (2020-04-25T23:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。