論文の概要: Learning Multimodal Cues of Children's Uncertainty
- arxiv url: http://arxiv.org/abs/2410.14050v1
- Date: Thu, 17 Oct 2024 21:46:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-21 14:27:27.222395
- Title: Learning Multimodal Cues of Children's Uncertainty
- Title(参考訳): 子どもの不確かさのマルチモーダルクイズを学習する
- Authors: Qi Cheng, Mert İnan, Rahma Mbarki, Grace Grmek, Theresa Choi, Yiming Sun, Kimele Persaud, Jenny Wang, Malihe Alikhani,
- Abstract要約: 本研究では,不確実性の非言語的手がかりを研究するために,発達心理学者と認知心理学者との共同で注釈付きデータセットを提案する。
次に、データ分析を行い、不確実性の異なる役割とタスクの難易度とパフォーマンスとの関係について検討する。
最後に、参加者のリアルタイムビデオクリップから不確実性を予測するマルチモーダル機械学習モデルを提案する。
- 参考スコア(独自算出の注目度): 19.349368123567658
- License:
- Abstract: Understanding uncertainty plays a critical role in achieving common ground (Clark et al.,1983). This is especially important for multimodal AI systems that collaborate with users to solve a problem or guide the user through a challenging concept. In this work, for the first time, we present a dataset annotated in collaboration with developmental and cognitive psychologists for the purpose of studying nonverbal cues of uncertainty. We then present an analysis of the data, studying different roles of uncertainty and its relationship with task difficulty and performance. Lastly, we present a multimodal machine learning model that can predict uncertainty given a real-time video clip of a participant, which we find improves upon a baseline multimodal transformer model. This work informs research on cognitive coordination between human-human and human-AI and has broad implications for gesture understanding and generation. The anonymized version of our data and code will be publicly available upon the completion of the required consent forms and data sheets.
- Abstract(参考訳): 不確実性を理解することは共通の目的を達成する上で重要な役割を果たす(Clark et al ,1983)。
これは、問題を解決するためにユーザと協力したり、難しい概念を通じてユーザーを誘導するマルチモーダルAIシステムにとって特に重要である。
本研究では,非言語的不確実性の研究を目的として,発達心理学者や認知心理学者と共同でアノテートしたデータセットを初めて提示する。
次に、データ分析を行い、不確実性の異なる役割とタスクの難易度とパフォーマンスとの関係について検討する。
最後に、参加者のリアルタイムビデオクリップから不確実性を予測するマルチモーダル機械学習モデルを提案する。
本研究は,人間とAIの認知的協調について研究し,ジェスチャー理解と生成に幅広い影響を及ぼす。
データとコードの匿名化バージョンは、必要な同意書とデータシートの完成時に公開されます。
関連論文リスト
- MDPE: A Multimodal Deception Dataset with Personality and Emotional Characteristics [37.30869857541657]
マルチモーダル・デシージャ・データセットMDPEを導入する。
このデータセットは、騙しの特徴に加えて、個性や感情的表現の特徴の個人差情報も含んでいる。
193人の被験者による104時間以上の騙しと感情的なビデオで構成されている。
論文 参考訳(メタデータ) (2024-07-17T02:44:26Z) - Learning Unseen Modality Interaction [54.23533023883659]
マルチモーダル学習は、すべてのモダリティの組み合わせが訓練中に利用でき、クロスモーダル対応を学ぶことを前提としている。
我々は、目に見えないモダリティ相互作用の問題を提起し、第1の解を導入する。
異なるモジュラリティの多次元的特徴を、豊富な情報を保存した共通空間に投影するモジュールを利用する。
論文 参考訳(メタデータ) (2023-06-22T10:53:10Z) - Contrastive Learning with Cross-Modal Knowledge Mining for Multimodal
Human Activity Recognition [1.869225486385596]
複数のモダリティを活用することによって、より良い認識がもたらされるという仮説を探求する。
我々は、近年、人間活動認識の課題に対して、多くの対照的な自己監督的アプローチを拡張している。
マルチモーダルな自己教師型学習を実現するための,フレキシブルで汎用的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-20T10:39:16Z) - DIME: Fine-grained Interpretations of Multimodal Models via Disentangled
Local Explanations [119.1953397679783]
我々は,マルチモーダルモデルの解釈における最先端化に注力する。
提案手法であるDIMEは,マルチモーダルモデルの高精度かつきめ細かな解析を可能にする。
論文 参考訳(メタデータ) (2022-03-03T20:52:47Z) - Assessing Human Interaction in Virtual Reality With Continually Learning
Prediction Agents Based on Reinforcement Learning Algorithms: A Pilot Study [6.076137037890219]
本研究では,人間と学習の継続する予測エージェントの相互作用が,エージェントの能力の発達とともにどのように発達するかを検討する。
我々は、強化学習(RL)アルゴリズムから学習した予測が人間の予測を増大させる仮想現実環境と時間ベースの予測タスクを開発する。
以上の結果から,人的信頼はエージェントとの早期の相互作用に影響され,信頼が戦略的行動に影響を及ぼす可能性が示唆された。
論文 参考訳(メタデータ) (2021-12-14T22:46:44Z) - WenLan 2.0: Make AI Imagine via a Multimodal Foundation Model [74.4875156387271]
我々は,膨大なマルチモーダル(視覚的・テキスト的)データを事前学習した新しい基礎モデルを開発する。
そこで本研究では,様々な下流タスクにおいて,最先端の成果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-27T12:25:21Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - Exploring Bayesian Deep Learning for Urgent Instructor Intervention Need
in MOOC Forums [58.221459787471254]
大規模なオープンオンラインコース(MOOC)は、その柔軟性のおかげで、eラーニングの一般的な選択肢となっている。
多くの学習者とその多様な背景から、リアルタイムサポートの提供は課税されている。
MOOCインストラクターの大量の投稿と高い作業負荷により、インストラクターが介入を必要とするすべての学習者を識別できる可能性は低いです。
本稿では,モンテカルロドロップアウトと変分推論という2つの手法を用いて,学習者によるテキスト投稿のベイジアン深層学習を初めて検討する。
論文 参考訳(メタデータ) (2021-04-26T15:12:13Z) - Towards Explainable Multi-Party Learning: A Contrastive Knowledge
Sharing Framework [23.475874929905192]
知識の洗練と共有のための新しいコントラスト型マルチパーティ学習フレームワークを提案する。
提案手法は,様々なシナリオにおけるモデル性能の大幅な向上を実現する。
論文 参考訳(メタデータ) (2021-04-14T07:33:48Z) - User profile-driven large-scale multi-agent learning from demonstration
in federated human-robot collaborative environments [5.218882272051637]
本稿では,提示された人間の行動のきめ細かい表現を提供する,新しいユーザプロファイルの定式化について紹介する。
全体的な設計は、人間の行動の短期的および長期的分析/解釈を可能にする。
論文 参考訳(メタデータ) (2021-03-30T15:33:21Z) - Personalized Education in the AI Era: What to Expect Next? [76.37000521334585]
パーソナライズ学習の目的は、学習者の強みに合致する効果的な知識獲得トラックをデザインし、目標を達成するために弱みをバイパスすることである。
近年、人工知能(AI)と機械学習(ML)の隆盛は、パーソナライズされた教育を強化するための新しい視点を広げています。
論文 参考訳(メタデータ) (2021-01-19T12:23:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。