論文の概要: Towards Ubiquitous Intelligent Hand Interaction
- arxiv url: http://arxiv.org/abs/2308.13543v1
- Date: Mon, 21 Aug 2023 07:52:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-03 21:30:26.421883
- Title: Towards Ubiquitous Intelligent Hand Interaction
- Title(参考訳): ユビキタスハンドインタラクションに向けて
- Authors: Chen Liang
- Abstract要約: 混合現実とIoTは、次世代の自然言語インターフェース(NUI)に新たな需要をもたらす
人間の手は、人々が日常生活の中で外界と対話する媒体として機能する。
現在のハンドトラッキングシステムは、第一視点視力に基づくソリューションに限られている。
- 参考スコア(独自算出の注目度): 16.72775048643511
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of ubiquitous computing and sensing devices has brought about
novel interaction scenarios such as mixed reality and IoT (e.g., smart home),
which pose new demands for the next generation of natural user interfaces
(NUI). Human hand, benefit for the large degree-of-freedom, serves as a medium
through which people interact with the external world in their daily lives,
thus also being regarded as the main entry of NUI. Unfortunately, current hand
tracking system is largely confined on first perspective vision-based
solutions, which suffer from optical artifacts and are not practical in
ubiquitous environments. In my thesis, I rethink this problem by analyzing the
underlying logic in terms of sensor, behavior, and semantics, constituting a
research framework for achieving ubiquitous intelligent hand interaction. Then
I summarize my previous research topics and illustrated the future research
directions based on my research framework.
- Abstract(参考訳): ユビキタスコンピューティングとセンシングデバイスの開発は、次世代のナチュラルユーザインターフェース(nui)に新たな要求をもたらす、複合現実(mixed reality)とiot(例えばスマートホーム)のような新たなインタラクションシナリオを生み出した。
人間の手は、大きな自由の度合いの恩恵を受け、日常生活において外界と対話する媒体として機能し、また、NUIのメインエントリーと見なされている。
残念なことに、現在のハンドトラッキングシステムは、光学的アーティファクトに悩まされ、ユビキタス環境では実用的でないファーストパースペクティブ・ビジョンベースのソリューションに限られている。
私の論文では、センサ、行動、セマンティクスの観点から基礎となるロジックを分析し、インテリジェントなハンドインタラクションを実現するための研究フレームワークを構成することで、この問題を再考する。
そして、これまでの研究トピックを要約し、私の研究枠組みに基づいた今後の研究方向性を図示します。
関連論文リスト
- Multimodal Fusion with LLMs for Engagement Prediction in Natural Conversation [70.52558242336988]
我々は,不関心や混乱の兆候を検出することを目的として,言語的および非言語的手がかりを精査することにより,ダイアディック的相互作用における係り合いを予測することに焦点を当てた。
本研究では,カジュアルなダイアディック会話に携わる34人の参加者を対象に,各会話の最後に自己報告されたエンゲージメント評価を行うデータセットを収集する。
大規模言語モデル(LLMs)を用いた新たな融合戦略を導入し,複数行動モダリティをマルチモーダル・トランスクリプトに統合する。
論文 参考訳(メタデータ) (2024-09-13T18:28:12Z) - MindGPT: Advancing Human-AI Interaction with Non-Invasive fNIRS-Based Imagined Speech Decoding [0.0]
人間とAIエージェント間のシームレスで共生的なコミュニケーションを可能にするコミュニケーションシステムの構築がますます重要になっている。
この研究は、非侵襲的高密度機能近赤外分光法(fNIRS)を用いた想像音声の復号化のための革新的なアプローチを開発することにより、人間とAIの相互作用の分野を前進させる。
特に本研究では,世界初の思考言語モデルであるMindGPTを紹介した。
論文 参考訳(メタデータ) (2024-07-25T18:18:52Z) - Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [129.08019405056262]
人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である
MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。
本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2024-07-09T14:14:47Z) - Large Language Model-empowered multimodal strain sensory system for shape recognition, monitoring, and human interaction of tensegrity [2.323663950503941]
緊張に基づくシステムは、不均一で予測不可能な環境を動的に探索する上で有望なアプローチである。
本稿では,深層学習モデルと大規模言語モデルの両方を活用することで,24個のマルチモーダルひずみセンサと6本のストラット張力積分を導入する。
この緊張感は、自動でiPhoneにデータを送信してワイヤレス監視し、データ分析、説明、予測、提案を人間に提供する。
論文 参考訳(メタデータ) (2024-06-11T06:26:04Z) - Position Paper: Agent AI Towards a Holistic Intelligence [53.35971598180146]
エージェントAI - 大きな基盤モデルをエージェントアクションに統合する具体的システム。
本稿では,エージェント・ファウンデーション・モデル(エージェント・ファウンデーション・モデル)を提案する。
論文 参考訳(メタデータ) (2024-02-28T16:09:56Z) - Agent AI: Surveying the Horizons of Multimodal Interaction [83.18367129924997]
エージェントAI(Agent AI)とは、視覚刺激や言語入力、その他の環境データを知覚できる対話型システムである。
我々は,バーチャルリアリティやシミュレートされたシーンを容易に作成し,仮想環境内に具体化されたエージェントと対話できる未来を構想する。
論文 参考訳(メタデータ) (2024-01-07T19:11:18Z) - Enabling High-Level Machine Reasoning with Cognitive Neuro-Symbolic
Systems [67.01132165581667]
本稿では,認知アーキテクチャを外部のニューロシンボリックコンポーネントと統合することにより,AIシステムにおける高レベル推論を実現することを提案する。
本稿では,ACT-Rを中心としたハイブリッドフレームワークについて紹介し,最近の応用における生成モデルの役割について論じる。
論文 参考訳(メタデータ) (2023-11-13T21:20:17Z) - Integrating Generative Artificial Intelligence in Intelligent Vehicle
Systems [4.724940029079736]
自動車産業がAIを徐々に統合するにつれ、生成的人工知能技術はユーザーインタラクションに革命をもたらす可能性を秘めている。
本稿では, 音声, 音声, 視覚, マルチモーダルインタラクションを重視した, 自動車分野における生成人工知能の現在の応用について概説する。
我々は、ドメイン適応性、アライメント、マルチモーダル統合など、将来の重要な研究分野について概説し、倫理に関する課題やリスクに対処する。
論文 参考訳(メタデータ) (2023-05-15T09:09:40Z) - Neuro-Symbolic Spatio-Temporal Reasoning [16.29507250221851]
時空間的知識は物理的世界との相互作用を超えて必要である。
これをAIシステムに統合するために、さまざまな試みがなされている。
本稿では,空間的知識と時間的知識に基づく論理的推論と機械学習の相乗効果を提案する。
論文 参考訳(メタデータ) (2022-11-28T17:21:41Z) - Towards Data-and Knowledge-Driven Artificial Intelligence: A Survey on Neuro-Symbolic Computing [73.0977635031713]
ニューラルシンボリック・コンピューティング(NeSy)は、人工知能(AI)の活発な研究領域である。
NeSyは、ニューラルネットワークにおける記号表現の推論と解釈可能性の利点と堅牢な学習の整合性を示す。
論文 参考訳(メタデータ) (2022-10-28T04:38:10Z) - Predicting the Future from First Person (Egocentric) Vision: A Survey [18.07516837332113]
この調査は、自我中心のビジョンから将来の予測の文脈における研究の進化を要約する。
アプリケーション、デバイス、既存の問題、一般的に使用されるデータセット、モデル、入力モダリティの概要を説明している。
我々の分析は、自我中心の視覚から将来の予測方法が、様々なアプリケーションに重大な影響を与えることを強調している。
論文 参考訳(メタデータ) (2021-07-28T14:58:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。