論文の概要: Virtual Mouse And Assistant: A Technological Revolution Of Artificial
Intelligence
- arxiv url: http://arxiv.org/abs/2303.06309v1
- Date: Sat, 11 Mar 2023 05:00:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-14 19:46:44.630354
- Title: Virtual Mouse And Assistant: A Technological Revolution Of Artificial
Intelligence
- Title(参考訳): バーチャルマウスとアシスタント:人工知能のテクノロジー革命
- Authors: Jagbeer Singh, Yash Goel, Shubhi Jain, Shiva Yadav
- Abstract要約: 本研究の目的は,仮想アシスタントの性能を向上させることである。
仮想アシスタントは、自分で完了できる特定のスマートフォンやPCのアクティビティを実質的に完了させることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The purpose of this paper is to enhance the performance of the virtual
assistant. So, what exactly is a virtual assistant. Application software, often
called virtual assistants, also known as AI assistants or digital assistants,
is software that understands natural language voice commands and can perform
tasks on your behalf. What does a virtual assistant do. Virtual assistants can
complete practically any specific smartphone or PC activity that you can
complete on your own, and the list is continually expanding. Virtual assistants
typically do an impressive variety of tasks, including scheduling meetings,
delivering messages, and monitoring the weather. Previous virtual assistants,
like Google Assistant and Cortana, had limits in that they could only perform
searches and were not entirely automated. For instance, these engines do not
have the ability to forward and rewind the song in order to maintain the
control function of the song; they can only have the module to search for songs
and play them. Currently, we are working on a project where we are automating
Google, YouTube, and many other new things to improve the functionality of this
project. Now, in order to simplify the process, we've added a virtual mouse
that can only be used for cursor control and clicking. It receives input from
the camera, and our index finger acts as the mouse tip, our middle finger as
the right click, and so forth.
- Abstract(参考訳): 本研究の目的は,仮想アシスタントの性能を向上させることである。
つまり、バーチャルアシスタントとは何か。
アプリケーションソフトウェア(英語: application software)は、aiアシスタントまたはデジタルアシスタントとしても知られる仮想アシスタントと呼ばれ、自然言語音声コマンドを理解し、あなたの代わりにタスクを実行するソフトウェアである。
バーチャルアシスタントは何をするのか。
仮想アシスタントは、自分のスマートフォンやPCのアクティビティを実際に完了させることができ、リストは継続的に拡大している。
バーチャルアシスタントは通常、会議のスケジュール、メッセージの配信、天気のモニタリングなど、印象的なタスクをこなす。
これまでGoogle AssistantやCortanaのようなバーチャルアシスタントは、検索のみを実行でき、完全に自動化されていないという制限があった。
例えば、これらのエンジンは、曲のコントロール機能を維持するために、曲を前進させて巻き戻す機能を持たず、曲を検索して再生するモジュールしか持たない。
現在私たちは、このプロジェクトの機能を改善するために、google、youtube、その他多くの新機能を自動化しているプロジェクトに取り組んでいます。
さて、プロセスを単純化するために、カーソルコントロールとクリックにのみ使用できる仮想マウスを追加しました。
カメラから入力を受け取り、インデックスフィンガーはマウスの先端、中指は右クリックなどとして機能します。
関連論文リスト
- PIVOT: Iterative Visual Prompting Elicits Actionable Knowledge for VLMs [140.14239499047977]
視覚言語モデル(VLM)は、論理的推論から視覚的理解に至るまで、様々なタスクにわたって印象的な能力を示している。
PIVOT(Prompting with Iterative Visual Optimization)と呼ばれる新しい視覚的プロンプト手法を提案する。
私たちのアプローチは、ロボットのトレーニングデータやさまざまな環境でのナビゲーション、その他の能力なしに、ロボットシステムのゼロショット制御を可能にします。
論文 参考訳(メタデータ) (2024-02-12T18:33:47Z) - Intelligent Virtual Assistants with LLM-based Process Automation [31.275267197246595]
本稿では,高レベルのユーザ要求に基づいて,モバイルアプリ内のマルチステップ操作を自動的に実行可能な,LLMベースの新しい仮想アシスタントを提案する。
このシステムは、指示を解析し、目標を推論し、行動を実行するエンドツーエンドのソリューションを提供することによって、アシスタントの進歩を表す。
論文 参考訳(メタデータ) (2023-12-04T07:51:58Z) - Voice-Based Smart Assistant System for Vehicles using RASA [0.0]
本稿では、RASAフレームワークに基づく車両のための音声ベースのスマートアシスタントアプリケーションの開発に焦点をあてる。
このスマートアシスタントは、ナビゲーション、通話によるコミュニケーション、天気予報の取得、最新のニュースのアップデート、そして本質的に完全に音声ベースの音楽などの機能を提供する。
論文 参考訳(メタデータ) (2023-12-04T05:48:18Z) - HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging
Face [85.25054021362232]
大規模言語モデル(LLM)は、言語理解、生成、相互作用、推論において例外的な能力を示した。
LLMは、複雑なAIタスクを解決するために既存のAIモデルを管理するコントローラとして機能する可能性がある。
本稿では,機械学習コミュニティのさまざまなAIモデルを接続するLLMエージェントであるHuggingGPTを紹介する。
論文 参考訳(メタデータ) (2023-03-30T17:48:28Z) - GRILLBot: An Assistant for Real-World Tasks with Neural Semantic Parsing
and Graph-Based Representations [5.545791216381869]
GRILLBotは、2022年のAlexa Prize TaskBot Challengeで優勝した。
これは、調理と家庭改善の領域における複雑な現実世界のタスクを通じてユーザーを誘導する音声アシスタントである。
論文 参考訳(メタデータ) (2022-08-31T14:24:35Z) - VRKitchen2.0-IndoorKit: A Tutorial for Augmented Indoor Scene Building
in Omniverse [77.52012928882928]
INDOORKITはNVIDIA OMNIVERSEの組み込みツールキットである。
屋内シーンビルディング、シーンランダム化、アニメーションコントロールのための柔軟なパイプラインを提供する。
論文 参考訳(メタデータ) (2022-06-23T17:53:33Z) - Play it by Ear: Learning Skills amidst Occlusion through Audio-Visual
Imitation Learning [62.83590925557013]
我々は視覚と音声の入力から、部分的に観察された操作タスクのセットを学習する。
提案システムは,遠隔操作による実演とオンラインファインタニングを併用することで,これらの課題を学習する。
模擬課題の集合において、我々のシステムは音声を使うことの恩恵を受けており、オンライン介入を用いることで、オフライン模倣学習の成功率を20%向上できることがわかった。
論文 参考訳(メタデータ) (2022-05-30T04:52:58Z) - The MIT Voice Name System [53.473846742702854]
我々は,音声対話を電話番号などの他のシステムと同様のユニバーサルリーチに標準化することを目指している。
音声をIoTオブジェクトと通信するための出発点として重視しています。
プライバシーとセキュリティは、音声からテキストへの誤りと音声サンプルに含まれる個人情報の量によって考慮される重要な要素である。
論文 参考訳(メタデータ) (2022-03-28T19:09:26Z) - "Alexa, what do you do for fun?" Characterizing playful requests with
virtual assistants [68.48043257125678]
Alexaからの実際のトラフィックを分析することで、ユーモアの理論に根ざした遊び心のあるリクエストの分類を紹介します。
我々の予想では、このような発話を理解することで仮想アシスタントのユーザエクスペリエンスが向上する。
論文 参考訳(メタデータ) (2021-05-12T10:48:00Z) - Implementation of Google Assistant & Amazon Alexa on Raspberry Pi [0.0]
本稿では,Raspberry Pi上での音声対応Google AssistantとAmazon Alexaの実装について検討する。
音声対応システムは基本的に、音声を入力として処理し、その入力の意味を理解し、適切な音声出力を生成するシステムを意味する。
論文 参考訳(メタデータ) (2020-06-15T08:46:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。