論文の概要: Smartphone camera based pointer
- arxiv url: http://arxiv.org/abs/2004.08030v1
- Date: Fri, 17 Apr 2020 01:59:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 13:52:51.737442
- Title: Smartphone camera based pointer
- Title(参考訳): スマートフォンのカメラベースのポインター
- Authors: Predrag Lazic
- Abstract要約: スマートフォンをスマートフォンのカメラを使って、画面上の直接仮想ポインターに変える新しいアイデアを提示します。
アイデアとその実装はシンプルで、堅牢で、効率的で、使用も楽しい。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large screen displays are omnipresent today as a part of infrastructure for
presentations and entertainment. Also powerful smartphones with integrated
camera(s) are ubiquitous. However, there are not many ways in which smartphones
and screens can interact besides casting the video from a smartphone. In this
paper, we present a novel idea that turns a smartphone into a direct virtual
pointer on the screen using the phone's camera. The idea and its implementation
are simple, robust, efficient and fun to use. Besides the mathematical concepts
of the idea we accompany the paper with a small javascript project
(www.mobiletvgames.com) which demonstrates the possibility of the new
interaction technique presented as a massive multiplayer game in the HTML5
framework.
- Abstract(参考訳): 大規模なスクリーンディスプレイは現在、プレゼンテーションやエンタテインメントのインフラの一部として全周的に展示されている。
また、カメラを内蔵した強力なスマートフォンもユビキタスだ。
しかし、スマートフォンからビデオをキャストする以外に、スマートフォンとスクリーンが対話できる方法は少ない。
本稿では,スマートフォンをスマートフォンのカメラで画面上の直接仮想ポインターに変換する,新しいアイデアを提案する。
アイデアとその実装はシンプルで、堅牢で、効率的で、使用も楽しい。
このアイデアの数学的概念に加えて,HTML5 フレームワークで大規模マルチプレイヤーゲームとして提示される新たなインタラクション技術の可能性を示す,小さな javascript プロジェクト (www.mobiletvgames.com) も伴っている。
関連論文リスト
- Training a Vision Language Model as Smartphone Assistant [1.3654846342364308]
モバイルデバイス上で多様なタスクをこなせる視覚言語モデル(VLM)を提案する。
私たちのモデルはユーザインターフェース(UI)のみと対話することで機能します。
従来の手法とは異なり、我々のモデルは単一の画面画像だけでなく、過去のスクリーンショットのシーケンスから生成された視覚言語文でも動作する。
論文 参考訳(メタデータ) (2024-04-12T18:28:44Z) - Video as the New Language for Real-World Decision Making [100.68643056416394]
ビデオデータは、言語で表現しにくい物理世界に関する重要な情報をキャプチャする。
ビデオは、インターネットの知識を吸収し、多様なタスクを表現できる統一インターフェースとして機能する。
ロボット工学、自動運転、科学といった分野における大きなインパクトの機会を特定します。
論文 参考訳(メタデータ) (2024-02-27T02:05:29Z) - PixelGen: Rethinking Embedded Camera Systems [0.7922558880545526]
組込みカメラシステムを再想像するPixelGenについて紹介する。
具体的には、PixelGenはセンサー、トランシーバー、低解像度の画像と赤外線の視覚センサーを組み合わせて、より広い世界表現を捉えている。
PixelGenの機能は従来の写真を超えて、音波のような従来のカメラには見えない現象の可視化を可能にする。
論文 参考訳(メタデータ) (2024-02-04T14:41:56Z) - Real-Time Under-Display Cameras Image Restoration and HDR on Mobile
Devices [81.61356052916855]
アンダーディスプレイカメラ(UDC)によって撮影された画像は、その前のスクリーンによって劣化する。
画像復元のためのディープラーニング手法は、キャプチャ画像の劣化を著しく低減することができる。
我々は,視覚的UDC画像復元とHDRのための軽量なモデルを提案し,スマートフォン上での様々な手法の性能と実行状況を比較したベンチマークを提供する。
論文 参考訳(メタデータ) (2022-11-25T11:46:57Z) - Effective Gesture Based Framework for Capturing User Input [0.4588028371034407]
仮想キーボードのユーザーは、センサー技術と人工知能のおかげで、どんな面でもキーボードのようにタイプできる。
カメラは、その後仮想キーボードとして機能するキーボードイメージと指の動きをキャプチャするために使用される。
本稿では,指の座標を入力として受け入れる視覚的仮想マウスについても述べる。
論文 参考訳(メタデータ) (2022-08-01T14:58:17Z) - A Framework for Event-based Computer Vision on a Mobile Device [3.912482311158817]
イベントカメラから直接携帯電話にデータをストリームする,初めて公開されたAndroidフレームワークを提示する。
私たちのプロトタイプデバイスは、そのようなイベントカメラをバッテリー駆動のハンドヘルドデバイスに組み込むための第一歩です。
論文 参考訳(メタデータ) (2022-05-13T18:06:20Z) - Egocentric Videoconferencing [86.88092499544706]
ビデオ会議は、価値ある非言語コミュニケーションと表情の手がかりを描写するが、通常は前面カメラを必要とする。
本稿では、スマートグラスに統合可能な低コストのウェアラブルエゴセントリックカメラセットを提案する。
私たちのゴールは、古典的なビデオ通話を模倣することであり、それゆえ、私たちはこのカメラの自我中心の視点を前向きのビデオに変えます。
論文 参考訳(メタデータ) (2021-07-07T09:49:39Z) - Fast and Accurate Quantized Camera Scene Detection on Smartphones,
Mobile AI 2021 Challenge: Report [65.91472671013302]
我々は、量子化ディープラーニングベースのカメラシーン分類ソリューションを開発することを目的とした、最初のMobile AIチャレンジを紹介する。
提案されたソリューションは、すべての主要なモバイルAIアクセラレータと完全に互換性があり、最近のスマートフォンプラットフォームの大部分で100-200 FPS以上を実証することができる。
論文 参考訳(メタデータ) (2021-05-17T13:55:38Z) - Fast and Accurate Single-Image Depth Estimation on Mobile Devices,
Mobile AI 2021 Challenge: Report [105.32612705754605]
そこでは、エンドツーエンドのディープラーニングベースの深度推定ソリューションを開発することが目標です。
提案したソリューションは、Raspberry Pi 4上で最大10FPSのVGA解像度深度マップを生成でき、高い忠実度を達成できる。
論文 参考訳(メタデータ) (2021-05-17T13:49:57Z) - Mobile Computational Photography: A Tour [41.93418497931413]
最初の携帯電話カメラは20年前に販売され、携帯電話で写真を撮るのは奇妙だった。
今日、スマートフォンは電話よりもカメラが多い。
機械学習を含む現代のアルゴリズムとコンピューティングの進歩は、写真のルールを変えた。
論文 参考訳(メタデータ) (2021-02-17T19:43:28Z) - OpenBot: Turning Smartphones into Robots [95.94432031144716]
現在のロボットは高価か、感覚豊かさ、計算能力、通信能力に重大な妥協をもたらす。
我々はスマートフォンを活用して、センサースイート、強力な計算能力、最先端通信チャネル、繁栄するソフトウェアエコシステムへのアクセスなどを備えたロボットを装備することを提案する。
われわれは50ドルの小型電気自動車を設計し、標準のAndroidスマートフォンのロボットボディとして機能する。
論文 参考訳(メタデータ) (2020-08-24T18:04:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。