論文の概要: On the Application of Egocentric Computer Vision to Industrial Scenarios
- arxiv url: http://arxiv.org/abs/2406.07738v1
- Date: Tue, 11 Jun 2024 21:48:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-13 20:56:21.837919
- Title: On the Application of Egocentric Computer Vision to Industrial Scenarios
- Title(参考訳): エゴセントリックコンピュータビジョンの産業シナリオへの応用について
- Authors: Vivek Chavan, Oliver Heimann, Jörg Krüger,
- Abstract要約: エゴセントリックなビジョンは、一人称視点から世界を捉え、分析することを目的としている。
我々は、エゴセントリックなウェアラブルデバイスが産業用ユースケースを改善し、強化する可能性を探る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Egocentric vision aims to capture and analyse the world from the first-person perspective. We explore the possibilities for egocentric wearable devices to improve and enhance industrial use cases w.r.t. data collection, annotation, labelling and downstream applications. This would contribute to easier data collection and allow users to provide additional context. We envision that this approach could serve as a supplement to the traditional industrial Machine Vision workflow. Code, Dataset and related resources will be available at: https://github.com/Vivek9Chavan/EgoVis24
- Abstract(参考訳): エゴセントリックなビジョンは、一人称視点から世界を捉え、分析することを目的としている。
我々は、エゴセントリックなウェアラブルデバイスが、データ収集、アノテーション、ラベル付け、下流アプリケーションといった産業用ユースケースを改善し、強化する可能性を探る。
これにより、データ収集が容易になり、ユーザが追加のコンテキストを提供できるようになる。
このアプローチは、従来の産業用機械学習ワークフローの補足として役立つと期待しています。
コード、データセットおよび関連するリソースは、https://github.com/Vivek9Chavan/EgoVis24で利用可能になる。
関連論文リスト
- Networking Systems for Video Anomaly Detection: A Tutorial and Survey [56.44953602790945]
ビデオ異常検出(VAD)は人工知能(AI)コミュニティにおける基本的な研究課題である。
この記事では、NSVADの初心者向けの包括的なチュートリアルを紹介します。
我々は、産業用IoTおよびスマート都市における最新のNSVAD研究と、デプロイ可能なNSVADのためのエンドクラウド共同アーキテクチャを紹介します。
論文 参考訳(メタデータ) (2024-05-16T02:00:44Z) - A Semantic Approach for Big Data Exploration in Industry 4.0 [0.05524804393257919]
本稿では,ドメインの専門家によるデータ探索と視覚化が可能なセマンティックなビジュアルクエリシステムを提案する。
システムの主な特徴は、最初にセマンティックアノテートされたデータと、セマンティック記述と結びついているマシンの2Dカスタマイズされたデジタル表現を組み合わせた使い方である。
論文 参考訳(メタデータ) (2024-01-18T08:20:19Z) - EgoGen: An Egocentric Synthetic Data Generator [53.32942235801499]
EgoGenは新しい合成データジェネレータで、エゴセントリックな知覚タスクのための正確でリッチな地上訓練データを生成することができる。
EgoGenの中心となるのは、仮想人間の自我中心の視覚入力を直接利用して3D環境を感知する、新しい人間のモーション合成モデルである。
我々は、ヘッドマウントカメラのマッピングとローカライゼーション、エゴセントリックカメラトラッキング、エゴセントリックビューからのヒューマンメッシュリカバリの3つのタスクで、EgoGenの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-16T18:55:22Z) - Voila-A: Aligning Vision-Language Models with User's Gaze Attention [56.755993500556734]
視覚言語モデル(VLM)を導くために,人間の注意の代用として視線情報を導入する。
本稿では,視線アライメントのための新しいアプローチであるVoila-Aを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:34:01Z) - Literature Review: Computer Vision Applications in Transportation
Logistics and Warehousing [58.720142291102135]
輸送物流や倉庫におけるコンピュータビジョンの応用は、プロセスの自動化に大きな可能性を秘めている。
本稿では、この可能性を活用するために、この分野の研究に関する構造化された文献レビューを紹介する。
論文 参考訳(メタデータ) (2023-04-12T17:33:41Z) - Improving Commonsense in Vision-Language Models via Knowledge Graph
Riddles [83.41551911845157]
本稿では,近年普及している視覚言語モデル(VL)のコモンセンス能力の解析と改善に焦点をあてる。
我々は、よりスケーラブルな戦略、すなわち、CommonsensE機能のためのkNowledgeグラフ線形化によるデータ拡張を提案する(DANCE)。
より優れたコモンセンス評価のために,検索に基づく最初のコモンセンス診断ベンチマークを提案する。
論文 参考訳(メタデータ) (2022-11-29T18:59:59Z) - Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep
Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。
我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文 参考訳(メタデータ) (2022-09-28T18:51:59Z) - Predicting the Future from First Person (Egocentric) Vision: A Survey [18.07516837332113]
この調査は、自我中心のビジョンから将来の予測の文脈における研究の進化を要約する。
アプリケーション、デバイス、既存の問題、一般的に使用されるデータセット、モデル、入力モダリティの概要を説明している。
我々の分析は、自我中心の視覚から将来の予測方法が、様々なアプリケーションに重大な影響を与えることを強調している。
論文 参考訳(メタデータ) (2021-07-28T14:58:13Z) - INODE: Building an End-to-End Data Exploration System in Practice
[Extended Vision] [30.411996388471817]
INODEはエンドツーエンドのデータ探索システムです。
私達は癌のバイオマーカーのReearch、研究および革新の方針の作成および天体物理学の分野の3つの重要な使用例でそれを実証します。
論文 参考訳(メタデータ) (2021-04-09T05:04:04Z) - Efficient Pipelines for Vision-Based Context Sensing [0.24366811507669117]
世界中の視界源が出現しており、カメラは道路、社内、モバイルプラットフォームに設置できる。
しかし、ビジョンデータ収集と分析は今でも非常に手作業で行われている。
今日の視覚ベースのコンテキストセンシングシステムには3つの大きな課題がある。
論文 参考訳(メタデータ) (2020-11-01T05:09:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。