論文の概要: Applying Deep Learning for cockpit segmentation in the context of mixed reality
- arxiv url: http://arxiv.org/abs/2606.06520v1
- Date: Tue, 02 Jun 2026 16:43:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.337217
- Title: Applying Deep Learning for cockpit segmentation in the context of mixed reality
- Title(参考訳): 混合現実の文脈におけるコックピットセグメンテーションのためのディープラーニングの適用
- Authors: Alexandre Leles Sousa, Pedro de Oliveira Nielson, Erick Oliveira Rodrigues, Rafael Francisco dos Santos, Giovani Bernardes Vitor,
- Abstract要約: 混合現実は、物理的世界からのオブジェクトをリアルタイムで表示する仮想環境を促進する。
本稿では,仮想画像と実画像の融合を容易にするために,前景画像と背景画像のセグメンテーションを行う画像処理の開発を提案する。
- 参考スコア(独自算出の注目度): 36.94429692322632
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Computer vision is an area that has been growing continuously. With the advance of technologies with a first-person view, new development opportunities have emerged inside the area. Mixed reality promotes virtual environments with objects from the physical world shown in real time. For that, it's necessary to be concerned with the immersion of the user in this simulated environment, increasingly seeking to bring it closer to a possible desired reality. This paper proposes the development of image processing in order to perform the segmentation of images to identify what is foreground and background in order to facilitate the union of virtual and real images. Thus, the present work obtain real images of the user using the off-highway truck simulator CAT793F, through a camera, to be able to perform the segmentation of such images with artificial intelligence techniques.The convolutional neural network architectures "U-net" and "DeepLabV3+" are applied to perform image segmentation. As a result, metrics with around 90% accuracy were presented and and the best model was determined.
- Abstract(参考訳): コンピュータビジョンは、継続的に成長している分野です。
一人称視点の技術の進歩により、この地域で新たな開発機会が生まれている。
混合現実は、物理的世界からのオブジェクトをリアルタイムで表示する仮想環境を促進する。
そのためには、このシミュレートされた環境でユーザの没入に気を配ることが必要です。
本稿では,仮想画像と実画像の融合を容易にするために,前景画像と背景画像のセグメンテーションを行う画像処理の開発を提案する。
そこで,本研究では, オフハイウェイトラックシミュレータCAT793Fを用いて, 画像のセグメント化を人工知能技術で実現し, 畳み込みニューラルネットワークアーキテクチャ "U-net" と "DeepLabV3+" を用いて画像セグメンテーションを行う。
その結果、約90%の精度で測定結果が提示され、最良のモデルが決定された。
関連論文リスト
- Mirage2Matter: A Physically Grounded Gaussian World Model from Video [87.9732484393686]
我々は、グラフィック駆動の世界モデリングおよびシミュレーションフレームワークであるSimulate Anythingを紹介する。
実世界の環境を3次元ガウススプレイティング(3DGS)による写実的シーン表現に再構築する。
次に、生成モデルを利用して、物理的に現実的な表現を復元し、精度校正ターゲットを介してシミュレーション環境に統合する。
論文 参考訳(メタデータ) (2026-01-24T07:43:57Z) - TexAVi: Generating Stereoscopic VR Video Clips from Text Descriptions [0.562479170374811]
本稿では,既存の生成システムを融合してテキストから立体視のバーチャルリアリティービデオを作成する手法を提案する。
私たちの研究は、バーチャルリアリティーシミュレーションのような分野において自然言語駆動グラフィックスを使うことのエキサイティングな可能性を強調します。
論文 参考訳(メタデータ) (2025-01-02T09:21:03Z) - MARVIS: Motion & Geometry Aware Real and Virtual Image Segmentation [19.464362358936906]
実画像領域と仮想画像領域のセグメンテーションのための新しい手法を提案する。
水面の複雑さを模倣するリアルな合成画像を作成することで、我々はネットワークにきめ細かいトレーニングデータを提供する。
我々は、目に見えない実世界の領域において、最先端の仮想画像分割性能を実現する。
論文 参考訳(メタデータ) (2024-03-14T20:18:08Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - Evaluating Continual Learning Algorithms by Generating 3D Virtual
Environments [66.83839051693695]
連続学習とは、人間や動物が特定の環境で徐々に学習する能力である。
本稿では3次元仮想環境の最近の進歩を活用して,フォトリアリスティックな外観を持つ潜在的に長寿命な動的シーンの自動生成にアプローチすることを提案する。
本論文の新たな要素は、シーンがパラメトリックな方法で記述され、エージェントが知覚する入力ストリームの視覚的複雑さを完全に制御できることである。
論文 参考訳(メタデータ) (2021-09-16T10:37:21Z) - OpenRooms: An End-to-End Open Framework for Photorealistic Indoor Scene
Datasets [103.54691385842314]
本研究では,屋内シーンの大規模フォトリアリスティックデータセットを作成するための新しいフレームワークを提案する。
私たちの目標は、データセット作成プロセスを広く利用できるようにすることです。
これにより、逆レンダリング、シーン理解、ロボット工学における重要な応用が可能になる。
論文 参考訳(メタデータ) (2020-07-25T06:48:47Z) - Stillleben: Realistic Scene Synthesis for Deep Learning in Robotics [33.30312206728974]
本稿では,シーン認識タスクの学習データを生成するための合成パイプラインについて述べる。
本手法は,物理シミュレーションを用いて,物体メッシュを物理的に現実的で密集したシーンに配置する。
私たちのパイプラインは、ディープニューラルネットワークのトレーニング中にオンラインで実行できます。
論文 参考訳(メタデータ) (2020-05-12T10:11:00Z) - Learning Depth With Very Sparse Supervision [57.911425589947314]
本稿では, 環境との相互作用を通じて, 知覚が世界の3次元特性と結合するという考えを考察する。
我々は、環境と対話するロボットが利用できるような、特殊なグローバルローカルネットワークアーキテクチャを訓練する。
いくつかのデータセットの実験では、画像ピクセルの1つでも基底真理が利用できる場合、提案されたネットワークは、最先端のアプローチよりも22.5%の精度でモノクロの深度推定を学習できることを示している。
論文 参考訳(メタデータ) (2020-03-02T10:44:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。