論文の概要: Deep Learning Perspective of Scene Understanding in Autonomous Robots
- arxiv url: http://arxiv.org/abs/2512.14020v1
- Date: Tue, 16 Dec 2025 02:31:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.554
- Title: Deep Learning Perspective of Scene Understanding in Autonomous Robots
- Title(参考訳): 自律ロボットにおけるシーン理解の深層学習的視点
- Authors: Afia Maham, Dur E Nayab Tashfa,
- Abstract要約: 本稿では,自律型ロボットにおけるシーン理解におけるディープラーニングの応用について概説する。
オブジェクト検出、セマンティックおよびインスタンスセグメンテーション、深さ推定、3D再構成、ビジュアルSLAMの革新が含まれている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper provides a review of deep learning applications in scene understanding in autonomous robots, including innovations in object detection, semantic and instance segmentation, depth estimation, 3D reconstruction, and visual SLAM. It emphasizes how these techniques address limitations of traditional geometric models, improve depth perception in real time despite occlusions and textureless surfaces, and enhance semantic reasoning to understand the environment better. When these perception modules are integrated into dynamic and unstructured environments, they become more effective in decisionmaking, navigation and interaction. Lastly, the review outlines the existing problems and research directions to advance learning-based scene understanding of autonomous robots.
- Abstract(参考訳): 本稿では,自律型ロボットにおけるシーン理解における深層学習の応用について,オブジェクト検出,セマンティックおよびインスタンスセグメンテーション,深さ推定,3次元再構成,視覚SLAMなどのイノベーションを概説する。
従来の幾何学的モデルの限界に対処する方法を強調し、閉塞やテクスチャのない表面にもかかわらず、リアルタイムで深度知覚を改善し、環境をよりよく理解するために意味論的推論を強化する。
これらの知覚モジュールが動的で非構造的な環境に統合されると、意思決定、ナビゲーション、相互作用においてより効果的になる。
最後に、このレビューは、自律ロボットの学習に基づくシーン理解を促進するための既存の問題と研究の方向性について概説する。
関連論文リスト
- Vision-Language Embodiment for Monocular Depth Estimation [11.737279515161505]
現在の深度推定モデルは、教師あり訓練における画像間関係に依存している。
本稿では,カメラモデルとその物理特性を深層学習モデルに具体化する手法を提案する。
このモデルでは,環境変化の即時変化に基づいて,実写シーンの深度をリアルタイムで計算することができる。
論文 参考訳(メタデータ) (2025-03-18T18:05:16Z) - Deep Dive into Model-free Reinforcement Learning for Biological and Robotic Systems: Theory and Practice [17.598549532513122]
モデルフリー強化学習の数学的側面とアルゴリズム的側面を簡潔に表現する。
我々は,動物やロボットの行動に対するフィードバック制御のツールとして,テクスチタクタ・クリティカルな手法を用いた。
論文 参考訳(メタデータ) (2024-05-19T05:58:44Z) - Recent Trends in 3D Reconstruction of General Non-Rigid Scenes [104.07781871008186]
コンピュータグラフィックスやコンピュータビジョンにおいて、3次元幾何学、外観、実際のシーンの動きを含む現実世界のモデルの再構築が不可欠である。
これは、映画産業やAR/VRアプリケーションに有用な、フォトリアリスティックなノベルビューの合成を可能にする。
この最新技術レポート(STAR)は、モノクロおよびマルチビュー入力による最新技術の概要を読者に提供する。
論文 参考訳(メタデータ) (2024-03-22T09:46:11Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - Interpreting Neural Policies with Disentangled Tree Representations [58.769048492254555]
本稿では,コンパクトなニューラルポリシーの解釈可能性について,不整合表現レンズを用いて検討する。
決定木を利用して,ロボット学習における絡み合いの要因を抽出する。
学習したニューラルダイナミクスの絡み合いを計測する解釈可能性指標を導入する。
論文 参考訳(メタデータ) (2022-10-13T01:10:41Z) - Combining Commonsense Reasoning and Knowledge Acquisition to Guide Deep
Learning in Robotics [8.566457170664926]
本稿では,認知システムの研究からインスピレーションを得たアーキテクチャについて述べる。
ディープネットワークモデルは、ロボット工学とAIにおける多くのパターン認識と意思決定タスクに使用されている。
我々のアーキテクチャは意思決定の信頼性を改善し、データ駆動のディープネットワークモデルのトレーニングに関わる労力を削減する。
論文 参考訳(メタデータ) (2022-01-25T12:24:22Z) - 3D Neural Scene Representations for Visuomotor Control [78.79583457239836]
我々は2次元視覚観測から動的3次元シーンのモデルを純粋に学習する。
学習した表現空間上に構築された動的モデルにより,操作課題に対するビジュモータ制御が可能となる。
論文 参考訳(メタデータ) (2021-07-08T17:49:37Z) - Learning Depth With Very Sparse Supervision [57.911425589947314]
本稿では, 環境との相互作用を通じて, 知覚が世界の3次元特性と結合するという考えを考察する。
我々は、環境と対話するロボットが利用できるような、特殊なグローバルローカルネットワークアーキテクチャを訓練する。
いくつかのデータセットの実験では、画像ピクセルの1つでも基底真理が利用できる場合、提案されたネットワークは、最先端のアプローチよりも22.5%の精度でモノクロの深度推定を学習できることを示している。
論文 参考訳(メタデータ) (2020-03-02T10:44:13Z) - Perception and Navigation in Autonomous Systems in the Era of Learning:
A Survey [28.171707840152994]
本稿では,自律システムにおける自我運動知覚,環境知覚,ナビゲーションにおける学習に基づく単眼的アプローチの適用について述べる。
まず,従来の視覚的同時ローカライゼーションとマッピング(vSLAM)ソリューションの欠点を概説し,深層学習技術の統合の必要性を示す。
第2に,深層学習に基づく単眼深度推定を含む,深層学習に基づく視覚的環境認識と理解手法について検討する。
第3に、主に強化学習や深層強化学習を含む学習システムに基づく視覚ナビゲーションに焦点を当てる。
論文 参考訳(メタデータ) (2020-01-08T00:28:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。