論文の概要: Semantic Scene Segmentation for Robotics Applications
- arxiv url: http://arxiv.org/abs/2108.11128v1
- Date: Wed, 25 Aug 2021 08:55:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-26 16:52:55.683864
- Title: Semantic Scene Segmentation for Robotics Applications
- Title(参考訳): ロボット応用のための意味シーンセグメンテーション
- Authors: Maria Tzelepi and Anastasios Tefas
- Abstract要約: 様々な設定の下で,最も成功したセマンティックシーンセグメンテーションモデルの動作を,展開(推論)速度の観点から検討する。
この研究の目的は、ロボット工学の応用要件に最も適合しているものを選択するために、現在の最先端セグメンテーションモデルの比較研究を提供することである。
- 参考スコア(独自算出の注目度): 51.66271681532262
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Semantic scene segmentation plays a critical role in a wide range of robotics
applications, e.g., autonomous navigation. These applications are accompanied
by specific computational restrictions, e.g., operation on low-power GPUs, at
sufficient speed, and also for high-resolution input. Existing state-of-the-art
segmentation models provide evaluation results under different setups and
mainly considering high-power GPUs. In this paper, we investigate the behavior
of the most successful semantic scene segmentation models, in terms of
deployment (inference) speed, under various setups (GPUs, input sizes, etc.) in
the context of robotics applications. The target of this work is to provide a
comparative study of current state-of-the-art segmentation models so as to
select the most compliant with the robotics applications requirements.
- Abstract(参考訳): セマンティックシーンセグメンテーションは、自律ナビゲーションなど、幅広いロボット工学応用において重要な役割を果たしている。
これらのアプリケーションには、低消費電力gpuの動作や十分な速度、高解像度入力など、特定の計算上の制約が伴う。
既存の最先端のセグメンテーションモデルは、異なるセットアップ、主に高出力gpuでの評価結果を提供する。
本稿では,セマンティクスシーンセグメンテーションモデルにおいて,様々なセットアップ(gpu,入力サイズなど)下での展開(参照)速度の観点から,最も成功したセマンティクスシーンセグメンテーションモデルの挙動について検討する。
ロボット工学の応用の文脈で
この研究の目的は、ロボット工学の応用要件に最も準拠したものを選択するために、現在の最先端のセグメンテーションモデルの比較研究を提供することである。
関連論文リスト
- Are We Ready for Real-Time LiDAR Semantic Segmentation in Autonomous Driving? [42.348499880894686]
シーンセマンティックセグメンテーションは、3次元空間データを専門のディープニューラルネットワークと直接統合することで実現できる。
本研究では, NVIDIA Jetson プラットフォーム上でのリソース制約推論の性能と性能を解析し, 様々な3次元セマンティックセマンティックセマンティクス手法について検討する。
論文 参考訳(メタデータ) (2024-10-10T20:47:33Z) - Show and Grasp: Few-shot Semantic Segmentation for Robot Grasping through Zero-shot Foundation Models [5.792788640304759]
ロボットが物体をつかむ能力は、いくつかの応用に欠かせない。
このようなタスクでは、選択する適切なターゲットを選択することは、グリップの正しい構成を推測するのと同じくらい重要である。
この問題に対する一般的な解決策はセマンティックセグメンテーションモデルに依存しており、しばしば目に見えない対象への一般化が不十分である。
論文 参考訳(メタデータ) (2024-04-19T08:58:52Z) - Instruct2Act: Mapping Multi-modality Instructions to Robotic Actions
with Large Language Model [63.66204449776262]
Instruct2Actは、ロボット操作タスクのシーケンシャルアクションにマルチモーダル命令をマッピングするフレームワークである。
我々のアプローチは、様々な命令のモダリティや入力タイプを調節する上で、調整可能で柔軟なものである。
我々のゼロショット法は、いくつかのタスクにおいて、最先端の学習ベースのポリシーよりも優れていた。
論文 参考訳(メタデータ) (2023-05-18T17:59:49Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - On Efficient Real-Time Semantic Segmentation: A Survey [12.404169549562523]
我々は、低メモリの組み込みシステムにデプロイ可能な、よりコンパクトで効率的なモデルで、このミスアライメントに対処することを目的とした作業について検討する。
我々は,一貫したハードウェアおよびソフトウェア構成下で,議論されたモデルの推論速度を評価する。
実験結果から,リソース制約のあるハードウェア上でのリアルタイム性能を実証し,レイテンシと精度の相反するトレードオフを考察した。
論文 参考訳(メタデータ) (2022-06-17T08:00:27Z) - OG-SGG: Ontology-Guided Scene Graph Generation. A Case Study in Transfer
Learning for Telepresence Robotics [124.08684545010664]
画像からのシーングラフ生成は、ロボット工学のようなアプリケーションに非常に関心を持つタスクである。
オントロジー誘導シーングラフ生成(OG-SGG)と呼ばれるフレームワークの初期近似を提案する。
論文 参考訳(メタデータ) (2022-02-21T13:23:15Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Vision-driven Robotic
Grasping via Physics-based Metaverse Synthesis [78.26022688167133]
本稿では,物理に基づくメタバース合成による視覚駆動型ロボットグルーピングのための大規模ベンチマークデータセットを提案する。
提案するデータセットには,10万の画像と25種類のオブジェクトが含まれている。
また,オブジェクト検出とセグメンテーション性能を評価するためのデータセットとともに,新しいレイアウト重み付け性能指標を提案する。
論文 参考訳(メタデータ) (2021-12-29T17:23:24Z) - Efficient Multi-Organ Segmentation Using SpatialConfiguration-Net with
Low GPU Memory Requirements [8.967700713755281]
本研究では,SpatialConfiguration-Net(SCN)に基づくマルチ組織セグメンテーションモデルを用いる。
セグメンテーションモデルのアーキテクチャを改良し,メモリフットプリントの削減を図った。
最後に、我々は最小限の推論スクリプトを実装し、実行時間と必要なGPUメモリの両方を最適化した。
論文 参考訳(メタデータ) (2021-11-26T17:47:10Z) - SideInfNet: A Deep Neural Network for Semi-Automatic Semantic
Segmentation with Side Information [83.03179580646324]
本稿では,新たなディープニューラルネットワークアーキテクチャであるSideInfNetを提案する。
画像から学習した機能とユーザアノテーションから抽出したサイド情報を統合する。
提案手法を評価するために,提案したネットワークを3つのセマンティックセグメンテーションタスクに適用し,ベンチマークデータセットに対する広範な実験を行った。
論文 参考訳(メタデータ) (2020-02-07T06:10:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。