Fugu-MT 論文翻訳(概要): Synthetic data augmentation for robotic mobility aids to support blind and low vision people

論文の概要: Synthetic data augmentation for robotic mobility aids to support blind and low vision people

arxiv url: http://arxiv.org/abs/2409.11164v1
Date: Tue, 17 Sep 2024 13:17:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-18 16:45:13.783383
Title: Synthetic data augmentation for robotic mobility aids to support blind and low vision people
Title（参考訳）: 視覚障害者を支援するロボットモビリティ支援のための合成データ強化
Authors: Hochul Hwang, Krisha Adhikari, Satya Shodhaka, Donghyun Kim,
Abstract要約: 視覚障害者のためのロボットモビリティ支援(BLV)は、深層学習に基づく視覚モデルに大きく依存している。これらのモデルの性能は、実世界のデータセットの可用性と多様性によって制約されることが多い。本研究では,Unreal Engine 4を用いて生成した合成データの有効性について検討した。
参考スコア（独自算出の注目度）: 5.024531194389658
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Robotic mobility aids for blind and low-vision (BLV) individuals rely heavily on deep learning-based vision models specialized for various navigational tasks. However, the performance of these models is often constrained by the availability and diversity of real-world datasets, which are challenging to collect in sufficient quantities for different tasks. In this study, we investigate the effectiveness of synthetic data, generated using Unreal Engine 4, for training robust vision models for this safety-critical application. Our findings demonstrate that synthetic data can enhance model performance across multiple tasks, showcasing both its potential and its limitations when compared to real-world data. We offer valuable insights into optimizing synthetic data generation for developing robotic mobility aids. Additionally, we publicly release our generated synthetic dataset to support ongoing research in assistive technologies for BLV individuals, available at https://hchlhwang.github.io/SToP.
Abstract（参考訳）: 視覚障害者のためのロボットモビリティ支援(BLV)は、様々なナビゲーションタスクに特化した深層学習に基づく視覚モデルに大きく依存している。しかし、これらのモデルの性能は実世界のデータセットの可用性と多様性によって制約されることが多く、様々なタスクに十分な量の収集が困難である。本研究では,Unreal Engine 4を用いて生成した合成データの有効性について検討した。本研究は, 実世界のデータと比較して, 多タスク間のモデル性能を向上し, その可能性と限界を両立させることを実証するものである。ロボットモビリティ支援の開発において、合成データ生成の最適化に関する貴重な洞察を提供する。さらに、生成した合成データセットを公開して、BLV個人のための支援技術に関する継続的な研究を支援する。

関連論文リスト

A Comparative Study of 3D Model Acquisition Methods for Synthetic Data Generation of Agricultural Products [0.8373057326694192]
製造業では、人工知能(AI)に基づくコンピュータビジョンシステムがコスト削減と生産量増加に広く利用されている。これらのAIモデルをトレーニングするには、大量のトレーニングデータが必要です。リアルデータの必要性を減らすための一般的なアプローチは、業界で利用可能なCAD(Computer-Aided Design)モデルを活用することによって生成される合成データの利用である。
論文参考訳（メタデータ） (2026-01-07T10:34:26Z)
The Impact of Synthetic Data on Object Detection Model Performance: A Comparative Analysis with Real-World Data [1.853053680967785]
本研究では, オブジェクト検出モデルの性能に及ぼす合成データの影響について, 実世界のデータのみを用いて学習したモデルと比較して検討した。倉庫環境でのパレット検出に焦点を当てた実験で、リアルおよび様々な合成データセット生成戦略を利用する。
論文参考訳（メタデータ） (2025-10-14T06:59:51Z)
Understanding the Influence of Synthetic Data for Text Embedders [52.04771455432998]
まず,Wangらによって提案された合成データの再生と公開を行った。合成データがモデル一般化をどのように改善するかを批判的に検討する。本研究は, 汎用インバータ構築における, 現在の合成データ手法の限界を浮き彫りにしたものである。
論文参考訳（メタデータ） (2025-09-07T19:28:52Z)
Prototype-Guided Diffusion for Digital Pathology: Achieving Foundation Model Performance with Minimal Clinical Data [6.318463500874778]
本研究では,高忠実度合成病理データを大規模に生成するプロトタイプ誘導拡散モデルを提案する。我々のアプローチは、生成したデータの生物学的、診断学的に有意義な変動を保証します。我々は、大規模な実世界のデータセットでトレーニングされたモデルよりも60倍-760倍少ないデータを使用しても、我々の合成データセットでトレーニングされた自己教師機能によって競争性能が向上することを示した。
論文参考訳（メタデータ） (2025-04-15T21:17:39Z)
An Empirical Study of Validating Synthetic Data for Text-Based Person Retrieval [51.10419281315848]
我々は,テキストベース人検索(TBPR)研究における合成データの可能性を探るため,実証的研究を行った。本稿では,自動プロンプト構築戦略を導入するクラス間画像生成パイプラインを提案する。我々は、画像のさらなる編集に生成AIモデルを応用した、クラス内画像拡張パイプラインを開発する。
論文参考訳（メタデータ） (2025-03-28T06:18:15Z)
Evaluating the Impact of Synthetic Data on Object Detection Tasks in Autonomous Driving [0.0]
実・合成・混合データセットに基づいて訓練された2次元・3次元オブジェクト検出タスクを比較した。その結果,実データと合成データを組み合わせることで,物体検出モデルのロバスト性や一般化が向上することが示唆された。
論文参考訳（メタデータ） (2025-03-12T20:13:33Z)
VidMan: Exploiting Implicit Dynamics from Video Diffusion Model for Effective Robot Manipulation [79.00294932026266]
VidManは、安定性を高め、データ利用効率を向上させるために、2段階のトレーニングメカニズムを使用する新しいフレームワークである。我々のフレームワークは、CALVINベンチマークで最先端のベースラインモデルGR-1を上回り、11.7%の相対的な改善を実現し、OXEの小規模データセットで9%以上の精度向上を示す。
論文参考訳（メタデータ） (2024-11-14T03:13:26Z)
Forewarned is Forearmed: Leveraging LLMs for Data Synthesis through Failure-Inducing Exploration [90.41908331897639]
大規模言語モデル(LLM)は、多種多様な高品質なタスク特化データのトレーニングの恩恵を受けている。本稿では,効果的なトレーニングサンプルを自動生成する新しい手法であるReverseGenを提案する。
論文参考訳（メタデータ） (2024-10-22T06:43:28Z)
SKT: Integrating State-Aware Keypoint Trajectories with Vision-Language Models for Robotic Garment Manipulation [82.61572106180705]
本稿では、視覚言語モデル(VLM)を用いて、様々な衣服カテゴリーにおけるキーポイント予測を改善する統一的なアプローチを提案する。我々は、高度なシミュレーション技術を用いて大規模な合成データセットを作成し、大規模な実世界のデータを必要としないスケーラブルなトレーニングを可能にした。実験結果から, VLM法はキーポイント検出精度とタスク成功率を大幅に向上させることが示された。
論文参考訳（メタデータ） (2024-09-26T17:26:16Z)
Synthetic Image Learning: Preserving Performance and Preventing Membership Inference Attacks [5.0243930429558885]
本稿では,下流分類器の学習のための合成データの生成と利用を最適化するパイプラインである知識リサイクル(KR)を紹介する。このパイプラインの核心は生成的知識蒸留(GKD)であり、情報の品質と有用性を大幅に向上させる技術が提案されている。その結果、実データと合成データでトレーニングされたモデルと、実データでトレーニングされたモデルとの性能差が著しく低下した。
論文参考訳（メタデータ） (2024-07-22T10:31:07Z)
Best Practices and Lessons Learned on Synthetic Data [83.63271573197026]
AIモデルの成功は、大規模で多様な、高品質なデータセットの可用性に依存している。合成データは、現実世界のパターンを模倣する人工データを生成することによって、有望なソリューションとして現れてきた。
論文参考訳（メタデータ） (2024-04-11T06:34:17Z)
A survey of synthetic data augmentation methods in computer vision [0.0]
本稿では,合成データ拡張技術について概観する。我々は、重要なデータ生成と拡張技術、アプリケーション全般の範囲、および特定のユースケースに焦点を当てる。コンピュータビジョンモデルをトレーニングするための一般的な合成データセットの要約を提供する。
論文参考訳（メタデータ） (2024-03-15T07:34:08Z)
Towards In-Vehicle Multi-Task Facial Attribute Recognition: Investigating Synthetic Data and Vision Foundation Models [8.54530542456452]
車両の乗客の顔の特徴を認識する複雑なマルチタスクモデルを訓練するための合成データセットの有用性について検討する。我々の研究は直感に反する発見を明らかにし、特に特定のマルチタスクコンテキストにおいて、ViTよりもResNetの方が優れた性能を示した。
論文参考訳（メタデータ） (2024-03-10T04:17:54Z)
Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文参考訳（メタデータ） (2024-02-07T13:41:53Z)
Does Synthetic Data Make Large Language Models More Efficient? [0.0]
本稿では,NLPにおける合成データ生成のニュアンスについて考察する。データ拡張の可能性や構造化品種の導入など、その利点を強調します。テンプレートベースの合成データが現代の変圧器モデルの性能に与える影響を実証する。
論文参考訳（メタデータ） (2023-10-11T19:16:09Z)
RT-1: Robotics Transformer for Real-World Control at Scale [98.09428483862165]
我々は,有望なスケーラブルなモデル特性を示す,ロボティクストランスフォーマーと呼ばれるモデルクラスを提示する。実世界の課題を遂行する実ロボットの大規模データ収集に基づいて,様々なモデルクラスと,データサイズ,モデルサイズ,データの多様性の関数として一般化する能力について検証した。
論文参考訳（メタデータ） (2022-12-13T18:55:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。