論文の概要: Deep Learning for Semantic Segmentation of 3D Ultrasound Data
- arxiv url: http://arxiv.org/abs/2601.13263v1
- Date: Mon, 19 Jan 2026 17:54:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.999806
- Title: Deep Learning for Semantic Segmentation of 3D Ultrasound Data
- Title(参考訳): 3次元超音波データのセマンティックセグメンテーションのための深層学習
- Authors: Chenyu Liu, Marco Cecotti, Harikrishnan Vijayakumar, Patrick Robinson, James Barson, Mihai Caleap,
- Abstract要約: 本研究では,Calyo Pulse 3D超音波センサを用いた学習型3Dセマンティックセマンティックセマンティックセグメンテーションの新たなフレームワークを提案する。
結果,Calyo Pulseセンサのセグメンテーション性能は良好であり,さらなる改良の可能性が示唆された。
本研究は、3次元超音波センシングを信頼性の高い自律性のための有望な相補的モダリティとして強調する。
- 参考スコア(独自算出の注目度): 8.632803164215368
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing cost-efficient and reliable perception systems remains a central challenge for automated vehicles. LiDAR and camera-based systems dominate, yet they present trade-offs in cost, robustness and performance under adverse conditions. This work introduces a novel framework for learning-based 3D semantic segmentation using Calyo Pulse, a modular, solid-state 3D ultrasound sensor system for use in harsh and cluttered environments. A 3D U-Net architecture is introduced and trained on the spatial ultrasound data for volumetric segmentation. Results demonstrate robust segmentation performance from Calyo Pulse sensors, with potential for further improvement through larger datasets, refined ground truth, and weighted loss functions. Importantly, this study highlights 3D ultrasound sensing as a promising complementary modality for reliable autonomy.
- Abstract(参考訳): 低コストで信頼性の高い認識システムを開発することは、自動走行車にとって依然として中心的な課題である。
LiDARとカメラベースのシステムは支配的だが、悪条件下でのコスト、堅牢性、性能のトレードオフを提示する。
本研究は,過酷で散らばった環境に使用するモジュール型固体3D超音波センサシステムであるCalyo Pulseを用いた,学習に基づく3Dセマンティックセマンティックセマンティックセマンティクスの新たなフレームワークを提案する。
ボリュームセグメンテーションのための空間超音波データに基づいて,3次元U-Netアーキテクチャを導入,訓練する。
結果は、Calyo Pulseセンサーによる堅牢なセグメンテーション性能を示し、より大きなデータセット、改良された基底真理、重み付き損失関数によるさらなる改善の可能性を示した。
本研究は、3次元超音波センシングを信頼性の高い自律性のための有望な相補的モダリティとして強調する。
関連論文リスト
- SPHERE: Semantic-PHysical Engaged REpresentation for 3D Semantic Scene Completion [52.959716866316604]
カメラベース3Dセマンティックシーンコンプリート(SSC)は自動運転システムにおいて重要な課題である。
本稿では,SPHERE (Semantic-PHysical Engaged Representation) を提案する。
SPHEREは、意味情報と物理的情報の共同利用のためのボクセルとガウス表現を統合している。
論文 参考訳(メタデータ) (2025-09-14T09:07:41Z) - Structural Vibration Monitoring with Diffractive Optical Processors [10.912207470238338]
本稿では,浅層ニューラルネットワークに基づくバックエンドと共同最適化された回折層を統合した回折振動モニタリングシステムを提案する。
このアーキテクチャは、高密度センサアレイや広範なデータ取得の必要性を排除している。
従来の光学よりも精度が向上する。
論文 参考訳(メタデータ) (2025-06-03T19:06:04Z) - Enhancing Free-hand 3D Photoacoustic and Ultrasound Reconstruction using Deep Learning [3.8426872518410997]
本研究では,携帯型光音響・超音波(PAUS)画像における3次元再構成を支援するため,グローバルローカル自己保持モジュール(MoGLo-Net)を用いたモーションベース学習ネットワークを提案する。
MoGLo-Netは、連続した超音波画像内の完全に発達したスペックル領域や高発癌組織領域などの臨界領域を利用して、運動パラメータを正確に推定する。
論文 参考訳(メタデータ) (2025-02-05T11:59:23Z) - Scalable Benchmarking and Robust Learning for Noise-Free Ego-Motion and 3D Reconstruction from Noisy Video [30.89206445146674]
ノイズフリーデータへの依存という限界に対処することで、ロバストなエゴモーション推定とフォトリアリスティックな3D再構成を再定義することを目指している。
スケーラブルなデータ生成、包括的な堅牢性、モデルの強化という3つの課題に取り組んでいます。
Robust-Ego3Dという,ノイズによるパフォーマンス劣化の顕在化を目的としたベンチマークを作成しました。
論文 参考訳(メタデータ) (2025-01-24T08:25:48Z) - SurgTrack: CAD-Free 3D Tracking of Real-world Surgical Instruments [21.536823332387993]
視覚に基づく手術ナビゲーションは、非侵襲的で費用対効果があり柔軟な利点のために注目されている。
特に、視覚ベースのナビゲーションシステムの重要な要素は、手術器具を追跡することである。
CADフリーでロバストな実世界のアプリケーションのための2段階の3D計測手法であるSurgTrackを提案する。
論文 参考訳(メタデータ) (2024-09-04T10:29:59Z) - Multi-Modal Data-Efficient 3D Scene Understanding for Autonomous Driving [58.16024314532443]
我々は、異なるLiDARスキャンからレーザービーム操作を統合するフレームワークであるLaserMix++を導入し、データ効率の学習を支援するためにLiDAR-カメラ対応を組み込んだ。
結果は、LaserMix++が完全に教師付き代替よりも優れており、5倍のアノテーションで同等の精度を実現していることを示している。
この大幅な進歩は、LiDARベースの3Dシーン理解システムにおける広範囲なラベル付きデータへの依存を減らすための半教師付きアプローチの可能性を示している。
論文 参考訳(メタデータ) (2024-05-08T17:59:53Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [59.13757801286343]
クラス増分学習(class-incremental learning)は、モデルが限られたデータで漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
本稿では,特徴空間の不整合のための冗長特徴除去器 (RFE) と,重要な雑音に対する空間ノイズ補償器 (SNC) の2つの新しいコンポーネントを備えたFILP-3Dフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - On the Importance of Accurate Geometry Data for Dense 3D Vision Tasks [61.74608497496841]
不正確または破損したデータのトレーニングは、モデルバイアスとハマーズ一般化能力を誘導する。
本稿では,深度推定と再構成における高密度3次元視覚課題に対するセンサ誤差の影響について検討する。
論文 参考訳(メタデータ) (2023-03-26T22:32:44Z) - HUM3DIL: Semi-supervised Multi-modal 3D Human Pose Estimation for
Autonomous Driving [95.42203932627102]
3Dの人間のポーズ推定は、自動運転車が歩行者の微妙で複雑な振る舞いを知覚し理解できるようにする新しい技術である。
提案手法は,これらの補完信号を半教師付き方式で効率的に利用し,既存の手法よりも大きなマージンで性能を向上する。
具体的には、LiDAR点を画素整列マルチモーダル特徴に埋め込み、トランスフォーマーの精細化段階を経る。
論文 参考訳(メタデータ) (2022-12-15T11:15:14Z) - 3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object
Detection on Edge for Intelligent Transportation System [28.55894241049706]
本稿では,ポイントクラウドに基づく不整合予測を緩和する3次元高調波損失関数を提案する。
提案手法はベンチマークモデルよりも性能が大幅に向上する。
私たちのコードはオープンソースで公開されています。
論文 参考訳(メタデータ) (2022-11-07T10:11:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。