Fugu-MT 論文翻訳(概要): Scalable 3D Semantic Segmentation for Gun Detection in CT Scans

論文の概要: Scalable 3D Semantic Segmentation for Gun Detection in CT Scans

arxiv url: http://arxiv.org/abs/2112.03917v1
Date: Tue, 7 Dec 2021 17:34:37 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-10 03:46:15.800510
Title: Scalable 3D Semantic Segmentation for Gun Detection in CT Scans
Title（参考訳）: ctスキャンにおける銃検出のためのスケーラブル3次元セマンティクスセグメンテーション
Authors: Marius Memmel, Christoph Reich, Nicolas Wagner, Faraz Saeedan
Abstract要約: 既に確実に正確な2Dアプローチに次元を加えると、メモリ消費が大幅に増加し、計算量も増大する。我々の主な貢献は、高速な訓練と高解像度のボキセル化ボリュームの低メモリ消費を可能にする、手荷物CTスキャンにおける銃検出のための新しい3Dセマンティックセマンティックセマンティックセマンティクス法である。
参考スコア（独自算出の注目度）: 0.8602553195689513
License: http://creativecommons.org/licenses/by/4.0/
Abstract: With the increased availability of 3D data, the need for solutions processing those also increased rapidly. However, adding dimension to already reliably accurate 2D approaches leads to immense memory consumption and higher computational complexity. These issues cause current hardware to reach its limitations, with most methods forced to reduce the input resolution drastically. Our main contribution is a novel deep 3D semantic segmentation method for gun detection in baggage CT scans that enables fast training and low video memory consumption for high-resolution voxelized volumes. We introduce a moving pyramid approach that utilizes multiple forward passes at inference time for segmenting an instance.
Abstract（参考訳）: 3Dデータの可用性が向上するにつれ、ソリューション処理の必要性も急速に高まった。しかし、既に確実に正確な2Dアプローチに次元を加えると、メモリ消費が大きくなり、計算量が複雑になる。これらの問題により、現在のハードウェアはその限界に達し、ほとんどのメソッドは入力解像度を劇的に減らさざるを得なくなった。本研究の主な貢献は,高分解能voxelizedボリュームの高速トレーニングと低ビデオメモリ消費を可能にする,手荷物ctスキャンにおける銃検出のための深部3次元意味セグメンテーション手法である。インスタンスのセグメンテーションに、推論時に複数のフォワードパスを利用する移動ピラミッドアプローチを導入する。

関連論文リスト

Tail-Aware Post-Training Quantization for 3D Geometry Models [58.79500829118265]
ポストトレーニング量子化(PTQ)は、再トレーニングなしに効率的な推論を可能にする。 PTQは複雑な特徴分布と禁止キャリブレーションオーバーヘッドのために、3Dモデルに効果的に転送できない。 3次元幾何学学習のためのTail-Aware Post-Training Quantization PipelineであるTAPTQを提案する。
論文参考訳（メタデータ） (2026-02-02T07:21:15Z)
HARP-NeXt: High-Speed and Accurate Range-Point Fusion Network for 3D LiDAR Semantic Segmentation [39.58684038370709]
LiDARセマンティックセグメンテーションは、自動運転車や移動ロボットにとって不可欠である。従来の最先端の手法は、精度とスピードのトレードオフに直面していることが多い。本稿では,高速かつ高精度なLiDARセマンティックセグメンテーションネットワークであるHARP-NeXtを紹介する。
論文参考訳（メタデータ） (2025-10-08T10:46:07Z)
RAPS-3D: Efficient interactive segmentation for 3D radiological imaging [5.8497833718980345]
2Dモデルを3Dに適応させるには、通常、予測がスライスによって伝達される自動回帰戦略が必要となる。そこで本研究では,SegVolにインスパイアされた簡易な3Dプロンプト可能なセグメンテーション手法を提案する。
論文参考訳（メタデータ） (2025-07-10T13:08:57Z)
Explaining 3D Computed Tomography Classifiers with Counterfactuals [5.782952470371709]
本研究では,Latent Shift反ファクト生成法を2次元アプリケーションから拡張し,CTスキャンを解説する。スライスベースのオートエンコーダと勾配ブロッキングを実装した。本手法は,高分解能3次元医用画像における解釈可能な偽物の生成に有効である。
論文参考訳（メタデータ） (2025-02-11T00:44:20Z)
HRDecoder: High-Resolution Decoder Network for Fundus Image Lesion Segmentation [12.606794661369959]
骨盤病変分割のための簡易高分解能デコーダネットワークHRDecoderを提案する。高精細な局所的特徴を捉えるための高精細な表現学習モジュールと、マルチスケールの予測を融合する高精細な融合モジュールを統合している。本手法は, 適正なメモリと計算オーバーヘッドを消費し, 推論速度の満足度を維持しながら, 足底部病変の全体的なセグメンテーション精度を効果的に向上させる。
論文参考訳（メタデータ） (2024-11-06T15:13:31Z)
DELTA: Dense Efficient Long-range 3D Tracking for any video [82.26753323263009]
DELTAは3次元空間内のすべてのピクセルを効率よく追跡し,ビデオ全体の正確な動き推定を可能にする手法である。提案手法では,低分解能追跡のためのグローバルアテンション機構と,高分解能予測を実現するためのトランスフォーマーベースアップサンプラーを併用する。提案手法は,3次元空間における細粒度・長期動作追跡を必要とするアプリケーションに対して,ロバストなソリューションを提供する。
論文参考訳（メタデータ） (2024-10-31T17:59:01Z)
RESSCAL3D++: Joint Acquisition and Semantic Segmentation of 3D Point Clouds [6.071025178912125]
VX-S3DISは,高分解能3Dセンサの動作を正確にシミュレートする新しい点クラウドデータセットである。提案手法を新たなデータセットに適用することにより,3次元点群の共同獲得とセマンティックセマンティックセグメンテーションの可能性を実証する。
論文参考訳（メタデータ） (2024-10-03T09:10:42Z)
Instant Multi-View Head Capture through Learnable Registration [62.70443641907766]
3次元頭部のデータセットを密接なセマンティック通信でキャプチャする既存の手法は遅い。キャリブレーションされたマルチビュー画像から3Dヘッドを直接推定するためにTEMPEHを導入する。 1つの頭部の予測には0.3秒かかるが、中央値の復元誤差は0.26mmで、現在の最先端よりも64%低い。
論文参考訳（メタデータ） (2023-06-12T21:45:18Z)
3D Small Object Detection with Dynamic Spatial Pruning [62.72638845817799]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文参考訳（メタデータ） (2023-05-05T17:57:04Z)
Improving 3D Object Detection with Channel-wise Transformer [58.668922561622466]
我々は手作りの最小限の設計で2段階の3Dオブジェクト検出フレームワーク(CT3D)を提案する。 CT3Dは、提案対応の埋め込みとチャンネルワイドコンテキストアグリゲーションを同時に行う。これはKITTIテスト3D検出ベンチマークで中等車カテゴリーで81.77%のAPを達成した。
論文参考訳（メタデータ） (2021-08-23T02:03:40Z)
Spatial Context-Aware Self-Attention Model For Multi-Organ Segmentation [18.76436457395804]
マルチ組織セグメンテーションは、医学画像解析におけるディープラーニングの最も成功した応用の1つである。深部畳み込みニューラルネット(CNN)は,CT画像やMRI画像上で臨床応用画像のセグメンテーション性能を達成する上で非常に有望である。本研究では,高分解能2次元畳み込みによりセグメンテーションを実現する3次元モデルと2次元モデルを組み合わせた新しい枠組みを提案する。
論文参考訳（メタデータ） (2020-12-16T21:39:53Z)
CovSegNet: A Multi Encoder-Decoder Architecture for Improved Lesion Segmentation of COVID-19 Chest CT Scans [11.946078871080836]
高度に効率的なニューラルネットワークアーキテクチャ、すなわちCovSegNetを利用して、自動化されたCOVID-19病変のセグメンテーションスキームを提案する。パフォーマンスは3つの公開データセットで達成されており、他の最先端のアプローチよりも大幅に向上している。
論文参考訳（メタデータ） (2020-12-02T19:26:35Z)
Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文参考訳（メタデータ） (2020-08-31T17:10:48Z)
Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文参考訳（メタデータ） (2020-04-05T12:52:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。