論文の概要: Volkit: A Performance-Portable Computer Vision Library for 3D Volumetric
Data
- arxiv url: http://arxiv.org/abs/2203.10213v1
- Date: Sat, 19 Mar 2022 01:52:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-27 00:50:38.046574
- Title: Volkit: A Performance-Portable Computer Vision Library for 3D Volumetric
Data
- Title(参考訳): Volkit: 3Dボリュームデータのためのパフォーマンス対応コンピュータビジョンライブラリ
- Authors: Stefan Zellmann and Giovanni Aguirre and J\"urgen P. Schulze
- Abstract要約: 本稿では,画像操作とコンピュータビジョンアルゴリズムを高性能に実装したオープンソースライブラリであるVolkitを紹介する。
我々はVolkitを使用して、VRでレンダリングされた医療およびシミュレーションデータを処理し、ライブラリをC++バーチャルリアリティソフトウェアCalVRに統合した。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present volkit, an open source library with high performance
implementations of image manipulation and computer vision algorithms that focus
on 3D volumetric representations. Volkit implements a cross-platform,
performance-portable API targeting both CPUs and GPUs that defers data and
resource movement and hides them from the application developer using a managed
API. We use volkit to process medical and simulation data that is rendered in
VR and consequently integrated the library into the C++ virtual reality
software CalVR. The paper presents case studies and performance results and by
that demonstrates the library's effectiveness and the efficiency of this
approach.
- Abstract(参考訳): 画像操作と3次元ボリューム表現に焦点を当てたコンピュータビジョンアルゴリズムを高性能に実装した,オープンソースのライブラリであるvolkitを提案する。
Volkitは、CPUとGPUの両方を対象として、クロスプラットフォームでパフォーマンス対応のAPIを実装している。
我々はVolkitを使用して、VRでレンダリングされた医療およびシミュレーションデータを処理し、ライブラリをC++バーチャルリアリティソフトウェアCalVRに統合した。
本稿では,ケーススタディと性能について述べるとともに,本手法の有効性と有効性を示す。
関連論文リスト
- Efficient LLM Inference with I/O-Aware Partial KV Cache Recomputation [7.204881999658682]
大規模言語モデル(LLM)の推論は計算的に要求される。
自動回帰デコーディングのコストを削減するため、キーバリュー(KV)キャッシングは中間アクティベーションを格納するために使用される。
KVキャッシュに必要なメモリは急速に増加し、しばしばGPUメモリの容量を超える。
コスト効率のよい代替手段は、KVキャッシュをCPUメモリにオフロードすることであり、これはGPUメモリの圧力を軽減するが、ボトルネックをCPUとGPU間のPCIe接続の限られた帯域にシフトさせる。
論文 参考訳(メタデータ) (2024-11-26T04:03:14Z) - Implicit-Zoo: A Large-Scale Dataset of Neural Implicit Functions for 2D Images and 3D Scenes [65.22070581594426]
Implicit-Zoo"は、この分野の研究と開発を容易にするために、数千のGPUトレーニング日を必要とする大規模なデータセットである。
1)トランスモデルのトークン位置を学習すること、(2)NeRFモデルに関して直接3Dカメラが2D画像のポーズを取ること、である。
これにより、画像分類、セマンティックセグメンテーション、および3次元ポーズ回帰の3つのタスクすべてのパフォーマンスが向上し、研究のための新たな道が開けることになる。
論文 参考訳(メタデータ) (2024-06-25T10:20:44Z) - KerasCV and KerasNLP: Vision and Language Power-Ups [9.395199188271254]
KerasCVとKerasNLPはコンピュータビジョンと自然言語処理のためのKeras APIの拡張である。
これらのドメインパッケージは、使いやすさとパフォーマンスを重視した高速な実験を可能にするように設計されている。
ライブラリは完全にオープンソース(Apache 2.0ライセンス)で、GitHubから入手できる。
論文 参考訳(メタデータ) (2024-05-30T16:58:34Z) - InverseMatrixVT3D: An Efficient Projection Matrix-Based Approach for 3D Occupancy Prediction [11.33083039877258]
InverseMatrixVT3Dは,多視点画像特徴量を3次元特徴量に変換することで,セマンティック占有率の予測を行う。
プロジェクション行列に対するスパース行列処理手法を導入し,GPUメモリ使用率を最適化する。
本手法は,自動運転と道路安全に不可欠な,脆弱な道路利用者(VRU)の検出において,最高の性能を実現する。
論文 参考訳(メタデータ) (2024-01-23T01:11:10Z) - AutoDecoding Latent 3D Diffusion Models [95.7279510847827]
本稿では,3次元オートデコーダをコアとした静的・明瞭な3次元アセットの生成に対して,新しいアプローチを提案する。
3D Autodecoderフレームワークは、ターゲットデータセットから学んだプロパティを潜時空間に埋め込む。
次に、適切な中間体積潜在空間を特定し、ロバストな正規化と非正規化演算を導入する。
論文 参考訳(メタデータ) (2023-07-07T17:59:14Z) - Mesh Convolution with Continuous Filters for 3D Surface Parsing [101.25796935464648]
本稿では、3次元トライアングルメッシュから効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。
メッシュ畳み込みは球面調和を正規直交基底として利用し、連続畳み込みフィルタを生成する。
さらに,PicassoNet++という3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T09:16:49Z) - Correlate-and-Excite: Real-Time Stereo Matching via Guided Cost Volume
Excitation [65.83008812026635]
本稿では,GCE ( Guided Cost Volume Excitation) を構築し,画像によって誘導されるコストボリュームの簡単なチャネル励磁により,性能が大幅に向上することを示す。
我々はCorrelate-and-Excite(CoEx)と呼ぶエンドツーエンドネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-12T14:32:26Z) - NViSII: A Scriptable Tool for Photorealistic Image Generation [21.453677837017462]
本稿では,NVIDIA の OptiX 線追跡エンジンと,高品質な合成画像を生成するために設計された OptiX AI denoiser をベースとした Python ベースのシステムを提案する。
我々のツールは複雑な動的3Dシーンの記述と操作を可能にする。
論文 参考訳(メタデータ) (2021-05-28T16:35:32Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - RUHSNet: 3D Object Detection Using Lidar Data in Real Time [0.0]
本稿では,ポイントクラウドデータ中の3次元物体を検出するニューラルネットワークアーキテクチャを提案する。
我々の研究は、平均的な精度と30FPSの速度の両方において、この分野の最先端技術を上回っている。
これにより、自動運転車を含むリアルタイムアプリケーションにデプロイすることが可能になる。
論文 参考訳(メタデータ) (2020-05-09T09:41:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。