Fugu-MT 論文翻訳(概要): Volkit: A Performance-Portable Computer Vision Library for 3D Volumetric Data

論文の概要: Volkit: A Performance-Portable Computer Vision Library for 3D Volumetric Data

arxiv url: http://arxiv.org/abs/2203.10213v1
Date: Sat, 19 Mar 2022 01:52:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-27 00:50:38.046574
Title: Volkit: A Performance-Portable Computer Vision Library for 3D Volumetric Data
Title（参考訳）: Volkit: 3Dボリュームデータのためのパフォーマンス対応コンピュータビジョンライブラリ
Authors: Stefan Zellmann and Giovanni Aguirre and J\"urgen P. Schulze
Abstract要約: 本稿では,画像操作とコンピュータビジョンアルゴリズムを高性能に実装したオープンソースライブラリであるVolkitを紹介する。我々はVolkitを使用して、VRでレンダリングされた医療およびシミュレーションデータを処理し、ライブラリをC++バーチャルリアリティソフトウェアCalVRに統合した。
参考スコア（独自算出の注目度）: 1.933681537640272
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present volkit, an open source library with high performance implementations of image manipulation and computer vision algorithms that focus on 3D volumetric representations. Volkit implements a cross-platform, performance-portable API targeting both CPUs and GPUs that defers data and resource movement and hides them from the application developer using a managed API. We use volkit to process medical and simulation data that is rendered in VR and consequently integrated the library into the C++ virtual reality software CalVR. The paper presents case studies and performance results and by that demonstrates the library's effectiveness and the efficiency of this approach.
Abstract（参考訳）: 画像操作と3次元ボリューム表現に焦点を当てたコンピュータビジョンアルゴリズムを高性能に実装した,オープンソースのライブラリであるvolkitを提案する。 Volkitは、CPUとGPUの両方を対象として、クロスプラットフォームでパフォーマンス対応のAPIを実装している。我々はVolkitを使用して、VRでレンダリングされた医療およびシミュレーションデータを処理し、ライブラリをC++バーチャルリアリティソフトウェアCalVRに統合した。本稿では,ケーススタディと性能について述べるとともに,本手法の有効性と有効性を示す。

関連論文リスト

Harnessing LLMs for Document-Guided Fuzzing of OpenCV Library [14.337352597473911]
VISTAFUZZは、OpenCVライブラリのドキュメント誘導ファジングに大規模な言語モデルを利用する新しい技術である。 VISTAFUZは個々の入力パラメータとそれらの間の依存関係の制約を抽出する。 VISTAFUZZがOpenCVライブラリで330のAPIを試験する際の有効性を評価し、その結果、VISTAFUZは17の新たなバグを検出し、10のバグが確認され、そのうち5つのバグが修正された。
論文参考訳（メタデータ） (2025-07-19T09:44:01Z)
R3D2: Realistic 3D Asset Insertion via Diffusion for Autonomous Driving Simulation [78.26308457952636]
本稿では,自律運転シミュレーションの限界を克服する軽量な1ステップ拡散モデルであるR3D2を紹介する。シャドウや一貫した照明など、妥当なレンダリング効果を生み出すことで、既存のシーンに完全な3Dアセットを現実的に挿入することができる。 R3D2は挿入されたアセットの現実性を大幅に向上させ,テキストから3Dへのアセット挿入やクロスシーン/データセットオブジェクト転送といったユースケースを可能にした。
論文参考訳（メタデータ） (2025-06-09T14:50:19Z)
Kornia-rs: A Low-Level 3D Computer Vision Library In Rust [6.567185366423734]
textitkornia-rsは、ネイティブRustで完全に書かれた高性能な3Dコンピュータビジョンライブラリである。 textitkornia-rsは静的型テンソルシステムとモジュール式の木枠を採用し、効率的な画像I/O、画像処理、3D操作を提供する。
論文参考訳（メタデータ） (2025-05-18T13:50:00Z)
Real-Time Semantic Segmentation of Aerial Images Using an Embedded U-Net: A Comparison of CPU, GPU, and FPGA Workflows [0.0]
本研究では,航空画像のリアルタイムセマンティックセグメンテーションに最適化された軽量なU-Netモデルを提案する。実世界のデータセット上でのU-Netの精度を維持しながら、モデルのパラメータと乗算(MAC)操作を16。
論文参考訳（メタデータ） (2025-03-07T08:33:28Z)
ConvMesh: Reimagining Mesh Quality Through Convex Optimization [55.2480439325792]
本研究では、既存のメッシュを強化するために、規律付き凸プログラミングと呼ばれる凸最適化プログラミングを導入する。元々のメッシュとターゲットのメッシュの両方から分離されたポイントクラウドに注目することにより、この手法は、最小限のデータ要求でメッシュ品質を大幅に改善することを示す。
論文参考訳（メタデータ） (2024-12-11T15:48:25Z)
Open-Vocabulary High-Resolution 3D (OVHR3D) Data Segmentation and Annotation Framework [1.1280113914145702]
本研究の目的は,3次元セグメンテーションタスクのための包括的で効率的なフレームワークの設計と開発である。このフレームワークはGrounding DINOとSegment Any Modelを統合し、3Dメッシュによる2D画像レンダリングの強化によって強化される。
論文参考訳（メタデータ） (2024-12-09T07:39:39Z)
Efficient LLM Inference with I/O-Aware Partial KV Cache Recomputation [7.204881999658682]
大規模言語モデル(LLM)の推論は計算的に要求される。自動回帰デコーディングのコストを削減するため、キーバリュー(KV)キャッシングは中間アクティベーションを格納するために使用される。 KVキャッシュに必要なメモリは急速に増加し、しばしばGPUメモリの容量を超える。コスト効率のよい代替手段は、KVキャッシュをCPUメモリにオフロードすることであり、これはGPUメモリの圧力を軽減するが、ボトルネックをCPUとGPU間のPCIe接続の限られた帯域にシフトさせる。
論文参考訳（メタデータ） (2024-11-26T04:03:14Z)
Implicit-Zoo: A Large-Scale Dataset of Neural Implicit Functions for 2D Images and 3D Scenes [65.22070581594426]
Implicit-Zoo"は、この分野の研究と開発を容易にするために、数千のGPUトレーニング日を必要とする大規模なデータセットである。 1)トランスモデルのトークン位置を学習すること、(2)NeRFモデルに関して直接3Dカメラが2D画像のポーズを取ること、である。これにより、画像分類、セマンティックセグメンテーション、および3次元ポーズ回帰の3つのタスクすべてのパフォーマンスが向上し、研究のための新たな道が開けることになる。
論文参考訳（メタデータ） (2024-06-25T10:20:44Z)
KerasCV and KerasNLP: Vision and Language Power-Ups [9.395199188271254]
KerasCVとKerasNLPはコンピュータビジョンと自然言語処理のためのKeras APIの拡張である。これらのドメインパッケージは、使いやすさとパフォーマンスを重視した高速な実験を可能にするように設計されている。ライブラリは完全にオープンソース(Apache 2.0ライセンス)で、GitHubから入手できる。
論文参考訳（メタデータ） (2024-05-30T16:58:34Z)
InverseMatrixVT3D: An Efficient Projection Matrix-Based Approach for 3D Occupancy Prediction [11.33083039877258]
InverseMatrixVT3Dは,多視点画像特徴量を3次元特徴量に変換することで,セマンティック占有率の予測を行う。プロジェクション行列に対するスパース行列処理手法を導入し,GPUメモリ使用率を最適化する。本手法は,自動運転と道路安全に不可欠な,脆弱な道路利用者(VRU)の検出において,最高の性能を実現する。
論文参考訳（メタデータ） (2024-01-23T01:11:10Z)
AutoDecoding Latent 3D Diffusion Models [95.7279510847827]
本稿では,3次元オートデコーダをコアとした静的・明瞭な3次元アセットの生成に対して,新しいアプローチを提案する。 3D Autodecoderフレームワークは、ターゲットデータセットから学んだプロパティを潜時空間に埋め込む。次に、適切な中間体積潜在空間を特定し、ロバストな正規化と非正規化演算を導入する。
論文参考訳（メタデータ） (2023-07-07T17:59:14Z)
Mesh Convolution with Continuous Filters for 3D Surface Parsing [101.25796935464648]
本稿では、3次元トライアングルメッシュから効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。メッシュ畳み込みは球面調和を正規直交基底として利用し、連続畳み込みフィルタを生成する。さらに,PicassoNet++という3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提案する。
論文参考訳（メタデータ） (2021-12-03T09:16:49Z)
Correlate-and-Excite: Real-Time Stereo Matching via Guided Cost Volume Excitation [65.83008812026635]
本稿では,GCE ( Guided Cost Volume Excitation) を構築し,画像によって誘導されるコストボリュームの簡単なチャネル励磁により,性能が大幅に向上することを示す。我々はCorrelate-and-Excite(CoEx)と呼ぶエンドツーエンドネットワークを提案する。
論文参考訳（メタデータ） (2021-08-12T14:32:26Z)
NViSII: A Scriptable Tool for Photorealistic Image Generation [21.453677837017462]
本稿では,NVIDIA の OptiX 線追跡エンジンと,高品質な合成画像を生成するために設計された OptiX AI denoiser をベースとした Python ベースのシステムを提案する。我々のツールは複雑な動的3Dシーンの記述と操作を可能にする。
論文参考訳（メタデータ） (2021-05-28T16:35:32Z)
Providing Meaningful Data Summarizations Using Examplar-based Clustering in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文参考訳（メタデータ） (2021-05-25T15:55:14Z)
Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。 AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文参考訳（メタデータ） (2021-04-23T17:59:28Z)
RUHSNet: 3D Object Detection Using Lidar Data in Real Time [0.0]
本稿では,ポイントクラウドデータ中の3次元物体を検出するニューラルネットワークアーキテクチャを提案する。我々の研究は、平均的な精度と30FPSの速度の両方において、この分野の最先端技術を上回っている。これにより、自動運転車を含むリアルタイムアプリケーションにデプロイすることが可能になる。
論文参考訳（メタデータ） (2020-05-09T09:41:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。