論文の概要: DiffBMP: Differentiable Rendering with Bitmap Primitives
- arxiv url: http://arxiv.org/abs/2602.22625v1
- Date: Thu, 26 Feb 2026 04:56:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.535469
- Title: DiffBMP: Differentiable Rendering with Bitmap Primitives
- Title(参考訳): DiffBMP: Bitmap Primitivesを使った差別化可能なレンダリング
- Authors: Seongmin Hong, Junghun James Kim, Daehyeop Kim, Insoo Chung, Se Young Chun,
- Abstract要約: DiffBMPは、ビットマップ画像のコレクションのためのスケーラブルな微分可能レンダリングエンジンである。
私たちのコアコントリビューションは、計算用のカスタム実装を備えた、高度に並列化されたレンダリングパイプラインです。
ネイティブで階層化されたファイルフォーマットへのコンポジションのエクスポートをサポートしており、フレームワーク全体が容易にハック可能なPythonパッケージを通じて公開されている。
- 参考スコア(独自算出の注目度): 25.092358212277162
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce DiffBMP, a scalable and efficient differentiable rendering engine for a collection of bitmap images. Our work addresses a limitation that traditional differentiable renderers are constrained to vector graphics, given that most images in the world are bitmaps. Our core contribution is a highly parallelized rendering pipeline, featuring a custom CUDA implementation for calculating gradients. This system can, for example, optimize the position, rotation, scale, color, and opacity of thousands of bitmap primitives all in under 1 min using a consumer GPU. We employ and validate several techniques to facilitate the optimization: soft rasterization via Gaussian blur, structure-aware initialization, noisy canvas, and specialized losses/heuristics for videos or spatially constrained images. We demonstrate DiffBMP is not just an isolated tool, but a practical one designed to integrate into creative workflows. It supports exporting compositions to a native, layered file format, and the entire framework is publicly accessible via an easy-to-hack Python package.
- Abstract(参考訳): 我々は、ビットマップ画像のコレクションのためのスケーラブルで効率的な微分可能レンダリングエンジンであるDiffBMPを紹介した。
私たちの研究は、世界のほとんどの画像がビットマップであることを考えると、従来の微分可能レンダラーがベクトルグラフィックスに制約されているという制限に対処しています。
私たちのコアコントリビューションは高度に並列化されたレンダリングパイプラインであり、勾配を計算するためのカスタムCUDA実装を備えています。
このシステムは例えば、コンシューマGPUを使用して、数千のビットマッププリミティブの位置、回転、スケール、色、不透明度を1分未満で最適化することができる。
本稿では,ガウス的曖昧化によるソフトラスタライゼーション,構造認識初期化,ノイズキャンバス,ビデオや空間的制約のある画像の特殊な損失/ヒューリスティックスなど,いくつかの手法を応用し検証する。
DiffBMPは単なる独立したツールではなく、クリエイティブなワークフローに統合するために設計された実用的なツールであることを実証しています。
ネイティブで階層化されたファイルフォーマットへのコンポジションのエクスポートをサポートしており、フレームワーク全体が容易にハック可能なPythonパッケージを通じて公開されている。
関連論文リスト
- ImLoc: Revisiting Visual Localization with Image-based Representation [61.282162006394934]
本稿では,各画像に推定深度マップを付加して幾何学的構造を捉えることを提案する。
この表現は構築と維持が容易であるが、挑戦的な条件下では高い精度を達成する。
提案手法は,各種標準ベンチマークにおける新しい最先端の精度を実現し,既存のメモリ効率を同等のマップサイズで向上させる。
論文 参考訳(メタデータ) (2026-01-07T18:51:51Z) - DiffCSG: Differentiable CSG via Rasterization [42.48127201787373]
微分レンダリングは、逆レンダリングと機械学習の重要な要素である。
本稿では,コンストラクティブソリッドジオメトリー(CSG)を微分可能な方法で描画するアルゴリズムDiffCSGを提案する。
私たちのアルゴリズムはシンプルで高速で、最新の機械学習のセットアップに簡単に組み込むことができ、幅広いアプリケーションを可能にします。
論文 参考訳(メタデータ) (2024-09-02T18:57:07Z) - 3D Gaussian Ray Tracing: Fast Tracing of Particle Scenes [50.36933474990516]
本研究は, 粒子のトレーシング, 境界体積階層の構築, 高性能なレイトレーシングハードウェアを用いた各画素のレイキャストについて考察する。
半透明粒子の多量処理を効率的に行うために,有界メッシュで粒子をカプセル化するアルゴリズムについて述べる。
実験は、我々のアプローチの速度と精度、およびコンピュータグラフィックスとビジョンにおけるいくつかの応用を実証する。
論文 参考訳(メタデータ) (2024-07-09T17:59:30Z) - Image-GS: Content-Adaptive Image Representation via 2D Gaussians [52.598772767324036]
本稿では,2次元ガウス放射率に基づくコンテンツ適応型画像表現であるImage-GSを紹介する。
リアルタイム使用のためにハードウェアフレンドリーな高速アクセスをサポートし、ピクセルをデコードするためには0.3KのMACしか必要としない。
テクスチャ圧縮、セマンティクス対応圧縮、共同画像圧縮と復元など、いくつかのアプリケーションでその汎用性を実証する。
論文 参考訳(メタデータ) (2024-07-02T00:45:21Z) - Is One GPU Enough? Pushing Image Generation at Higher-Resolutions with Foundation Models [4.257210316104905]
我々はPixelsmithを紹介した。これはゼロショットのテキスト・ツー・イメージ生成フレームワークで、1つのGPUで高解像度の画像をサンプリングする。
我々は,事前学習した拡散モデルの出力を1000倍に拡大できることを初めて示し,ギガピクセル画像生成への道を開いた。
論文 参考訳(メタデータ) (2024-06-11T13:33:33Z) - You Can Mask More For Extremely Low-Bitrate Image Compression [80.7692466922499]
近年,学習画像圧縮(lic)法は大きな進歩を遂げている。
licメソッドは、画像圧縮に不可欠な画像構造とテクスチャコンポーネントを明示的に探索することができない。
原画像の構造とテクスチャに基づいて可視パッチをサンプリングするDA-Maskを提案する。
極めて低ビットレート圧縮のために, lic と lic のエンドツーエンドを統一する最初のフレームワークである, 単純で効果的なマスク付き圧縮モデル (MCM) を提案する。
論文 参考訳(メタデータ) (2023-06-27T15:36:22Z) - {\mu}Split: efficient image decomposition for microscopy data [50.794670705085835]
muSplitは、蛍光顕微鏡画像の文脈で訓練された画像分解のための専用アプローチである。
本稿では,大規模な画像コンテキストのメモリ効率向上を実現するメタアーキテクチャである横型文脈化(LC)を提案する。
muSplitを5つの分解タスクに適用し、1つは合成データセットに、もう4つは実際の顕微鏡データから導出する。
論文 参考訳(メタデータ) (2022-11-23T11:26:24Z) - Iterative Patch Selection for High-Resolution Image Recognition [10.847032625429717]
本稿では,メモリ使用量を入力サイズから分離する単純な手法であるIPSを提案する。
IPSは、最も健全なパッチだけを選択してこれを達成し、画像認識のためのグローバルな表現に集約する。
本手法は,最小のアクセラレータメモリを使用しながら,異なる領域,トレーニング体制,画像サイズにまたがって高い性能を示し,幅広い適用性を有する。
論文 参考訳(メタデータ) (2022-10-24T07:55:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。