論文の概要: Differentiable Packing of Irregular 3D Objects with Adaptive Container Estimation
- arxiv url: http://arxiv.org/abs/2606.16333v1
- Date: Mon, 15 Jun 2026 07:36:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.153229
- Title: Differentiable Packing of Irregular 3D Objects with Adaptive Container Estimation
- Title(参考訳): 適応型コンテナ推定による不規則な3次元物体の異種包装
- Authors: Palak Gupta, Shanmuganathan Raman,
- Abstract要約: 6Nオブジェクトのポーズパラメータと,1つの勾配に基づくループ内の3つのコンテナ側の長さを共同で最適化する,微分可能なパッキングフレームワークを提案する。
パイプラインはPythonとPyTorchで実装されており、物理エンジン、FFTライブラリ、凸分解はない。
複数のオブジェクトカテゴリに対して、単一のコンシューマGPU上でインスタンス毎に4分未満で実行しながら、タイムマッチングDBLFよりも11~32%小さく、N=100でベースラインをシミュレート・アニールするコンテナを生成する。
- 参考スコア(独自算出の注目度): 9.846019918325357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most existing approaches either fix the container in advance or optimize only a single container dimension through an outer search loop, leaving the remaining dimensions as a manual tuning problem. We present a differentiable packing framework that jointly optimizes all 6N object pose parameters and all three container side lengths inside a single gradient-based loop. The formulation combines six physics-inspired, differentiable loss terms computed directly on triangle meshes through axis-aligned bounding-box proxies. An adaptive squeezing mechanism periodically tightens the container whenever the overlap loss falls below a pair-count-scaled threshold, producing a large initial drop in container volume, followed by small refinements. All pairwise computations are written in tensor-broadcasting form, giving a 3.4 to 54 times speedup over a reference loop-based implementation. The pipeline is implemented in Python and PyTorch, with no physics engine, FFT library, or convex decomposition. On multiple object categories, the method produces containers that are 11 to 32 percent smaller than time-matched DBLF and simulated-annealing baselines at N =100, while running in under 4 minutes per instance on a single consumer GPU.
- Abstract(参考訳): 既存のほとんどのアプローチは、事前にコンテナを修正するか、外部のサーチループを通じて単一のコンテナ次元だけを最適化し、残りの次元を手動のチューニング問題として残す。
6Nオブジェクトのポーズパラメータと3つのコンテナ側の長さを1つの勾配ベースのループ内で共同で最適化する、微分可能なパッキングフレームワークを提案する。
定式化は、6つの物理に着想を得た微分可能な損失項を、軸方向のバウンディングボックスプロキシを通して三角形メッシュ上で直接計算する。
アダプティブ・スクイーズ機構は、オーバーラップ損失が対数スケールの閾値以下になると容器を周期的に締め付け、コンテナ容積が大幅に低下し、その後、小さな改善がなされる。
すべてのペアワイズ計算はテンソルブロードキャスト形式で書かれており、参照ループベースの実装よりも3.4倍から54倍のスピードアップが得られる。
パイプラインはPythonとPyTorchで実装されており、物理エンジン、FFTライブラリ、凸分解はない。
複数のオブジェクトカテゴリに対して、単一のコンシューマGPU上でインスタンス毎に4分未満で実行しながら、タイムマッチングDBLFよりも11~32%小さく、N=100でベースラインをシミュレート・アニールするコンテナを生成する。
関連論文リスト
- Surflo: Consistent 3D Surface Flow Model with Global State [57.57234680235885]
Surfloは、方向付けられた3次元表面点を、ノイズからフローマッチングを通じて独立して表面へ輸送することでデコードする。
独立なポイント単位の復号化に固有の局所的不整合を抑制するために、光度勾配を注入することにより、推定時間誘導項が近傍の点と相関する。
Surfloは、サーフェスメトリクスのフィードフォワードベースラインにマッチし、数百のビューを必要とする最適化ベースのメソッドよりも桁違いに高速に動作し、グローバルなラテントと任意の解像度のデコーディングを組み合わせた唯一のフィードフォワードアプローチである。
論文 参考訳(メタデータ) (2026-06-11T17:48:38Z) - Closed-Form Spectral Regularization for Multi-Task Model Merging [96.82449201305234]
モデルマージは、個別に調整された複数の専門家をトレーニングデータなしで単一のマルチタスクモデルに結合する。
State-of-the-art merging method formulate merging as a layer-wise interference problem。
本稿では,逐次降下の勾配-流路に一致するソフト指数フィルタを組み合わせた閉形式手法SWUDIを提案する。
論文 参考訳(メタデータ) (2026-06-05T14:00:47Z) - CART: Context-Anchored Recurrent Transformer -- A Parameter-Efficient Architecture with Learned Stability [0.0]
CART(Context-Anchored Recurrent Transformer)は、パラメータ効率のよい言語モデルで、1つの共有コアブロックをR倍の深さで再利用する。
我々は1つのコンシューマGPU上でCARTを2段階に分けて評価した: 64-configuration screen at 3,000 steps, then 36 configurations (P=6, R in 6,8,10, three seed) training for 30500 steps (1B tokens)。
256,512,768,1024: 事前深さPはループ数Rを支配し、Rのステージ1ランクはフルトレーニング時に逆になる(R=6は最高になる)。
論文 参考訳(メタデータ) (2026-05-31T23:26:27Z) - DeepShapeMatchingKit: Accelerated Functional Map Solver and Shape Matching Pipelines Revisited [48.627686484608525]
標準関数写像実装は、高スペクトル分解能の計算ボトルネックである k 個の独立線型系を直列に解く。
本稿では,最大33倍の高速化を達成し,すべてのシステムを単一カーネルコールで解くベクトル化再構成を提案する。
我々は、これらの改善を取り入れたオープンソースのDeepShapeMatchingKitを紹介し、共通の深部形状マッチング方法のためのトレーニング、評価、データパイプラインを標準化する。
論文 参考訳(メタデータ) (2026-04-11T23:15:07Z) - Fast Log-Domain Sinkhorn Optimal Transport with Warp-Level GPU Reductions [1.6679662639178268]
我々は、log-domain Sinkhornアルゴリズムの軽量でネイティブな実装であるFastSinkhornを提案する。
我々の解法はログドメインで完全に動作し、標準ドメインメソッドが失敗するepsilon = 10-4のように、正規化パラメータの計算を可能にする。
画像色変換, 3次元点雲マッチング, 収束解析について検証し, 注意深い数値処理を施したネイティブカーネルが, 大規模最適輸送のための実用的で効率的な基盤となることを示した。
論文 参考訳(メタデータ) (2026-04-04T16:06:27Z) - Scalable Mean-Variance Portfolio Optimization via Subspace Embeddings and GPU-Friendly Nesterov-Accelerated Projected Gradient [0.17188280334580197]
我々は,GPUアクセラレーションを備えたスケッチベース因子削減法とNesterov加速投影勾配アルゴリズム(NPGA)を開発した。
実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間・実時間
論文 参考訳(メタデータ) (2026-04-03T09:35:05Z) - Breaking the Memory Barrier: Near Infinite Batch Size Scaling for Contrastive Loss [59.835032408496545]
本稿では, コントラスト損失計算を任意の小ブロックに分割するタイルベースの戦略を提案する。
分散システムの階層構造を活用するためのマルチレベルタイリング戦略も導入する。
SOTAメモリ効率のソリューションと比較すると、同等の速度を維持しながら、メモリの2桁の削減を実現している。
論文 参考訳(メタデータ) (2024-10-22T17:59:30Z) - Dynamic Convolution for 3D Point Cloud Instance Segmentation [146.7971476424351]
動的畳み込みに基づく3次元点雲からのインスタンスセグメンテーション手法を提案する。
我々は、同じ意味圏と閉投票を持つ等質点を幾何学的遠近点に対して収集する。
提案手法は提案不要であり、代わりに各インスタンスの空間的および意味的特性に適応する畳み込みプロセスを利用する。
論文 参考訳(メタデータ) (2021-07-18T09:05:16Z) - Displacement-Invariant Cost Computation for Efficient Stereo Matching [122.94051630000934]
ディープラーニング手法は、前例のない不一致の精度を得ることによって、ステレオマッチングのリーダーボードを支配してきた。
しかし、その推測時間は一般的に540p画像の秒数で遅い。
本研究では,4次元特徴量を必要としないEmphdisplacement-invariant cost moduleを提案する。
論文 参考訳(メタデータ) (2020-12-01T23:58:16Z) - Generalized Pose-and-Scale Estimation using 4-Point Congruence
Constraints [5.063728016437489]
gP4Pcは、一般的なカメラの絶対的なポーズを、対応する4つの3Dポイント・アンド・レイペアから未知の内部スケールで計算する新しい方法である。
実データと合成データを用いた実験により,gP4PcはSACRANフレームワーク内での使用時の総実行時間において最速の手法であることが示された。
論文 参考訳(メタデータ) (2020-11-27T16:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。