論文の概要: QAL: A Loss for Recall Precision Balance in 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2511.17824v1
- Date: Fri, 21 Nov 2025 22:38:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.45334
- Title: QAL: A Loss for Recall Precision Balance in 3D Reconstruction
- Title(参考訳): QAL:3D再構築における精度バランスのリコールの損失
- Authors: Pranay Meshram, Yash Turkar, Kartikeya Singh, Praveen Raj Masilamani, Charuvahan Adhivarahan, Karthik Dantu,
- Abstract要約: QAL(Quality-Aware Loss)は、CD(Chamfer Distance)やEMD(Earth Mover's Distance)の代替品である。
多様なパイプライン全体にわたって、QALは、CDよりも平均+4.3 pts、最高の選択肢よりも+2.8 ptsの改善により、一貫したカバレッジ向上を達成する。
したがって、QALはロバストな3Dビジョンと安全クリティカルなロボティクスパイプラインに対して、原則的で解釈可能で実践的な目標を提供する。
- 参考スコア(独自算出の注目度): 7.312102608202918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Volumetric learning underpins many 3D vision tasks such as completion, reconstruction, and mesh generation, yet training objectives still rely on Chamfer Distance (CD) or Earth Mover's Distance (EMD), which fail to balance recall and precision. We propose Quality-Aware Loss (QAL), a drop-in replacement for CD/EMD that combines a coverage-weighted nearest-neighbor term with an uncovered-ground-truth attraction term, explicitly decoupling recall and precision into tunable components. Across diverse pipelines, QAL achieves consistent coverage gains, improving by an average of +4.3 pts over CD and +2.8 pts over the best alternatives. Though modest in percentage, these improvements reliably recover thin structures and under-represented regions that CD/EMD overlook. Extensive ablations confirm stable performance across hyperparameters and across output resolutions, while full retraining on PCN and ShapeNet demonstrates generalization across datasets and backbones. Moreover, QAL-trained completions yield higher grasp scores under GraspNet evaluation, showing that improved coverage translates directly into more reliable robotic manipulation. QAL thus offers a principled, interpretable, and practical objective for robust 3D vision and safety-critical robotics pipelines
- Abstract(参考訳): ボリュームラーニングは、完成、再構築、メッシュ生成などの多くの3D視覚タスクを支えているが、トレーニングの目的は依然としてチャンファー距離(CD)やアースマーバー距離(EMD)に依存しており、リコールと精度のバランスが取れない。
そこで我々は,CD/EMDの代替品であるQALを提案する。CD/EMDは,カバー重み付き最寄りの用語と,未発見の地味なアトラクション項を組み合わせ,リコールと精度をチューナブルなコンポーネントに明示的に分離する。
多様なパイプライン全体にわたって、QALは、CDよりも平均+4.3 pts、最高の選択肢よりも+2.8 ptsの改善により、一貫したカバレッジ向上を達成する。
パーセンテージは穏やかだが、これらの改善はCD/EMDが見落としている薄い構造や低表現領域を確実に回復させる。
PCNとShapeNetのフルリトレーニングは、データセットとバックボーン間の一般化を実証している。
さらに、QAL訓練完了は、GraspNet評価の下でより高い把握スコアを獲得し、改善されたカバレッジが、より信頼性の高いロボット操作に変換されることを示す。
そこでQALは、ロバストな3Dビジョンと安全クリティカルなロボティクスパイプラインのための原則的、解釈可能、実用的目的を提供する。
関連論文リスト
- Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - Skeleton-based Robust Registration Framework for Corrupted 3D Point Clouds [9.35371718596906]
実世界の点雲は、しばしばセンサーの制限、環境騒音、前処理エラーによって影響を受ける。
既存の登録方法は直接点マッチングや表面特徴抽出に依存しており、これはこれらの汚職に非常に影響を受けやすい。
スケルトンベースのロバストな登録フレームワークが紹介され、レジリエントな骨格表現を導入し、レジストネスと精度を向上させる。
論文 参考訳(メタデータ) (2025-09-29T04:31:47Z) - Adaptive Federated Learning Defences via Trust-Aware Deep Q-Networks [1.5374297736981706]
フェデレート学習は、部分的に観察可能な状態での中毒やバックドア攻撃に対して脆弱である。
我々は、クライアントの信頼更新に多信号の証拠を統合する、信頼を意識したディープQネットワークを導入する。
論文 参考訳(メタデータ) (2025-09-25T13:30:09Z) - Unveiling the Mist over 3D Vision-Language Understanding: Object-centric Evaluation with Chain-of-Analysis [65.42684641776931]
3Dビジョン言語(3D-VL)ベンチマークは、3D-VLモデルの評価に不足している。
我々は3D-VLグラウンドとQAタスクのベンチマークであるBeacon3Dを提案する。
論文 参考訳(メタデータ) (2025-03-28T13:32:29Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [59.13757801286343]
クラス増分学習(class-incremental learning)は、モデルが限られたデータで漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
本稿では,特徴空間の不整合のための冗長特徴除去器 (RFE) と,重要な雑音に対する空間ノイズ補償器 (SNC) の2つの新しいコンポーネントを備えたFILP-3Dフレームワークを紹介する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - CALICO: Self-Supervised Camera-LiDAR Contrastive Pre-training for BEV
Perception [32.91233926771015]
CALICOは、LiDARとカメラバックボーンの両方に対照的な目的を適用する新しいフレームワークである。
我々のフレームワークは、異なるバックボーンとヘッドに合わせることができ、マルチモーダルなBEV知覚のための有望なアプローチとして位置づけられる。
論文 参考訳(メタデータ) (2023-06-01T05:06:56Z) - 3DSGrasp: 3D Shape-Completion for Robotic Grasp [81.1638620745356]
オブジェクトの完全な3Dポイントクラウドデータ(PCD)が利用可能であれば、現実のロボットの把握は堅牢に行うことができる。
実際に、PCDは、握る動作の前に、オブジェクトがほとんど見ていない、そしてまばらな視点から見られているとき、しばしば不完全である。
そこで我々は3DSGraspという新しい把握戦略を提案する。これは部分的なPCDから欠落した幾何を予測し、信頼性の高い把握ポーズを生成する。
論文 参考訳(メタデータ) (2023-01-02T20:23:05Z) - From 2D to 3D: Re-thinking Benchmarking of Monocular Depth Prediction [80.67873933010783]
我々は,MDPが現在,3Dアプリケーションにおける予測の有用性を評価するのに有効な指標に頼っていることを論じる。
これにより、2Dベースの距離を最適化するのではなく、シーンの3D構造を正確に認識し、推定に向けて改善する新しい手法の設計と開発が制限される。
本稿では,MDP手法の3次元幾何評価に適した指標セットと,提案手法に不可欠な室内ベンチマークRIO-D3Dを提案する。
論文 参考訳(メタデータ) (2022-03-15T17:50:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。