論文の概要: The Bare Necessities: Designing Simple, Effective Open-Vocabulary Scene Graphs
- arxiv url: http://arxiv.org/abs/2412.01539v1
- Date: Mon, 02 Dec 2024 14:29:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:42:32.692714
- Title: The Bare Necessities: Designing Simple, Effective Open-Vocabulary Scene Graphs
- Title(参考訳): 基本的な必要性: 単純で効果的なオープン語彙のシーングラフを設計する
- Authors: Christina Kassab, Matías Mattamala, Sacha Morin, Martin Büchner, Abhinav Valada, Liam Paull, Maurice Fallon,
- Abstract要約: 3次元オープンボキャブラリシーングラフ法は, エンボディエージェントの有望な地図表現である。
一般的なシーングラフフレームワークを提案し,画像前処理,特徴融合,特徴選択に着目した3つの研究を行う。
- 参考スコア(独自算出の注目度): 16.600165443997433
- License:
- Abstract: 3D open-vocabulary scene graph methods are a promising map representation for embodied agents, however many current approaches are computationally expensive. In this paper, we reexamine the critical design choices established in previous works to optimize both efficiency and performance. We propose a general scene graph framework and conduct three studies that focus on image pre-processing, feature fusion, and feature selection. Our findings reveal that commonly used image pre-processing techniques provide minimal performance improvement while tripling computation (on a per object view basis). We also show that averaging feature labels across different views significantly degrades performance. We study alternative feature selection strategies that enhance performance without adding unnecessary computational costs. Based on our findings, we introduce a computationally balanced approach for 3D point cloud segmentation with per-object features. The approach matches state-of-the-art classification accuracy while achieving a threefold reduction in computation.
- Abstract(参考訳): 3次元オープンボキャブラリシーングラフ法はエンボディエージェントの有望な地図表現である。
本稿では,従来の作業で確立された重要な設計選択を再検討し,効率と性能の両面を最適化する。
一般的なシーングラフフレームワークを提案し,画像前処理,特徴融合,特徴選択に着目した3つの研究を行う。
この結果から,画像前処理技術は三重項演算処理において(オブジェクトビュー毎に)最小限の性能向上をもたらすことが明らかとなった。
また、異なるビューにまたがる平均的な機能ラベルがパフォーマンスを著しく低下させることを示す。
不要な計算コストを伴わずに性能を向上させる代替機能選択戦略について検討する。
そこで本研究では,物体ごとの3次元クラウドセグメンテーションのための計算的バランスの取れたアプローチを提案する。
この手法は最先端の分類精度と一致し、計算の3倍の削減を実現している。
関連論文リスト
- Visualizing Extensions of Argumentation Frameworks as Layered Graphs [15.793271603711014]
AFを3層グラフレイアウトとして拡張とともに描画する新しい可視化手法を提案する。
我々の技術は、ユーザがより簡単に可視化されたAFを探索し、拡張をよりよく理解し、セマンティクスを計算するためのアルゴリズムを検証するのを支援する。
論文 参考訳(メタデータ) (2024-09-09T09:29:53Z) - Amplify Graph Learning for Recommendation via Sparsity Completion [16.32861024767423]
グラフ学習モデルは、協調フィルタリング(CF)ベースのレコメンデーションシステムに広くデプロイされている。
データ疎度の問題により、元の入力のグラフ構造は潜在的な肯定的な嗜好エッジを欠いている。
AGL-SC(Amplify Graph Learning framework)を提案する。
論文 参考訳(メタデータ) (2024-06-27T08:26:20Z) - VeCAF: Vision-language Collaborative Active Finetuning with Training Objective Awareness [56.87603097348203]
VeCAFはラベルと自然言語アノテーションを使用して、PVMの微調整のためのパラメトリックデータ選択を行う。
VeCAFは微調整の目的を取り入れて重要なデータポイントを選択し、PVMをより高速な収束に向けて効果的に導く。
ImageNetでは、VeCAFは最大3.3倍のトレーニングバッチを使用して、完全な微調整に比べて目標のパフォーマンスに到達する。
論文 参考訳(メタデータ) (2024-01-15T17:28:37Z) - Large-scale Point Cloud Registration Based on Graph Matching
Optimization [30.92028761652611]
アンダーライン最適化に基づくアンダーライングラフアンダーラインマッチングを提案する。
提案手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-02-12T03:29:35Z) - Learning Heuristics for the Maximum Clique Enumeration Problem Using Low
Dimensional Representations [0.0]
本稿では,最大列挙問題の傾きを低減するために,入力グラフのプルーニング処理に学習フレームワークを用いる。
本手法の性能評価において,異なる頂点表現を用いることが果たす役割について検討する。
分類過程において局所的なグラフ特徴を用いることで,特徴の除去過程と組み合わせることで,より正確な結果が得られることが観察された。
論文 参考訳(メタデータ) (2022-10-30T22:04:32Z) - CloudAttention: Efficient Multi-Scale Attention Scheme For 3D Point
Cloud Learning [81.85951026033787]
この作業にトランスフォーマーをセットし、それらを形状分類と部分およびシーンセグメンテーションのための階層的なフレームワークに組み込む。
また、各イテレーションにおけるサンプリングとグループ化を活用して、効率的でダイナミックなグローバルなクロスアテンションを計算します。
提案した階層モデルは,最先端の形状分類を平均精度で達成し,従来のセグメンテーション法と同等の結果を得る。
論文 参考訳(メタデータ) (2022-07-31T21:39:15Z) - GraphCoCo: Graph Complementary Contrastive Learning [65.89743197355722]
グラフコントラスト学習(GCL)は、手作業によるアノテーションの監督なしに、グラフ表現学習(GRL)において有望な性能を示した。
本稿では,この課題に対処するため,グラフココというグラフ補完型コントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2022-03-24T02:58:36Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Revisiting Point Cloud Simplification: A Learnable Feature Preserving
Approach [57.67932970472768]
MeshとPoint Cloudの単純化手法は、3Dモデルの複雑さを低減しつつ、視覚的品質と関連する健全な機能を維持することを目的としている。
そこで本研究では,正解点の標本化を学習し,高速点雲の簡易化手法を提案する。
提案手法は、入力空間から任意のユーザ定義の点数を選択し、視覚的知覚誤差を最小限に抑えるために、その位置を再配置するよう訓練されたグラフニューラルネットワークアーキテクチャに依存する。
論文 参考訳(メタデータ) (2021-09-30T10:23:55Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。