論文の概要: SG-DOR: Learning Scene Graphs with Direction-Conditioned Occlusion Reasoning for Pepper Plants
- arxiv url: http://arxiv.org/abs/2603.06512v1
- Date: Fri, 06 Mar 2026 17:52:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:46.313924
- Title: SG-DOR: Learning Scene Graphs with Direction-Conditioned Occlusion Reasoning for Pepper Plants
- Title(参考訳): SG-DOR:ペッパープラントの方向性決定オクルージョン推論によるシーングラフの学習
- Authors: Rohit Menon, Niklas Mueller-Goldingen, Sicong Pan, Gokul Krishna Chenchani, Maren Bennewitz,
- Abstract要約: SG-DOR(Scene Graphs with Direction-Conditioned Occlusion Reasoning)は,物理アタッチメントをコードするシーングラフを推論するリレーショナルフレームワークである。
そこで,本研究では,各葉の注目度と結合レベルアグリゲーションを考慮した方向性対応グラフニューラルアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 6.249500858124441
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic harvesting in dense crop canopies requires effective interventions that depend not only on geometry, but also on explicit, direction-conditioned relations identifying which organs obstruct a target fruit. We present SG-DOR (Scene Graphs with Direction-Conditioned Occlusion Reasoning), a relational framework that, given instance-segmented organ point clouds, infers a scene graph encoding physical attachments and direction-conditioned occlusion. We introduce an occlusion ranking task for retrieving and ranking candidate leaves for a target fruit and approach direction, and propose a direction-aware graph neural architecture with per-fruit leaf-set attention and union-level aggregation. Experiments on a multi-plant synthetic pepper dataset show improved occlusion prediction (F1=0.73, NDCG@3=0.85) and attachment inference (edge F1=0.83) over strong ablations, yielding a structured relational signal for downstream intervention planning.
- Abstract(参考訳): 密集した作物のキャノピーでのロボット収穫は、幾何学だけでなく、どの臓器が標的の果実を阻害するかを識別する明確な方向条件付き関係にも依存する効果的な介入を必要とする。
本稿では,SG-DOR(Scene Graphs with Direction-Conditioned Occlusion Reasoning)について述べる。
対象とする果実と接近方向の候補葉を検索・ランク付けするオクルージョンランキングタスクを導入し,各葉の注目度と組合レベルの集約度を考慮した方向性対応グラフニューラルアーキテクチャを提案する。
マルチプラント合成唐辛子データセットを用いた実験では、強いアブレーションに対する閉塞予測(F1=0.73, NDCG@3=0.85)と付着推定(エッジF1=0.83)が改善され、下流介入計画のための構造的相関信号が得られた。
関連論文リスト
- Towards a Relationship-Aware Transformer for Tabular Data [0.6882042556551609]
本稿では,アテンション行列に項を追加することで,データポイント間の関係を考慮に入れた改良型アテンション機構に基づくいくつかのソリューションを提案する。
IHDPデータセットの処理効果推定タスクと同様に、合成データセットと実世界のデータセットの回帰タスクにおいて、我々のモデルは互いに比較され、決定ツリーの勾配が増大する。
論文 参考訳(メタデータ) (2025-12-08T08:54:53Z) - Edge-Centric Relational Reasoning for 3D Scene Graph Prediction [74.19580969696898]
3Dシーングラフ予測は、複雑な3D環境をオブジェクトとそのペア関係からなる構造化グラフに抽象化することを目的としている。
既存のアプローチでは、接続されたオブジェクトノードからメッセージを集約することで、関係エッジ機能を反復的に更新するオブジェクト中心のグラフニューラルネットワークが一般的である。
本稿では,オブジェクト認識融合を用いたリンク誘導エッジ中心関係推論フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-19T09:53:56Z) - Youtu-GraphRAG: Vertically Unified Agents for Graph Retrieval-Augmented Complex Reasoning [32.78218766121055]
グラフ検索拡張生成(GraphRAG)は,複雑な推論において,大規模言語モデルを効果的に拡張した。
本稿では,フレームワーク全体を複雑な統合として結合する,垂直に統一されたエージェントパラダイムYoutu-GraphRAGを提案する。
論文 参考訳(メタデータ) (2025-08-27T13:13:20Z) - Open-Vocabulary Octree-Graph for 3D Scene Understanding [54.11828083068082]
Octree-Graphはオープンな3Dシーン理解のための新しいシーン表現である。
セマンティクスを記憶し、その形状に応じてオブジェクトの占有度を調節するアダプティブ・オクツリー構造を開発する。
論文 参考訳(メタデータ) (2024-11-25T10:14:10Z) - Graph Transformer GANs with Graph Masked Modeling for Architectural
Layout Generation [153.92387500677023]
本稿では,グラフノード関係を効果的に学習するために,GTGAN(Graph Transformer Generative Adversarial Network)を提案する。
提案したグラフ変換器エンコーダは、局所的およびグローバルな相互作用をモデル化するために、Transformer内のグラフ畳み込みと自己アテンションを組み合わせる。
また,グラフ表現学習のための自己指導型事前学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-15T14:36:38Z) - Self-Supervised Relation Alignment for Scene Graph Generation [44.3983804479146]
シーングラフ生成性能を改善するために,自己教師付きリレーショナルアライメントの正規化を導入する。
提案されたアライメントは一般的なもので、既存のシーングラフ生成フレームワークと組み合わせることができる。
本稿では,この自己教師付きリレーショナルアライメントと2つのシーングラフ生成アーキテクチャの有効性について述べる。
論文 参考訳(メタデータ) (2023-02-02T20:34:13Z) - Distance-aware Molecule Graph Attention Network for Drug-Target Binding
Affinity Prediction [54.93890176891602]
薬物標的結合親和性予測に適したDiStance-aware Molecule graph Attention Network (S-MAN)を提案する。
そこで,我々はまず,構築したポケットリガンドグラフに位相構造と空間位置情報を統合する位置符号化機構を提案する。
また,エッジレベルアグリゲーションとノードレベルアグリゲーションを有するエッジノード階層的アグリゲーション構造を提案する。
論文 参考訳(メタデータ) (2020-12-17T17:44:01Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。