論文の概要: Predicate Hierarchies Improve Few-Shot State Classification
- arxiv url: http://arxiv.org/abs/2502.12481v1
- Date: Tue, 18 Feb 2025 03:08:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-19 14:09:09.535183
- Title: Predicate Hierarchies Improve Few-Shot State Classification
- Title(参考訳): 述語階層がFew-Shot状態分類を改善した
- Authors: Emily Jin, Joy Hsu, Jiajun Wu,
- Abstract要約: PHIERはオブジェクト中心のシーンエンコーダであり、述語間の意味的関係を推測する自己監督的損失と階層構造を捉える双曲距離メートル法である。
CALVIN と BEHAVIOR のロボット環境における PHIER の評価を行い,PHIER が既存手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 12.683069420087962
- License:
- Abstract: State classification of objects and their relations is core to many long-horizon tasks, particularly in robot planning and manipulation. However, the combinatorial explosion of possible object-predicate combinations, coupled with the need to adapt to novel real-world environments, makes it a desideratum for state classification models to generalize to novel queries with few examples. To this end, we propose PHIER, which leverages predicate hierarchies to generalize effectively in few-shot scenarios. PHIER uses an object-centric scene encoder, self-supervised losses that infer semantic relations between predicates, and a hyperbolic distance metric that captures hierarchical structure; it learns a structured latent space of image-predicate pairs that guides reasoning over state classification queries. We evaluate PHIER in the CALVIN and BEHAVIOR robotic environments and show that PHIER significantly outperforms existing methods in few-shot, out-of-distribution state classification, and demonstrates strong zero- and few-shot generalization from simulated to real-world tasks. Our results demonstrate that leveraging predicate hierarchies improves performance on state classification tasks with limited data.
- Abstract(参考訳): オブジェクトの状態分類とその関係性は、特にロボットの計画と操作において、多くの長期的タスクの中核となる。
しかし、オブジェクト-述語の組み合わせの組合せ爆発は、新しい現実世界環境への適応の必要性と相まって、いくつかの例で新しいクエリに一般化するための状態分類モデルのデシラタムとなっている。
この目的のために,述語階層を活用して,数ショットのシナリオで効果的に一般化するPHIERを提案する。
PHIERは、オブジェクト中心のシーンエンコーダ、述語間の意味的関係を推論する自己監督的損失、階層構造をキャプチャする双曲距離メートル法を使用し、状態分類クエリの推論を導く画像述語対の構造的潜在空間を学習する。
CALVIN と BEHAVIOR のロボット環境における PHIER の評価を行い,PHIER が実世界のタスクをシミュレートしたゼロ・ノー・ディストリビューション状態の分類において,既存の手法を著しく上回っていることを示す。
その結果、述語階層の活用により、限られたデータによる状態分類タスクの性能が向上することを示した。
関連論文リスト
- From Logits to Hierarchies: Hierarchical Clustering made Simple [16.132657141993548]
事前訓練された非階層クラスタリングモデル上に実装された軽量なプロシージャは、階層クラスタリングに特化して設計されたモデルより優れていることを示す。
提案手法は,微調整を必要とせず,ログを出力する事前学習クラスタリングモデルに適用可能である。
論文 参考訳(メタデータ) (2024-10-10T12:27:45Z) - Coherent Entity Disambiguation via Modeling Topic and Categorical
Dependency [87.16283281290053]
従来のエンティティ曖昧化(ED)メソッドは、参照コンテキストと候補エンティティの一致するスコアに基づいて予測を行う、識別パラダイムを採用している。
本稿では,エンティティ予測のコヒーレンス向上を目的とした新しいデザインを備えたEDシステムであるCoherentedを提案する。
我々は、人気EDベンチマークにおいて、平均1.3F1ポイントの改善により、最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-11-06T16:40:13Z) - Prototype-based Embedding Network for Scene Graph Generation [105.97836135784794]
現在のシーングラフ生成(SGG)手法は、コンテキスト情報を探索し、エンティティペア間の関係を予測する。
被写体と対象物の組み合わせが多様であるため、各述語カテゴリーには大きなクラス内変異が存在する。
プロトタイプベースのEmbedding Network (PE-Net) は、エンティティ/述語を、プロトタイプに準拠したコンパクトで独特な表現でモデル化する。
PLは、PE-Netがそのようなエンティティ述語マッチングを効率的に学習するのを助けるために導入され、不明瞭なエンティティ述語マッチングを緩和するためにプロトタイプ正規化(PR)が考案されている。
論文 参考訳(メタデータ) (2023-03-13T13:30:59Z) - Hierarchical Relationships: A New Perspective to Enhance Scene Graph
Generation [8.28849026314542]
本稿では,ラベル間の階層構造を関係やオブジェクトに活用することにより,シーングラフ生成システムの性能を大幅に向上させることができることを示す。
一対のオブジェクトインスタンス間の関係のスーパーカテゴリを共同で予測するために、ベイズ予測ヘッドを導入する。
Visual Genomeデータセットの実験は、特に述語分類とゼロショット設定において、その強力なパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-03-13T04:16:42Z) - SLOTH: Structured Learning and Task-based Optimization for Time Series
Forecasting on Hierarchies [16.12477042879166]
階層時系列(HTS)予測には2つのサブタスク、すなわち予測と和解が含まれる。
本稿では,トップダウン・コンボリューションとボトムアップ・アテンション(ボトムアップ・アテンション)という,新しいツリーベース機能統合機構を提案する。
強い仮定を頼りにするか、一貫性のある制約のみにフォーカスする従来の和解法とは異なり、我々はディープ・ニューラル・オプティマイゼーション・ネットワークを利用する。
論文 参考訳(メタデータ) (2023-02-11T10:50:33Z) - HIER: Metric Learning Beyond Class Labels via Hierarchical
Regularization [17.575016642108253]
我々は、トレーニングデータの潜在意味階層を見つけるためにHIERと呼ばれる新しい正規化手法を提案する。
HIERはこの目的を意味階層のアノテーションなしで達成し、双曲空間における階層的プロキシを学習する。
論文 参考訳(メタデータ) (2022-12-29T11:05:47Z) - Weakly-supervised Action Localization via Hierarchical Mining [76.00021423700497]
弱教師付きアクションローカライゼーションは、ビデオレベルの分類ラベルだけで、与えられたビデオ内のアクションインスタンスを時間的にローカライズし、分類することを目的としている。
ビデオレベルおよびスニペットレベルでの階層的マイニング戦略,すなわち階層的監視と階層的一貫性マイニングを提案する。
我々は、HiM-NetがTHUMOS14とActivityNet1.3データセットの既存の手法よりも、階層的に監督と一貫性をマイニングすることで、大きなマージンを持つことを示す。
論文 参考訳(メタデータ) (2022-06-22T12:19:09Z) - Modeling Heterogeneous Hierarchies with Relation-specific Hyperbolic
Cones [64.75766944882389]
知識グラフにおける複数の階層的および非階層的関係を同時にモデル化できるKG埋め込みモデルであるConE(Cone Embedding)を提案する。
特に、ConEは双曲埋め込み空間の異なる部分空間における円錐包含制約を用いて、複数の異種階層をキャプチャする。
我々のアプローチでは、WN18RRで45.3%、DDB14で16.1%の新しい最先端hits@1が得られる(0.231 MRR)。
論文 参考訳(メタデータ) (2021-10-28T07:16:08Z) - HRKD: Hierarchical Relational Knowledge Distillation for Cross-domain
Language Model Compression [53.90578309960526]
大規模事前学習言語モデル(PLM)は、従来のニューラルネットワーク手法と比較して圧倒的な性能を示している。
階層的および領域的関係情報の両方を抽出する階層的関係知識蒸留法(HRKD)を提案する。
論文 参考訳(メタデータ) (2021-10-16T11:23:02Z) - Automated Concatenation of Embeddings for Structured Prediction [75.44925576268052]
本稿では, 埋め込みの自動結合(ACE)を提案し, 構造予測タスクにおける埋め込みのより優れた結合を見つけるプロセスを自動化する。
我々は、強化学習の戦略に従い、制御器のパラメータを最適化し、タスクモデルの精度に基づいて報酬を計算する。
論文 参考訳(メタデータ) (2020-10-10T14:03:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。