論文の概要: YOLOA: Real-Time Affordance Detection via LLM Adapter
- arxiv url: http://arxiv.org/abs/2512.03418v1
- Date: Wed, 03 Dec 2025 03:53:31 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 12:04:47.017275
- Title: YOLOA: Real-Time Affordance Detection via LLM Adapter
- Title(参考訳): YOLOA:LLMアダプタによるリアルタイムアフォーダンス検出
- Authors: Yuqi Ji, Junjie Ke, Lihuo He, Jun Liu, Kaifan Zhang, Yu-Kun Lai, Guiguang Ding, Xinbo Gao,
- Abstract要約: Affordance Detectionは、インボディードAIにおける基本的な"ハウツーハウ"の課題に共同で対処することを目的としている。
本稿では、オブジェクト検出と空き学習を協調的に扱うリアルタイムな空き検出モデルであるYOLO Affordance(YOLOA)を紹介する。
ADG-Det と IIT-Heat のベンチマーク実験により,YOLOA がリアルタイム性能を維持しながら最先端の精度を実現していることが示された。
- 参考スコア(独自算出の注目度): 96.61111291833544
- License:
- Abstract: Affordance detection aims to jointly address the fundamental "what-where-how" challenge in embodied AI by understanding "what" an object is, "where" the object is located, and "how" it can be used. However, most affordance learning methods focus solely on "how" objects can be used while neglecting the "what" and "where" aspects. Other affordance detection methods treat object detection and affordance learning as two independent tasks, lacking effective interaction and real-time capability. To overcome these limitations, we introduce YOLO Affordance (YOLOA), a real-time affordance detection model that jointly handles these two tasks via a large language model (LLM) adapter. Specifically, YOLOA employs a lightweight detector consisting of object detection and affordance learning branches refined through the LLM Adapter. During training, the LLM Adapter interacts with object and affordance preliminary predictions to refine both branches by generating more accurate class priors, box offsets, and affordance gates. Experiments on our relabeled ADG-Det and IIT-Heat benchmarks demonstrate that YOLOA achieves state-of-the-art accuracy (52.8 / 73.1 mAP on ADG-Det / IIT-Heat) while maintaining real-time performance (up to 89.77 FPS, and up to 846.24 FPS for the lightweight variant). This indicates that YOLOA achieves an excellent trade-off between accuracy and efficiency.
- Abstract(参考訳): Affordance Detectionは、オブジェクトが何であるか、オブジェクトがどこにあるか、どのように使用できるかを理解することで、AIの基本的な「ハウツーハウ」課題に共同で取り組むことを目的としている。
しかし、ほとんどの手頃な学習手法は、"What"や"where"の側面を無視しながら、"How"オブジェクトの使用にのみ焦点をあてている。
その他のアベイランス検出方法は、オブジェクト検出とアベイランス学習を2つの独立したタスクとして扱い、効果的な相互作用とリアルタイム能力に欠ける。
これらの制約を克服するために,大規模な言語モデル (LLM) アダプタを用いて,これらの2つのタスクを協調的に処理するリアルタイムアベイランス検出モデル YOLOA を導入する。
特にYOLOAは、LLMアダプタで改良されたオブジェクト検出と余剰学習のブランチからなる軽量検出器を使用している。
訓練中、LLMアダプタはオブジェクトおよび余剰予備予測と相互作用し、より正確なクラスの事前値、ボックスオフセット、余剰ゲートを生成することによって両方の分岐を洗練させる。
ADG-Det と IIT-Heat ベンチマークの実験では、YOLOA がリアルタイム性能を維持しながら最先端の精度(ADG-Det / IIT-Heat では52.8 / 73.1 mAP )を達成することを示した(最大89.77 FPS、軽量版では 846.24 FPS まで)。
これは、YOLOAが精度と効率の優れたトレードオフを達成していることを示している。
関連論文リスト
- Teach YOLO to Remember: A Self-Distillation Approach for Continual Object Detection [5.6148728159802035]
YOLOのようなリアルタイムオブジェクト検出器は、複数のエポックのための大規模なデータセットでトレーニングされた場合、例外的なパフォーマンスを達成する。
データが徐々に到着する現実のシナリオでは、ニューラルネットワークは破滅的な忘れに苦しむ。
YOLOを用いた連続物体検出に適した自己蒸留法であるYOLO LwFを紹介する。
論文 参考訳(メタデータ) (2025-03-06T18:31:41Z) - CLDA-YOLO: Visual Contrastive Learning Based Domain Adaptive YOLO Detector [10.419327930845922]
非教師付きドメイン適応(UDA)アルゴリズムは、ドメインシフトの条件下でオブジェクト検出器の性能を著しく向上させることができる。
視覚コントラスト学習(CLDA-YOLO)に基づく教師なし領域適応型YOLO検出器を提案する。
論文 参考訳(メタデータ) (2024-12-16T14:25:52Z) - YOLO-World: Real-Time Open-Vocabulary Object Detection [87.08732047660058]
オープン語彙検出機能でYOLOを強化する革新的なアプローチであるYOLO-Worldを紹介する。
提案手法は,ゼロショット方式で広範囲の物体を高効率で検出する。
YOLO-WorldはV100上で52.0 FPSの35.4 APを達成した。
論文 参考訳(メタデータ) (2024-01-30T18:59:38Z) - YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [63.36722419180875]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。
私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。
私たちの作業は、他のYOLOモデルのプラグイン・アンド・プレイモジュールとしても機能します。
論文 参考訳(メタデータ) (2023-08-10T10:12:27Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。