論文の概要: Online Dynamic Goal Recognition in Gym Environments
- arxiv url: http://arxiv.org/abs/2509.23244v1
- Date: Sat, 27 Sep 2025 10:50:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.120125
- Title: Online Dynamic Goal Recognition in Gym Environments
- Title(参考訳): ジャム環境におけるオンライン動的ゴール認識
- Authors: Shamir Matan, Elhadad Osher, Nageris Ben, Mirsky Reuth,
- Abstract要約: ゴール認識(Goal Recognition, GR)は、エージェントが意図する目的を、その行動の部分的な観察から推測するタスクである。
モデルフリーGRの最近の進歩にもかかわらず、ベンチマーク、ドメイン、評価プロトコルの不整合により、この分野は断片化されている。
本稿では,Gym互換環境におけるGRアルゴリズムの開発,評価,比較をサポートする2つの補完的なオープンソースフレームワークであるgr-libsとgr-envsを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Goal Recognition (GR) is the task of inferring an agent's intended goal from partial observations of its behavior, typically in an online and one-shot setting. Despite recent advances in model-free GR, particularly in applications such as human-robot interaction, surveillance, and assistive systems, the field remains fragmented due to inconsistencies in benchmarks, domains, and evaluation protocols. To address this, we introduce gr-libs (https://github.com/MatanShamir1/gr_libs) and gr-envs (https://github.com/MatanShamir1/gr_envs), two complementary open-source frameworks that support the development, evaluation, and comparison of GR algorithms in Gym-compatible environments. gr-libs includes modular implementations of MDP-based GR baselines, diagnostic tools, and evaluation utilities. gr-envs provides a curated suite of environments adapted for dynamic and goal-directed behavior, along with wrappers that ensure compatibility with standard reinforcement learning toolkits. Together, these libraries offer a standardized, extensible, and reproducible platform for advancing GR research. Both packages are open-source and available on GitHub and PyPI.
- Abstract(参考訳): ゴール認識(英: Goal Recognition, GR)とは、エージェントが意図する目的を、通常オンラインとワンショットの環境で、その行動の部分的な観察から推測するタスクである。
近年のモデルフリーGRの進歩、特に人間とロボットの相互作用、監視、補助システムなどの応用にもかかわらず、ベンチマーク、ドメイン、評価プロトコルの不整合により、この分野は断片化されている。
これを解決するために、Gym互換環境におけるGRアルゴリズムの開発、評価、比較をサポートする2つの補完的なオープンソースフレームワークであるgr-libs(https://github.com/MatanShamir1/gr_envs)とgr-envs(https://github.com/MatanShamir1/gr_envs)を紹介します。
gr-libsには、MDPベースのGRベースライン、診断ツール、評価ユーティリティのモジュール化実装が含まれている。
gr-envsは動的およびゴール指向の動作に適応した環境と、標準的な強化学習ツールキットとの互換性を保証するラッパーを提供する。
これらのライブラリは共に、GR研究を進めるための標準化され、拡張可能で再現可能なプラットフォームを提供する。
どちらのパッケージもオープンソースで、GitHubとPyPIで入手できる。
関連論文リスト
- Open-Source Agentic Hybrid RAG Framework for Scientific Literature Review [2.092154729589438]
本稿では,ハイブリッドRAGパイプラインを自律エージェント内にカプセル化するエージェントアプローチを提案する。
当社のパイプラインでは,PubMedやarXiv,Google Scholar APIから,バイオロジカルなオープンアクセスデータを収集しています。
Llama-3.3-70B エージェントが GraphRAG (クエリを Cypher for KG に変換する) または VectorRAG (スパースと高密度検索を組み合わせて再ランク付けする) を選択する
論文 参考訳(メタデータ) (2025-07-30T18:54:15Z) - Generative Recommendation with Semantic IDs: A Practitioner's Handbook [34.25784373770595]
Generative Recommendation (GR) は、従来のモデルと比較して有望なパフォーマンスで注目を集めている。
GRの成功に寄与する重要な要因はセマンティックID(SID)であり、連続的なセマンティック表現を離散IDシーケンスに変換する。
本研究は,モジュール性に特化して設計されたセマンティックID,すなわちGRIDを用いたジェネレーティブレコメンデーションフレームワークを紹介し,オープンソース化する。
論文 参考訳(メタデータ) (2025-07-29T20:41:51Z) - SWE-Bench-CL: Continual Learning for Coding Agents [0.0]
SWE-Bench-CLは、人間検証されたSWE-Bench検証データセット上に構築された、新しい連続学習ベンチマークである。
GitHubのイシューを、自然リポジトリの進化を反映した時系列順序に整理することで、SWE-Bench-CLは、エージェントのエクスペリエンスを蓄積する能力を直接評価できる。
論文 参考訳(メタデータ) (2025-06-13T07:11:14Z) - SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文 参考訳(メタデータ) (2025-05-29T18:28:02Z) - FlashRAG: A Modular Toolkit for Efficient Retrieval-Augmented Generation Research [70.6584488911715]
検索増強世代(RAG)は、かなりの研究関心を集めている。
既存のRAGツールキットは、しばしば重くて柔軟であり、研究者のカスタマイズのニーズを満たすことができない。
我々のツールキットは16の高度なRAGメソッドを実装し、38のベンチマークデータセットを収集し、整理した。
論文 参考訳(メタデータ) (2024-05-22T12:12:40Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Gait Recognition in the Wild: A Large-scale Benchmark and NAS-based
Baseline [95.88825497452716]
歩行ベンチマークにより、研究コミュニティは高性能歩行認識システムの訓練と評価を行うことができる。
GREWは、野生における歩行認識のための最初の大規模データセットである。
SPOSGaitはNASベースの最初の歩行認識モデルである。
論文 参考訳(メタデータ) (2022-05-05T14:57:39Z) - RU-Net: Regularized Unrolling Network for Scene Graph Generation [92.95032610978511]
シーングラフ生成(SGG)は、オブジェクトを検出し、各オブジェクト間の関係を予測することを目的としている。
既存のSGG法は,(1)あいまいな対象表現,2)関係予測の多様性の低下など,いくつかの問題に悩まされることが多い。
両問題に対処する正規化アンローリングネットワーク(RU-Net)を提案する。
論文 参考訳(メタデータ) (2022-05-03T04:21:15Z) - Graph Robustness Benchmark: Benchmarking the Adversarial Robustness of
Graph Machine Learning [24.500868045285287]
グラフに対する敵対的な攻撃は、グラフ機械学習(GML)モデルの堅牢性にとって大きな脅威となっている。
グラフロバストネスベンチマーク(GRB)を用いて,GMLモデルの対向ロバスト性に対する拡張性,統一性,モジュール性,再現性を備えた評価を行う。
論文 参考訳(メタデータ) (2021-11-08T07:55:13Z) - Seeking Similarities over Differences: Similarity-based Domain Alignment
for Adaptive Object Detection [86.98573522894961]
本研究では,Unsupervised Domain Adaptation (UDA) アルゴリズムが検出に使用するコンポーネントを一般化するフレームワークを提案する。
具体的には、最適な設計選択を生かした新しいUDAアルゴリズムViSGAを提案し、インスタンスレベルの特徴を集約する単純だが効果的な方法を提案する。
類似性に基づくグループ化と対角トレーニングの両方により、モデルでは、ゆるやかに整列されたドメインにまたがるすべてのインスタンスにマッチせざるを得ず、機能グループを粗い整列することに集中することが可能であることが示されています。
論文 参考訳(メタデータ) (2021-10-04T13:09:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。