論文の概要: Inaugural MOASEI Competition at AAMAS'2025: A Technical Report
- arxiv url: http://arxiv.org/abs/2507.05469v1
- Date: Mon, 07 Jul 2025 20:44:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.341877
- Title: Inaugural MOASEI Competition at AAMAS'2025: A Technical Report
- Title(参考訳): AAMAS'2025第1回MOASEIコンペティション報告
- Authors: Ceferino Patino, Tyler J. Billings, Alireza Saleh Abadi, Daniel Redder, Adam Eck, Prashant Doshi, Leen-Kiat Soh,
- Abstract要約: オープンエージェントシステム評価イニシアチブ(MOASEI)の取り組み
オープンワールド条件下での意思決定を評価するために設計された競争。
国際機関の11チームが参加した。
- 参考スコア(独自算出の注目度): 4.844601520960333
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the Methods for Open Agent Systems Evaluation Initiative (MOASEI) Competition, a multi-agent AI benchmarking event designed to evaluate decision-making under open-world conditions. Built on the free-range-zoo environment suite, MOASEI introduced dynamic, partially observable domains with agent and task openness--settings where entities may appear, disappear, or change behavior over time. The 2025 competition featured three tracks--Wildfire, Rideshare, and Cybersecurity--each highlighting distinct dimensions of openness and coordination complexity. Eleven teams from international institutions participated, with four of those teams submitting diverse solutions including graph neural networks, convolutional architectures, predictive modeling, and large language model--driven meta--optimization. Evaluation metrics centered on expected utility, robustness to perturbations, and responsiveness to environmental change. The results reveal promising strategies for generalization and adaptation in open environments, offering both empirical insight and infrastructure for future research. This report details the competition's design, findings, and contributions to the open-agent systems research community.
- Abstract(参考訳): オープン・エージェント・システム評価イニシアチブ(MOASEI)コンペティション(Mess for Open Agent Systems Evaluation Initiative)は,オープン・ワールド条件下での意思決定の評価を目的としたマルチエージェントAIベンチマークイベントである。
フリーレンジ動物園環境スイート上に構築されたMOASEIは、エージェントとタスクのオープン性を備えた動的で部分的に観測可能なドメインを導入した。エンティティの出現、消失、時間とともに振る舞いを変えることができる。2025年のコンペティションには、Wildfire、Rideshare、Cybersecurityの3つのトラックが特徴的だった。11の国際機関のチームが参加し、グラフニューラルネットワーク、畳み込みアーキテクチャ、予測モデリング、大規模言語モデル駆動のメタ最適化など、さまざまなソリューションを提出した。
評価指標は、期待される実用性、摂動に対する堅牢性、環境変化に対する応答性を中心にした。
その結果、オープン環境における一般化と適応のための有望な戦略が明らかとなり、将来の研究に実証的な洞察とインフラが提供される。
本報告では,オープンエージェントシステム研究コミュニティへのコンペティションの設計,発見,コントリビューションについて詳述する。
関連論文リスト
- Agentic LLM Framework for Adaptive Decision Discourse [2.4919169815423743]
本研究では,実世界のエージェント型大規模言語モデル(LLM)フレームワークを紹介する。
従来の意思決定支援ツールとは異なり、このフレームワークは対話、トレードオフ探索、エージェント間の相互作用によって生成される創発的なシナジーを強調している。
その結果、第1次探索がいかに堅牢で公平なレコメンデーションパスを育むかが明らかとなった。
論文 参考訳(メタデータ) (2025-02-16T03:46:37Z) - Factorised Active Inference for Strategic Multi-Agent Interactions [1.9389881806157316]
この目的に2つの補完的アプローチを組み込むことができる。
アクティブ推論フレームワーク(AIF)は、エージェントが環境内の信念や行動に適応するために生成モデルをどのように利用するかを記述する。
ゲーム理論は、潜在的に競合する目的を持つエージェント間の戦略的相互作用を定式化する。
本稿では,各エージェントが他のエージェントの内部状態に対する明示的かつ個別的な信念を維持し,それらを共同で戦略的計画に利用する生成モデルの因子化を提案する。
論文 参考訳(メタデータ) (2024-11-11T21:04:43Z) - Unifying Perspectives: Plausible Counterfactual Explanations on Global, Group-wise, and Local Levels [2.494108084558292]
本稿では,微分可能なモデルに対する勾配に基づく最適化手法を提案する。
インスタンスグループ化と逆ファクト生成を1つの効率的なプロセスに組み合わせることで,GWCF生成を特に強化する。
本研究は, グループ粒度を最適化しつつ, 妥当性, 近接性, 妥当性のバランスをとる方法の有効性を示すものである。
論文 参考訳(メタデータ) (2024-05-27T20:32:09Z) - Compete and Compose: Learning Independent Mechanisms for Modular World Models [57.94106862271727]
異なる環境における再利用可能な独立したメカニズムを活用するモジュール型世界モデルであるCOMETを提案する。
COMETは、コンペティションとコンポジションという2段階のプロセスを通じて、動的に変化する複数の環境でトレーニングされている。
COMETは,従来のファインタニング手法に比べて,サンプル効率が向上し,多様なオブジェクト数で新しい環境に適応できることを示す。
論文 参考訳(メタデータ) (2024-04-23T15:03:37Z) - Object Detectors in the Open Environment: Challenges, Solutions, and Outlook [95.3317059617271]
オープン環境のダイナミックで複雑な性質は、オブジェクト検出器に新しくて恐ろしい挑戦をもたらす。
本稿では,オープン環境におけるオブジェクト検出器の総合的なレビューと解析を行う。
データ/ターゲットの変化の次元に基づいて、4つの四分法(ドメイン外、カテゴリ外、堅牢な学習、漸進的な学習)を含むフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-24T19:32:39Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Benchmarking Robustness and Generalization in Multi-Agent Systems: A
Case Study on Neural MMO [50.58083807719749]
IJCAI 2022で開催されている第2回Neural MMOチャレンジの結果を報告する。
この競合はマルチエージェントシステムの堅牢性と一般化をターゲットにしている。
環境ラッパー、ベースライン、可視化ツール、そしてさらなる研究のための選択されたポリシーを含むベンチマークをオープンソースにします。
論文 参考訳(メタデータ) (2023-08-30T07:16:11Z) - The MineRL 2020 Competition on Sample Efficient Reinforcement Learning
using Human Priors [62.9301667732188]
我々は,MineRLコンペティションの第2イテレーションを提案する。
競争の主な目標は、人間のデモンストレーションを効率的に活用できるアルゴリズムの開発を促進することです。
コンペティションは、データセットと環境のペアバージョンが複数提供される2ラウンドで構成されている。
各ラウンドの終わりに、競合他社はコンテナ化された学習アルゴリズムをaicrowdプラットフォームに提出する。
論文 参考訳(メタデータ) (2021-01-26T20:32:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。