論文の概要: Experimental Studies in General Game Playing: An Experience Report
- arxiv url: http://arxiv.org/abs/2003.03410v1
- Date: Fri, 6 Mar 2020 19:53:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 01:30:59.378433
- Title: Experimental Studies in General Game Playing: An Experience Report
- Title(参考訳): 一般ゲームにおける実験研究:経験報告
- Authors: Jakub Kowalski, Marek Szyku{\l}a
- Abstract要約: 我々は,General Game Playing実験の歴史の15年近くについて述べる。
本研究の目的は,地域における実験研究における共通的な困難と問題点を指摘することである。
- 参考スコア(独自算出の注目度): 2.741266294612776
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We describe nearly fifteen years of General Game Playing experimental
research history in the context of reproducibility and fairness of comparisons
between various GGP agents and systems designed to play games described by
different formalisms. We think our survey may provide an interesting
perspective of how chaotic methods were allowed when nothing better was
possible. Finally, from our experience-based view, we would like to propose a
few recommendations of how such specific heterogeneous branch of research
should be handled appropriately in the future. The goal of this note is to
point out common difficulties and problems in the experimental research in the
area. We hope that our recommendations will help in avoiding them in future
works and allow more fair and reproducible comparisons.
- Abstract(参考訳): 汎用ゲームプレイング実験の歴史の15年近くを、様々なGGPエージェントと異なるフォーマリズムによって記述されたゲームをプレイするように設計されたシステムの比較の再現性と公正性の文脈で記述する。
われわれの調査は、何ら改善の余地がなかった場合にカオス的な方法が許されたか、興味深い視点を提供するかもしれない。
最後に,我々は経験に基づく視点から,このような特定の研究分野を今後どのように適切に扱うべきかを提言する。
本研究の目的は,地域における実験研究における共通的な困難と問題点を指摘することである。
われわれのリコメンデーションが将来の作業でそれらを避け、より公平で再現可能な比較を可能にすることを願っている。
関連論文リスト
- How to Evaluate Games in Education: A Literature Review [0.0]
我々は、異なる科学分野で行われた制御実験を要約し、評価することを目的として、異なる研究をレビューし、分析する。
本研究は,非実験条件の記述の明確さに焦点をあて,制御グループの活動に使用される教育方法が不十分であることを示す。
計算機科学と工学の分野での研究は、一般に、他の分野よりも明らかに結果を報告している。
論文 参考訳(メタデータ) (2024-07-04T12:18:42Z) - Time to Stop and Think: What kind of research do we want to do? [1.74048653626208]
本稿では,メタヒューリスティック最適化の分野に焦点をあてる。
私たちの主な目標は、仕事の誠実な批判的な評価の種を縫い合わせることで、個人とコミュニティの両方でリフレクションプロセスを引き起こします。
この文書に含まれるすべての声明は、他人が共有できるかどうかに関わらず、個人的な見解と意見である。
論文 参考訳(メタデータ) (2024-02-13T08:53:57Z) - A Double Machine Learning Approach to Combining Experimental and Observational Data [59.29868677652324]
実験と観測を組み合わせた二重機械学習手法を提案する。
我々の枠組みは、より軽度の仮定の下で、外部の妥当性と無知の違反を検査する。
論文 参考訳(メタデータ) (2023-07-04T02:53:11Z) - Using Adaptive Experiments to Rapidly Help Students [5.446351709118483]
我々は、トンプソンサンプリングアルゴリズムを用いて適応実験を行うことで、学生の宿題メールリマインダーの効果を評価する。
適応的ランダム化実験が多かれ少なかれ有用であるような条件について、様々なオープンな疑問を提起する。
論文 参考訳(メタデータ) (2022-08-10T00:43:05Z) - Increasing Students' Engagement to Reminder Emails Through Multi-Armed
Bandits [60.4933541247257]
本稿では,学生が週毎のメールリマインダーとどのように関わり,時間管理の習慣を構築するかについて,実世界の適応実験を行った。
適応実験にマルチアーマド・バンド(MAB)アルゴリズムを用いると、より良い結果が得られる可能性が高まる。
我々は、これらの適応アルゴリズムの問題点を強調します。例えば、大きな違いがない場合の腕の活用などです。
論文 参考訳(メタデータ) (2022-08-10T00:30:52Z) - Replay For Safety [51.11953997546418]
経験的なリプレイでは、過去の遷移はメモリバッファに格納され、学習中に再使用される。
適切なバイアスサンプリング方式を用いることで,エファンセーフなポリシーを実現できることを示す。
論文 参考訳(メタデータ) (2021-12-08T11:10:57Z) - Contextual Games: Multi-Agent Learning with Side Information [57.76996806603094]
各ラウンドでコンテキスト情報によって駆動されるコンテキストゲームの新しいクラスを定式化する。
カーネルベースの規則性仮定を用いて、異なるコンテキストとゲーム結果の相関関係をモデル化する。
本研究では,個々のプレイヤーの文脈的後悔を最小限に抑えるために,そのような相関を利用した新しいオンライン(メタ)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-07-13T18:37:37Z) - Challenges in Statistical Analysis of Data Collected by a Bandit
Algorithm: An Empirical Exploration in Applications to Adaptively Randomized
Experiments [11.464963616709671]
多腕バンディットアルゴリズムは、適応的ランダム化実験に有用であると何十年も議論されてきた。
バンディットアルゴリズムThompson Sampling (TS) を用いて, 3つの大学で適応実験を行った。
TSを用いたデータ収集はFalse Positive Rate(FPR)とFalse Negative Rate(FNR)を2倍にすることができることを示す。
論文 参考訳(メタデータ) (2021-03-22T22:05:18Z) - GSum: A General Framework for Guided Neural Abstractive Summarization [102.29593069542976]
本稿では,様々な外部ガイダンスを入力として効果的に活用できる汎用的かつガイド付き要約フレームワーク(GSum)を提案する。
実験により、このモデルが有効であることが示され、ROUGEによれば、4つの一般的な要約データセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-10-15T20:46:14Z) - Towards Game-Playing AI Benchmarks via Performance Reporting Standards [0.9137554315375919]
本稿では,AIゲームプレイパフォーマンスの報告ガイドラインを提案し,従えば,異なるAIアプローチの非バイアス比較に適した情報を提供する。
私たちが説明するビジョンは、さまざまなAIアルゴリズムの振る舞いに関するより一般的な結論を引き出すために、このようなガイドラインに基づいたベンチマークとコンペを構築することです。
論文 参考訳(メタデータ) (2020-07-06T13:27:00Z) - A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。
観測データに対する様々な因果効果推定法が誕生した。
論文 参考訳(メタデータ) (2020-02-05T21:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。