論文の概要: pix2pockets: Shot Suggestions in 8-Ball Pool from a Single Image in the Wild
- arxiv url: http://arxiv.org/abs/2504.12045v1
- Date: Wed, 16 Apr 2025 13:01:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 18:06:32.057682
- Title: pix2pockets: Shot Suggestions in 8-Ball Pool from a Single Image in the Wild
- Title(参考訳): pix2pockets:野生の1枚の画像から8ボールのプールを撮影する
- Authors: Jonas Myhre Schiøtt, Viktor Sebastian Petersen, Dimitrios P. Papadopoulos,
- Abstract要約: 我々は、RLアシストプールコーチの基礎となるピクス2ポケットを紹介した。
プールテーブルの1つの画像が与えられた場合、まずテーブルとボールを検出し、次に最適なショット提案を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Computer vision models have seen increased usage in sports, and reinforcement learning (RL) is famous for beating humans in strategic games such as Chess and Go. In this paper, we are interested in building upon these advances and examining the game of classic 8-ball pool. We introduce pix2pockets, a foundation for an RL-assisted pool coach. Given a single image of a pool table, we first aim to detect the table and the balls and then propose the optimal shot suggestion. For the first task, we build a dataset with 195 diverse images where we manually annotate all balls and table dots, leading to 5748 object segmentation masks. For the second task, we build a standardized RL environment that allows easy development and benchmarking of any RL algorithm. Our object detection model yields an AP50 of 91.2 while our ball location pipeline obtains an error of only 0.4 cm. Furthermore, we compare standard RL algorithms to set a baseline for the shot suggestion task and we show that all of them fail to pocket all balls without making a foul move. We also present a simple baseline that achieves a per-shot success rate of 94.7% and clears a full game in a single turn 30% of the time.
- Abstract(参考訳): コンピュータビジョンモデルはスポーツでの利用が増加しており、強化学習(RL)はチェスや囲碁のような戦略ゲームで人間を圧倒したことで有名である。
本稿では,これらの進歩を積み重ねることに興味を持ち,古典的な8球プールのゲームについて検討する。
我々は、RLアシストプールコーチの基礎となるピクス2ポケットを紹介した。
プールテーブルの1つの画像が与えられた場合、まずテーブルとボールを検出し、次に最適なショット提案を提案する。
最初のタスクでは、195の多様なイメージでデータセットを構築し、すべてのボールとテーブルドットを手動でアノテートし、5748個のオブジェクトセグメンテーションマスクを生成しました。
第2のタスクでは、任意のRLアルゴリズムを簡単に開発およびベンチマークできる標準化されたRL環境を構築します。
物体検出モデルではAP50は91.2, 球位置パイプラインは0.4cmの誤差しか得られない。
さらに, 標準RLアルゴリズムを用いてショット提案タスクのベースラインを設定し, ファウル動作を行なわずに全球のポケット化に失敗することを示す。
また、ショット当たりの成功率94.7%を達成し、全試合を1ターン30%の時間でクリアする簡単なベースラインも提示する。
関連論文リスト
- Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining [49.730897226510095]
我々は,60億のトークンデータを持つアタリゲーム上で事前訓練されたオフラインモデルベースRLエージェントであるJOWA: Jointly-Reinforceed World-Action Modelを紹介する。
われわれの最大のエージェントは、1億5000万のパラメータを持ち、10%のサブサンプルオフラインデータだけで事前トレーニングされたゲーム上での人間レベルのパフォーマンス78.9%で、既存の最先端の大規模なオフラインRLベースラインを31.6%上回っている。
論文 参考訳(メタデータ) (2024-10-01T10:25:03Z) - People use fast, goal-directed simulation to reason about novel games [71.0171482296852]
シンプルなが斬新なConnect-Nスタイルのボードゲームについて、人々がどう考えるかを研究する。
ゲームがどんなに公平か、そしてどんなに楽しいのかを、ごくわずかな経験から判断するよう、私たちは人々に求めます。
論文 参考訳(メタデータ) (2024-07-19T07:59:04Z) - Advanced Volleyball Stats for All Levels: Automatic Setting Tactic
Detection and Classification with a Single Camera [15.032833555418314]
バレーボールの試合における戦略分類の設定に特化して設計された2つの新しいエンドツーエンドコンピュータビジョンフレームワークを提案する。
本フレームワークは,ボール軌跡認識と新しいセット軌跡分類器を組み合わせることで,包括的・高度な統計データを生成する。
本システムでは,実時間展開が可能であり,ゲーム内戦略分析やスポット内ゲームプランの調整が可能である。
論文 参考訳(メタデータ) (2023-09-26T08:29:02Z) - Deep-Learning-Based Computer Vision Approach For The Segmentation Of
Ball Deliveries And Tracking In Cricket [4.021584094339975]
本稿では,ボールのみを届ける映像を分割抽出する手法を提案する。
オブジェクト検出モデルを適用して,映像を正確に抽出する手法を提案する。
これらのビデオショットにおけるボール追跡は、提案したデータセットの有用性のサンプルとして、別のRetinaNetモデルを使用して行われる。
論文 参考訳(メタデータ) (2022-11-22T04:55:58Z) - Mastering the Game of No-Press Diplomacy via Human-Regularized
Reinforcement Learning and Planning [95.78031053296513]
ノープレス外交(No-press Diplomacy)は、協力と競争の両方を含む複雑な戦略ゲームである。
我々は、人間の模倣学習ポリシーに対する報酬最大化ポリシーを規則化する、DiL-piKLと呼ばれる計画アルゴリズムを導入する。
RL-DiL-piKLと呼ばれる自己再生強化学習アルゴリズムに拡張可能であることを示す。
論文 参考訳(メタデータ) (2022-10-11T14:47:35Z) - Ball 3D localization from a single calibrated image [1.2891210250935146]
本研究では,画素内の球径を推定し,実球径の知識をメートル単位で利用することにより,単一画像上の課題に対処することを提案する。
このアプローチは、ボールが(部分的にも)見えるようなあらゆるゲーム状況に適しています。
3つのバスケットボールデータセットの検証により,我々のモデルがボール3Dのローカライゼーションに顕著な予測を与えることが明らかとなった。
論文 参考訳(メタデータ) (2022-03-30T19:38:14Z) - GridToPix: Training Embodied Agents with Minimal Supervision [87.05256520152723]
GridToPixは、Embodied AI環境を反映したグリッドワールドにおいて、終末報酬を持つエージェントを訓練する。
同一モデルとRLアルゴリズムによる端末報酬のみから学んだにもかかわらず、GridToPixはタスク間の結果を著しく改善している。
論文 参考訳(メタデータ) (2021-04-14T17:59:57Z) - Learning to Play Imperfect-Information Games by Imitating an Oracle
Planner [77.67437357688316]
我々は、同時移動と大規模なステートアクションスペースでマルチプレイヤーの不完全な情報ゲームをプレイする学習を検討します。
我々のアプローチはモデルに基づく計画に基づいている。
我々は,Clash Royale と Pommerman のゲームにおいて,プランナーが効率的なプレイ戦略を発見することができることを示す。
論文 参考訳(メタデータ) (2020-12-22T17:29:57Z) - Learning to Play Cup-and-Ball with Noisy Camera Observations [2.6931502677545947]
球技に対する学習モデルに基づく制御戦略を提案する。
Universal Robots UR5eのマニピュレータアームは、ケンダマのカップの1つでボールをキャッチすることを学ぶ。
論文 参考訳(メタデータ) (2020-07-19T02:22:36Z) - Learning to Prune Deep Neural Networks via Reinforcement Learning [64.85939668308966]
PuRLは、ニューラルネットワークのプルーニングのためのディープ強化学習ベースのアルゴリズムである。
現在の最先端の手法に匹敵する幅と精度を実現している。
論文 参考訳(メタデータ) (2020-07-09T13:06:07Z) - A Game Theoretic Framework for Model Based Reinforcement Learning [39.45066100705418]
モデルベース強化学習(MBRL)は、最近、サンプル効率と非政治データを組み込む能力により、大きな関心を集めている。
我々は,MBRLをゲームとして活用する新たなフレームワークを開発する。(1)学習モデルの下で報酬を最大化しようとするポリシープレイヤー,(2)ポリシープレイヤーが収集した実世界のデータに適合しようとするモデルプレイヤー。
当社のフレームワークは一貫性があり,従来から重要であった勾配の明確な基盤を提供します。
論文 参考訳(メタデータ) (2020-04-16T17:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。