論文の概要: Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making
- arxiv url: http://arxiv.org/abs/2510.16462v1
- Date: Sat, 18 Oct 2025 12:03:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.00662
- Title: Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making
- Title(参考訳): Buzz, Choose, Forget:ビーライクな意思決定のためのメタバンディットフレームワーク
- Authors: Emmanuelle Claeys, Elena Kerjean, Jean-Michel Loubes,
- Abstract要約: 受粉者における異種認知戦略のモデル化を目的とした模倣学習のための逐次強化学習フレームワークを提案する。
この設定では、最先端の模倣学習手法がしばしば失敗することを示す。
我々の貢献は、(i)行動データと最も整合した効果的なメモリ水平線を特定しながら、予測損失を最小限に抑えるモデルを導入し、(ii)生物学者が根底にある意思決定戦略を分析できるように、完全な解釈可能性を確保することによって、これらの課題に対処する。
- 参考スコア(独自算出の注目度): 3.2116198597240846
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce a sequential reinforcement learning framework for imitation learning designed to model heterogeneous cognitive strategies in pollinators. Focusing on honeybees, our approach leverages trajectory similarity to capture and forecast behavior across individuals that rely on distinct strategies: some exploiting numerical cues, others drawing on memory, or being influenced by environmental factors such as weather. Through empirical evaluation, we show that state-of-the-art imitation learning methods often fail in this setting: when expert policies shift across memory windows or deviate from optimality, these models overlook both fast and slow learning behaviors and cannot faithfully reproduce key decision patterns. Moreover, they offer limited interpretability, hindering biological insight. Our contribution addresses these challenges by (i) introducing a model that minimizes predictive loss while identifying the effective memory horizon most consistent with behavioral data, and (ii) ensuring full interpretability to enable biologists to analyze underlying decision-making strategies and finally (iii) providing a mathematical framework linking bee policy search with bandit formulations under varying exploration-exploitation dynamics, and releasing a novel dataset of 80 tracked bees observed under diverse weather conditions. This benchmark facilitates research on pollinator cognition and supports ecological governance by improving simulations of insect behavior in agroecosystems. Our findings shed new light on the learning strategies and memory interplay shaping pollinator decision-making.
- Abstract(参考訳): 受粉者における異種認知戦略のモデル化を目的とした模倣学習のための逐次強化学習フレームワークを提案する。
ミツバチに焦点をあてて、我々のアプローチは、異なる戦略に依存している個人間での行動の捕捉と予測に軌道的類似性を活用している。
経験的評価を通じて、現状の模倣学習手法は、しばしばこの設定で失敗する: 専門家のポリシーがメモリウインドウを横切る場合や、最適性から逸脱する場合、これらのモデルは、高速かつ遅い学習行動の両方を見落とし、重要な決定パターンを忠実に再現できない。
さらに、限定的な解釈可能性を提供し、生物学的な洞察を妨げる。
私たちの貢献はこれらの課題に対処します
一 行動データと最も整合した有効記憶地平線を特定しつつ、予測損失を最小限に抑えるモデルを導入すること。
二 生物学者が根底にある意思決定戦略を分析できるようにするための完全な解釈可能性を確保すること。
三 多様な探索・露光力学の下でハチの政策探索とバンドイットの定式化を結びつける数学的枠組みを提供し、多様な気象条件下で観察されたハチの追跡したハチ80個の新しいデータセットを公表する。
このベンチマークは、受粉者認知の研究を促進し、アグロ生態系における昆虫行動のシミュレーションを改善することにより、生態的ガバナンスを支援する。
以上の結果から, 学習戦略とメモリ・インタープレイ・フォーミング・プラミング・ポジネーターの意思決定に新たな光を当てた。
関連論文リスト
- BATIS: Bayesian Approaches for Targeted Improvement of Species Distribution Models [15.029163153558533]
種分布モデル(SDM)は,環境変数に基づいて種の発生を予測することを目的としている。
SDMの最近の深層学習の進歩は、複雑で不均一なデータセットでうまく機能することが示されている。
本稿では,限られた観測データを用いて事前予測を反復的に更新する,新規で実用的なフレームワークであるBATISを紹介する。
論文 参考訳(メタデータ) (2025-10-22T16:42:46Z) - From Pheromones to Policies: Reinforcement Learning for Engineered Biological Swarms [0.0]
本研究では, フェロモンを介するセロモン凝集と強化学習(RL)の理論的等価性を確立する。
我々は,フェロモンが数学的に相互学習の更新を反映していることを示し,捕食作業を行う線虫群をモデル化した。
この結果から, 環境信号が外部メモリとして機能する分散RLプロセスは, スティグマイシン系が本質的にコード化されていることが示唆された。
論文 参考訳(メタデータ) (2025-09-24T13:16:35Z) - In-Context Learning Strategies Emerge Rationally [36.21854069812912]
タスクの混合を学習する訓練を行うと、ICLの実行モデルによって学習された戦略がベイズ予測器のファミリーによって捕捉されることを示す。
我々は、トレーニングを通してTransformerの次なる予測をほぼ完全に予測する階層型ベイズフレームワークを開発した。
我々の研究は、戦略損失と複雑性の間のトレードオフを基礎としたICLの説明的かつ予測的な説明を前進させます。
論文 参考訳(メタデータ) (2025-06-21T23:49:08Z) - Sequence models for by-trial decoding of cognitive strategies from neural data [0.0]
本稿では,脳波データから認知戦略を復号化するための新しい機械学習手法を提案する。
試行レベルでの認知操作をうまくモデル化することにより、意思決定戦略における動的変動の実証的証拠を提供する。
論文 参考訳(メタデータ) (2025-04-14T09:33:02Z) - Contextualizing biological perturbation experiments through language [3.704686482174365]
PerturbQAは摂動実験に対する構造化推論のベンチマークである。
我々は、摂動をモデル化するための最先端の機械学習と統計的アプローチを評価する。
本稿では,サマー(SUMMarize,retrievE, answeR),シンプルなドメインインフォームドLLMフレームワークを紹介する。
論文 参考訳(メタデータ) (2025-02-28T18:15:31Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Imitating, Fast and Slow: Robust learning from demonstrations via
decision-time planning [96.72185761508668]
テストタイムでの計画(IMPLANT)は、模倣学習のための新しいメタアルゴリズムである。
IMPLANTは,標準制御環境において,ベンチマーク模倣学習手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-07T17:16:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。