論文の概要: Olfactory pursuit: catching a moving odor source in complex flows
- arxiv url: http://arxiv.org/abs/2604.13121v1
- Date: Mon, 13 Apr 2026 15:52:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.210673
- Title: Olfactory pursuit: catching a moving odor source in complex flows
- Title(参考訳): 嗅覚追跡 : 複雑な流れにおける移動臭源の捕捉
- Authors: Maurizio Carbone, Lorenzo Piro, Robin A. Heinonen, Luca Biferale, Massimo Cencini, Antonio Celani,
- Abstract要約: 臭気信号は断続的であり、乱流のような輸送によって強く混合される。
我々は,目標の位置と速度に関する共同信念をエージェントが維持する,部分的に観察可能なマルコフ決定過程として嗅覚追跡を定式化する。
本研究は, 目標運動の予測推定を, 効果的な嗅覚追跡の鍵となる要素として同定した。
- 参考スコア(独自算出の注目度): 0.5541644538483947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Locating and intercepting a moving target from possibly delayed, intermittent sensory signals is a paradigmatic problem in decision-making under uncertainty, and a fundamental challenge for, e.g., animals seeking prey or mates and autonomous robotic systems. Odor signals are intermittent, strongly mixed by turbulent-like transport, and typically lag behind the true target position, thereby complicating localization. Here, we formulate olfactory pursuit as a partially observable Markov decision process in which an agent maintains a joint belief over the target's position and velocity. Using a discrete run-and-tumble model, we compute quasi-optimal policies by numerically solving the Bellman equation and benchmark them against well-established information-theoretic strategies such as Infotaxis. We show that purely exploratory policies are near-optimal when the target frequently reorients, but fail dramatically when the target exhibits persistent motion. We thus introduce a computationally efficient hybrid policy that combines the information-gain drive of Infotaxis with a "greedy" value function derived from an associated fully observable control problem. Our heuristic achieves near-optimal performance across all persistence times and substantially outperforms purely exploratory approaches. Moreover, our proposal demonstrates strong robustness even in more complex search scenarios, including continuous run-and-tumble prey motion with moderate persistence time, model mismatch, and more accurate plume dynamics representation. Our results identify predictive inference of target motion as the key ingredient for effective olfactory pursuit and provide a general framework for search in information-poor, dynamically evolving environments.
- Abstract(参考訳): 移動目標の位置と傍受は、不確実性の下での意思決定におけるパラダイム的な問題であり、例えば、獲物や仲間や自律ロボットシステムを求める動物にとって、根本的な課題である。
臭気信号は断続的であり、乱流のような輸送によって強く混合され、典型的には真の標的位置の後方の遅延により局所化が複雑になる。
ここでは,嗅覚の追求を,エージェントが目標の位置と速度について共同で信念を維持する,部分的に観察可能なマルコフ決定プロセスとして定式化する。
離散的なラン・アンド・タンブルモデルを用いて,ベルマン方程式を数値的に解くことで準最適ポリシーを計算し,インフォタキシーのような確立した情報理論の戦略と比較する。
対象が頻繁に向きを変えると、純粋な探索的ポリシーがほぼ最適であるが、目標が永続的な動きを示すと、劇的に失敗することを示す。
そこで本稿では,Infotaxisの情報ゲイン駆動と,関連する完全可観測制御問題から導出される"greedy"値関数を組み合わせた,計算効率のよいハイブリッドポリシを提案する。
我々のヒューリスティックは、全ての持続時間でほぼ最適性能を達成し、純粋に探索的なアプローチよりも大幅に優れています。
さらに,より複雑な探索シナリオにおいても,持続時間,モデルミスマッチ,より正確なプルームダイナミックス表現による連続的ラン・タンブル捕食動作など,強い堅牢性を示す。
本研究は, 目標運動の予測推定を, 効果的な嗅覚追跡の鍵となる要素として同定し, 情報不足, 動的に進化する環境を探索するための一般的な枠組みを提供する。
関連論文リスト
- Robust Multi-Agent Target Tracking in Intermittent Communication Environments via Analytical Belief Merging [2.3559161556025887]
本稿では,分散的信念統合問題をForwardとReverse Kullback-Leibler (KL)の分散最適化として定式化する。
これらの導出を配置することにより、最適化アーティファクトを数学的に排除し、完璧な数学的忠実性を達成する。
本研究では,空間的に認識された訪問重み付きKLマージ戦略を提案し,その物理的訪問履歴に基づいてエージェントの信念を動的に評価する。
論文 参考訳(メタデータ) (2026-04-08T20:27:48Z) - Referring-Aware Visuomotor Policy Learning for Closed-Loop Manipulation [91.20850436220267]
Referring-Aware Visuomotor Policy(ReV)について紹介する。
ReVは、人間または高レベルの推論プランナーによって提供されるスパース参照ポイントを組み込む。
これは、専門家のデモンストレーションにターゲットの摂動を適用することでのみ訓練される。
論文 参考訳(メタデータ) (2026-04-07T07:41:11Z) - F2F-AP: Flow-to-Future Asynchronous Policy for Real-time Dynamic Manipulation [62.06267255986041]
非同期推論はロボット操作における主要なパラダイムとして現れている。
本稿では,予測対象の流れを利用して将来の観測を合成する新しい枠組みを提案する。
本手法は複雑な動的操作タスクにおける応答性と成功率を大幅に向上させる。
論文 参考訳(メタデータ) (2026-04-02T17:57:15Z) - SHARP: Short-Window Streaming for Accurate and Robust Prediction in Motion Forecasting [53.74101174559609]
本稿では,進化するシーンに特化して焦点をあてた,ストリーミングベースの新たな動き予測フレームワークを提案する。
本手法は,入ってくる観測ウィンドウを段階的に処理し,インスタンス対応コンテキストストリーミングを利用して潜時エージェント表現の維持と更新を行う。
我々のモデルは,Argoverse 2マルチエージェントベンチマークのストリーミング推論における最先端性能を実現し,遅延を最小限に抑えながら,実世界の展開に適していることを強調した。
論文 参考訳(メタデータ) (2026-03-30T06:47:19Z) - Robust and Generalized Humanoid Motion Tracking [17.58241987932198]
一般的なヒューマノイド全体制御器の学習は、ロボット領域に移動された後、実用的な参照動作がノイズや不整合を示す可能性があるため、困難である。
本稿では,因果的時間的エンコーダを用いた動的条件付きコマンドアグリゲーションフレームワークの提案と,コンテキストウィンドウを選択的に集約するマルチヘッド・クロスアテンション・コマンドエンコーダを提案する。
提案手法は多種多様な参照入力と挑戦的な動作条件の下で評価され,無見えない動作へのゼロショット転送と,物理的ヒューマノイドロボットへのロバストなシミュレート・トゥ・リアル転送が実証された。
論文 参考訳(メタデータ) (2026-01-30T15:27:43Z) - Optimization-Guided Diffusion for Interactive Scene Generation [52.23368750264419]
本稿では,拡散型サンプリングにおける構造的一貫性と相互作用認識を実現するための,最適化誘導型トレーニングフリーフレームワークであるOMEGAを提案する。
OMEGAは生成リアリズム,一貫性,可制御性を向上し,身体的および行動学的に有効なシーンの比率を増大させることを示す。
当社のアプローチでは,3秒未満の時間対コリションで,より近いコリジョンフレームを5ドル(約5,500円)で生成することも可能だ。
論文 参考訳(メタデータ) (2025-12-08T15:56:18Z) - Multi-agent Traffic Prediction via Denoised Endpoint Distribution [23.767783008524678]
高速での軌道予測には歴史的特徴と周囲の物体との相互作用が必要である。
軌道予測のためのDenoized Distributionモデルを提案する。
我々のアプローチは、エンドポイント情報によるモデルの複雑さとパフォーマンスを著しく削減します。
論文 参考訳(メタデータ) (2024-05-11T15:41:32Z) - An Index Policy Based on Sarsa and Q-learning for Heterogeneous Smart
Target Tracking [13.814608044569967]
我々は、長期追跡報酬を最大化するための新しいポリシー、すなわちISQを提案する。
数値解析の結果,提案したISQポリシーは従来のQラーニング法よりも優れていた。
論文 参考訳(メタデータ) (2024-02-19T10:13:25Z) - Time-series Generation by Contrastive Imitation [87.51882102248395]
モーメントマッチングの目的によってモチベーションされ、複合的エラーを軽減し、局所的(しかし前方的な)遷移ポリシーを最適化する。
推論において、学習されたポリシーは反復的なサンプリングのジェネレータとして機能し、学習されたエネルギーはサンプルの品質を評価するための軌道レベル尺度として機能する。
論文 参考訳(メタデータ) (2023-11-02T16:45:25Z) - Bellman Meets Hawkes: Model-Based Reinforcement Learning via Temporal
Point Processes [8.710154439846816]
エージェントが離散的な事象を特徴とする環境に直面する逐次的意思決定問題を考える。
この問題は、ソーシャルメディア、金融、健康情報学において至るところに存在しているが、強化学習における従来の研究によって研究されることは稀である。
本稿では,エージェントの動作と観察が連続的に発生する非同期離散事象であるモデルに基づく強化学習の枠組みを提案する。
論文 参考訳(メタデータ) (2022-01-29T11:53:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。