論文の概要: Multimodal Pretrained Models for Sequential Decision-Making: Synthesis,
Verification, Grounding, and Perception
- arxiv url: http://arxiv.org/abs/2308.05295v1
- Date: Thu, 10 Aug 2023 02:29:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-11 13:57:47.334462
- Title: Multimodal Pretrained Models for Sequential Decision-Making: Synthesis,
Verification, Grounding, and Perception
- Title(参考訳): シーケンス決定のための多重モード事前学習モデル:合成,検証,接地,知覚
- Authors: Yunhao Yang, Cyrus Neary, Ufuk Topcu
- Abstract要約: 最近開発された事前学習モデルは、テキストや画像など、複数のモードで表現された豊かな世界知識を符号化することができる。
本研究では,事前学習したモデルからの知識を利用して,逐次意思決定タスクのための制御器の構築と検証を行うアルゴリズムを開発した。
我々は,実世界のタスクスイートを通じて,自動制御システムの構築,検証,および接地を行うアルゴリズムの能力を実証する。
- 参考スコア(独自算出の注目度): 27.686329482502455
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently developed pretrained models can encode rich world knowledge
expressed in multiple modalities, such as text and images. However, the outputs
of these models cannot be integrated into algorithms to solve sequential
decision-making tasks. We develop an algorithm that utilizes the knowledge from
pretrained models to construct and verify controllers for sequential
decision-making tasks, and to ground these controllers to task environments
through visual observations. In particular, the algorithm queries a pretrained
model with a user-provided, text-based task description and uses the model's
output to construct an automaton-based controller that encodes the model's
task-relevant knowledge. It then verifies whether the knowledge encoded in the
controller is consistent with other independently available knowledge, which
may include abstract information on the environment or user-provided
specifications. If this verification step discovers any inconsistency, the
algorithm automatically refines the controller to resolve the inconsistency.
Next, the algorithm leverages the vision and language capabilities of
pretrained models to ground the controller to the task environment. It collects
image-based observations from the task environment and uses the pretrained
model to link these observations to the text-based control logic encoded in the
controller (e.g., actions and conditions that trigger the actions). We propose
a mechanism to ensure the controller satisfies the user-provided specification
even when perceptual uncertainties are present. We demonstrate the algorithm's
ability to construct, verify, and ground automaton-based controllers through a
suite of real-world tasks, including daily life and robot manipulation tasks.
- Abstract(参考訳): 最近開発された事前学習モデルは、テキストや画像など、複数のモダリティで表現された豊かな世界知識をエンコードすることができる。
しかし、これらのモデルの出力は逐次的な意思決定タスクを解決するアルゴリズムに統合できない。
本研究では,事前学習したモデルからの知識を利用して,逐次意思決定タスクのための制御器の構築と検証を行い,視覚的観察により制御器をタスク環境に配置するアルゴリズムを開発した。
特に、このアルゴリズムは、ユーザが提供するテキストベースのタスク記述で事前学習されたモデルをクエリし、モデルの出力を使用して、モデルのタスク関連知識をエンコードするオートマトンベースのコントローラを構築する。
そして、コントローラにエンコードされた知識が、環境に関する抽象情報やユーザが提供する仕様を含む他の独立した利用可能な知識と一致しているかどうかを検証する。
この検証ステップが不一致を検出すると、アルゴリズムは自動的にコントローラを洗練して不一致を解消する。
次に、事前訓練されたモデルの視覚と言語能力を利用して、制御器をタスク環境に接地する。
タスク環境からイメージベースの観察を収集し、事前訓練されたモデルを使用して、これらの観察をコントローラにエンコードされたテキストベースの制御ロジック(アクションをトリガーするアクションや条件など)にリンクする。
認識の不確実性が存在する場合でも,コントローラがユーザが提供する仕様を満足させる機構を提案する。
このアルゴリズムは,日常生活やロボット操作など,現実的なタスクのスイートを通じて,オートマトンベースのコントローラを構築し,検証し,構築する能力を示す。
関連論文リスト
- Automated Process Planning Based on a Semantic Capability Model and SMT [50.76251195257306]
製造システムと自律ロボットの研究において、機械で解釈可能なシステム機能の仕様に「能力」という用語が用いられる。
セマンティック能力モデルから始めて、AI計画問題を自動的に生成するアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-14T10:37:34Z) - Verified Compositional Neuro-Symbolic Control for Stochastic Systems
with Temporal Logic Tasks [11.614036749291216]
自律エージェントのためのニューラルネットワーク(NN)コントローラを学ぶために、最近いくつかの方法が提案されている。
これらのアプローチにおける重要な課題は、しばしば安全保証が欠如しているか、提供された保証が現実的でないことである。
本稿では,訓練されたNNコントローラの時間的構成が存在するかどうかを確認することで,この問題に対処することを目的とする。
論文 参考訳(メタデータ) (2023-11-17T20:51:24Z) - Fine-Tuning Language Models Using Formal Methods Feedback [53.24085794087253]
我々は、自律システムにおけるアプリケーションのための、微調整済み言語モデルに対して、完全に自動化されたアプローチを提案する。
本手法は,自然言語タスク記述による事前学習モデルから自動制御器を合成する。
その結果、コントローラが満たした仕様の割合が60%から90%に改善したことが示唆された。
論文 参考訳(メタデータ) (2023-10-27T16:24:24Z) - Continual Object Detection via Prototypical Task Correlation Guided
Gating Mechanism [120.1998866178014]
pRotOtypeal taSk corrElaTion guided gaTingAnism (ROSETTA)による連続物体検出のためのフレキシブルなフレームワークを提案する。
具体的には、統一されたフレームワークはすべてのタスクで共有され、タスク対応ゲートは特定のタスクのサブモデルを自動的に選択するために導入されます。
COCO-VOC、KITTI-Kitchen、VOCのクラスインクリメンタル検出、および4つのタスクの逐次学習の実験により、ROSETTAが最先端のパフォーマンスを得ることが示された。
論文 参考訳(メタデータ) (2022-05-06T07:31:28Z) - Scanflow: A multi-graph framework for Machine Learning workflow
management, supervision, and debugging [0.0]
本稿では,エンドツーエンドの機械学習ワークフロー管理を支援するコンテナ化指向グラフフレームワークを提案する。
このフレームワークは、コンテナ内でMLを定義してデプロイし、メタデータを追跡し、本番環境での振る舞いを確認し、学習された知識と人為的な知識を使用してモデルを改善する。
論文 参考訳(メタデータ) (2021-11-04T17:01:12Z) - Counterfactual Explanation and Causal Inference in Service of Robustness
in Robot Control [15.104159722499366]
我々は「事象AがCの代わりにBを引き起こすように変更できるか?」という形式の逆実数条件の生成モデルを訓練するためのアーキテクチャを提案する。
従来の制御設計手法とは対照的に、ノイズを除去する能力の観点から頑健さを定量化する手法では、ある要件に違反する可能性のある反事実の空間を探索する。
論文 参考訳(メタデータ) (2020-09-18T14:22:47Z) - Semi-supervised Learning From Demonstration Through Program Synthesis:
An Inspection Robot Case Study [0.0]
本稿では,実証実験から解釈可能なモデルと検証可能なモデルを学習できるハイブリッドセミ教師システムを提案する。
本システムは、逐次重要サンプリングを用いて没入型デモンストレーションから学習することで、コントローラプログラムを誘導する。
我々は、無人地上車両が特定の順序で環境の異なる領域を検査しなければならない検査シナリオからハイブリッドシステムの学習に成功した。
論文 参考訳(メタデータ) (2020-07-23T01:32:21Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z) - Posterior Control of Blackbox Generation [126.33511630879713]
我々は、構造化潜在変数アプローチにより学習した離散制御状態を持つニューラルジェネレーションモデルの拡張を検討する。
この手法は標準ベンチマークよりも改善され、きめ細かい制御も可能である。
論文 参考訳(メタデータ) (2020-05-10T03:22:45Z) - Goal-Conditioned End-to-End Visuomotor Control for Versatile Skill
Primitives [89.34229413345541]
本稿では,制御器とその条件をエンドツーエンドに学習することで,落とし穴を回避する条件付け手法を提案する。
本モデルでは,ロボットの動きのダイナミックな画像表現に基づいて,複雑な動作シーケンスを予測する。
代表的MPCおよびILベースラインに対するタスク成功の大幅な改善を報告した。
論文 参考訳(メタデータ) (2020-03-19T15:04:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。