論文の概要: On Realization of Intelligent Decision-Making in the Real World: A
Foundation Decision Model Perspective
- arxiv url: http://arxiv.org/abs/2212.12669v2
- Date: Tue, 16 May 2023 07:03:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-17 19:05:46.745045
- Title: On Realization of Intelligent Decision-Making in the Real World: A
Foundation Decision Model Perspective
- Title(参考訳): 実世界における知的意思決定の実現について:基礎決定モデルの観点から
- Authors: Ying Wen, Ziyu Wan, Ming Zhou, Shufang Hou, Zhe Cao, Chenyang Le,
Jingxiao Chen, Zheng Tian, Weinan Zhang, Jun Wang
- Abstract要約: FDM(Foundation Decision Model)は、様々な意思決定タスクをシーケンスデコーディングタスクとして定式化することで開発することができる。
本稿では、FDMの実装であるDigitalBrain(DB1)を13億のパラメータで実証し、870のタスクで人間レベルのパフォーマンスを達成するケーススタディを提案する。
- 参考スコア(独自算出の注目度): 54.38373782121503
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The pervasive uncertainty and dynamic nature of real-world environments
present significant challenges for the widespread implementation of
machine-driven Intelligent Decision-Making (IDM) systems. Consequently, IDM
should possess the ability to continuously acquire new skills and effectively
generalize across a broad range of applications. The advancement of Artificial
General Intelligence (AGI) that transcends task and application boundaries is
critical for enhancing IDM. Recent studies have extensively investigated the
Transformer neural architecture as a foundational model for various tasks,
including computer vision, natural language processing, and reinforcement
learning. We propose that a Foundation Decision Model (FDM) can be developed by
formulating diverse decision-making tasks as sequence decoding tasks using the
Transformer architecture, offering a promising solution for expanding IDM
applications in complex real-world situations. In this paper, we discuss the
efficiency and generalization improvements offered by a foundation decision
model for IDM and explore its potential applications in multi-agent game AI,
production scheduling, and robotics tasks. Lastly, we present a case study
demonstrating our FDM implementation, DigitalBrain (DB1) with 1.3 billion
parameters, achieving human-level performance in 870 tasks, such as text
generation, image captioning, video game playing, robotic control, and
traveling salesman problems. As a foundation decision model, DB1 represents an
initial step toward more autonomous and efficient real-world IDM applications.
- Abstract(参考訳): 実世界の環境の広範にわたる不確実性と動的性質は、機械駆動型知的意思決定システム(IDM)の広範な実装に重大な課題をもたらす。
したがって、idmは新しいスキルを継続的に獲得し、幅広いアプリケーションにわたって効果的に一般化する能力を持つべきである。
タスクとアプリケーション境界を超越する人工知能(AGI)の進歩は、IMMの強化に不可欠である。
近年,コンピュータビジョン,自然言語処理,強化学習など,様々なタスクの基本モデルとしてTransformer Neural Architectureが広く研究されている。
本稿では,トランスフォーマーアーキテクチャを用いて,多種多様な意思決定タスクをシーケンスデコードタスクとして定式化し,複雑な実環境においてIMMアプリケーションを拡張するための有望なソリューションを提供することにより,FDM(Foundation Decision Model)を開発することを提案する。
本稿では,IMMの基礎決定モデルによって提供される効率性と一般化の改善について論じ,マルチエージェントゲームAI,生産スケジューリング,ロボット工学タスクにおけるその可能性を探る。
最後に,我々のfdm実装を実証する事例として,13億パラメータのdigitalbrain(db1)を提案する。テキスト生成,画像キャプション,ビデオゲームプレイ,ロボット制御,旅行セールスマン問題など870のタスクにおいて,人間レベルのパフォーマンスを実現する。
基礎決定モデルとして、DB1はより自律的で効率的な実世界のIMMアプリケーションに向けた最初のステップである。
関連論文リスト
- Position Paper: Agent AI Towards a Holistic Intelligence [53.35971598180146]
エージェントAI - 大きな基盤モデルをエージェントアクションに統合する具体的システム。
本稿では,エージェント・ファウンデーション・モデル(エージェント・ファウンデーション・モデル)を提案する。
論文 参考訳(メタデータ) (2024-02-28T16:09:56Z) - An Interactive Agent Foundation Model [50.50659114031731]
本稿では,AIエージェントを訓練するための新しいマルチタスクエージェントトレーニングパラダイムを用いた対話型エージェント基礎モデルを提案する。
トレーニングパラダイムは、視覚マスク付きオートエンコーダ、言語モデリング、次世代の予測など、多様な事前学習戦略を統一する。
私たちは、ロボティクス、ゲームAI、ヘルスケアという3つの異なる領域でフレームワークのパフォーマンスを実演します。
論文 参考訳(メタデータ) (2024-02-08T18:58:02Z) - Solution-oriented Agent-based Models Generation with Verifier-assisted
Iterative In-context Learning [10.67134969207797]
エージェントベースのモデル(ABM)は、仮説的な解決策やポリシーの提案と検証に不可欠なパラダイムである。
大きな言語モデル(LLM)は、ドメイン間の知識とプログラミング能力をカプセル化することで、このプロセスの難しさを軽減できる可能性がある。
SAGEは、ターゲット問題に対する自動モデリングおよびソリューション生成のために設計された、汎用的なソリューション指向のABM生成フレームワークである。
論文 参考訳(メタデータ) (2024-02-04T07:59:06Z) - A Survey on Robotics with Foundation Models: toward Embodied AI [30.999414445286757]
近年のコンピュータビジョン,自然言語処理,マルチモーダリティ学習の進歩は,基礎モデルが特定のタスクに対して超人的能力を持つことを示している。
この調査は、ロボット工学の基礎モデルの包括的で最新の概要を提供し、自律的な操作に焦点を当て、高レベルの計画と低レベルの制御を包含することを目的としている。
論文 参考訳(メタデータ) (2024-02-04T07:55:01Z) - Forging Vision Foundation Models for Autonomous Driving: Challenges,
Methodologies, and Opportunities [59.02391344178202]
ビジョンファウンデーションモデル(VFM)は、幅広いAIアプリケーションのための強力なビルディングブロックとして機能する。
総合的なトレーニングデータの不足、マルチセンサー統合の必要性、多様なタスク固有のアーキテクチャは、VFMの開発に重大な障害をもたらす。
本稿では、自動運転に特化したVFMを鍛造する上で重要な課題について述べるとともに、今後の方向性を概説する。
論文 参考訳(メタデータ) (2024-01-16T01:57:24Z) - Pave the Way to Grasp Anything: Transferring Foundation Models for
Universal Pick-Place Robots [50.73735524550534]
そこで本稿では,最先端基礎モデルによって生成された言語基底セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
マスクから伝達される正確なセマンティクスとジオメトリを多視点ポリシーモデルに統合することにより、正確なオブジェクトのポーズを認識し、サンプル効率のよい学習を可能にする。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - DIME: Fine-grained Interpretations of Multimodal Models via Disentangled
Local Explanations [119.1953397679783]
我々は,マルチモーダルモデルの解釈における最先端化に注力する。
提案手法であるDIMEは,マルチモーダルモデルの高精度かつきめ細かな解析を可能にする。
論文 参考訳(メタデータ) (2022-03-03T20:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。