論文の概要: Generative AI Systems: A Systems-based Perspective on Generative AI
- arxiv url: http://arxiv.org/abs/2407.11001v1
- Date: Tue, 25 Jun 2024 12:51:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 12:39:32.131646
- Title: Generative AI Systems: A Systems-based Perspective on Generative AI
- Title(参考訳): ジェネレーティブAIシステム:ジェネレーティブAIのシステムベース展望
- Authors: Jakub M. Tomczak,
- Abstract要約: 大規模言語モデル(LLM)は、自然言語を用いた機械との通信を可能にすることで、AIシステムに革命をもたらした。
ジェネレーティブAI(GenAI)の最近の進歩は、マルチモーダルシステムとしてLLMを使うことに大きな期待を示している。
本稿では,ジェネレーティブAIシステムにおける新たな研究の方向性を探求し,述べることを目的とする。
- 参考スコア(独自算出の注目度): 12.400966570867322
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) have revolutionized AI systems by enabling communication with machines using natural language. Recent developments in Generative AI (GenAI) like Vision-Language Models (GPT-4V) and Gemini have shown great promise in using LLMs as multimodal systems. This new research line results in building Generative AI systems, GenAISys for short, that are capable of multimodal processing and content creation, as well as decision-making. GenAISys use natural language as a communication means and modality encoders as I/O interfaces for processing various data sources. They are also equipped with databases and external specialized tools, communicating with the system through a module for information retrieval and storage. This paper aims to explore and state new research directions in Generative AI Systems, including how to design GenAISys (compositionality, reliability, verifiability), build and train them, and what can be learned from the system-based perspective. Cross-disciplinary approaches are needed to answer open questions about the inner workings of GenAI systems.
- Abstract(参考訳): 大規模言語モデル(LLM)は、自然言語を用いた機械との通信を可能にすることで、AIシステムに革命をもたらした。
ビジョンランゲージモデル(GPT-4V)やジェミニのようなジェネレーティブAI(GenAI)の最近の進歩は、LLMをマルチモーダルシステムとして使うことに大きな期待を示している。
この新しい研究の成果は、ジェネレーティブAIシステム(略してGenAISys)の構築であり、マルチモーダルな処理とコンテンツ作成、そして意思決定を可能にする。
GenAISysは自然言語を通信手段として使用し、様々なデータソースを処理するためのI/Oインタフェースとしてモダリティエンコーダを使用する。
データベースや外部ツールも備えており、情報検索とストレージのためのモジュールを通じてシステムと通信する。
本稿では、GenAISys(構成性、信頼性、妥当性)を設計し、構築し、訓練し、システムベースの観点から何が学べるかなど、ジェネレーティブAIシステムにおける新たな研究方向性を探求し、述べることを目的とする。
GenAIシステムの内部動作に関するオープンな質問に答えるためには、学際的なアプローチが必要である。
関連論文リスト
- Developing Retrieval Augmented Generation (RAG) based LLM Systems from PDFs: An Experience Report [3.4632900249241874]
本稿では,PDF文書を主データ源とする検索拡張生成システム(RAG)の開発経験報告について述べる。
RAGアーキテクチャは、Large Language Models (LLM) の生成能力と情報検索の精度を組み合わせたものである。
この研究の実際的な意味は、様々な分野における生成AIシステムの信頼性を高めることである。
論文 参考訳(メタデータ) (2024-10-21T12:21:49Z) - Are Large Language Models the New Interface for Data Pipelines? [3.5021689991926377]
言語モデル(Language Model)とは、人間のコミュニケーションを理解し、生成するために設計された様々な種類のモデルを含む用語である。
大規模言語モデル (LLM) は、人間のような流布やコヒーレンスでテキストを処理する能力によって注目されている。
論文 参考訳(メタデータ) (2024-06-06T08:10:32Z) - LVLM-Interpret: An Interpretability Tool for Large Vision-Language Models [50.259006481656094]
本稿では,大規模視覚言語モデルの内部メカニズムの理解を目的とした対話型アプリケーションを提案する。
このインタフェースは, 画像パッチの解釈可能性を高めるために設計されており, 応答の生成に有効である。
本稿では,一般的な大規模マルチモーダルモデルであるLLaVAにおける障害機構の理解に,アプリケーションがどのように役立つかのケーススタディを示す。
論文 参考訳(メタデータ) (2024-04-03T23:57:34Z) - Generative AI [20.57872238271025]
生成AI(generative AI)とは、一見新しい意味のあるコンテンツを生成できる計算技術である。
Dall-E 2, GPT-4, Copilotといった例でこの技術が広く普及していることは,現在私たちの作業方法やコミュニケーション方法に革命をもたらしています。
論文 参考訳(メタデータ) (2023-09-13T08:21:59Z) - Large Language Models for Information Retrieval: A Survey [58.30439850203101]
情報検索は、項ベースの手法から高度なニューラルモデルとの統合へと進化してきた。
近年の研究では、大規模言語モデル(LLM)を活用してIRシステムの改善が試みられている。
LLMとIRシステムの合流点を探索し、クエリリライト、リトリバー、リランカー、リーダーといった重要な側面を含む。
論文 参考訳(メタデータ) (2023-08-14T12:47:22Z) - ChatMOF: An Autonomous AI System for Predicting and Generating
Metal-Organic Frameworks [0.0]
ChatMOFは、金属-有機フレームワーク(MOF)を予測および生成するために開発された自律人工知能(AI)システムである。
大規模言語モデル(GPT-4とGPT-3.5-turbo)を活用することで、ChatMOFはテキスト入力から重要な詳細を抽出し、適切な応答を提供する。
論文 参考訳(メタデータ) (2023-08-01T02:08:13Z) - A Graphical Modeling Language for Artificial Intelligence Applications
in Automation Systems [69.50862982117127]
学際的なグラフィカルモデリング言語で、すべての分野に理解可能なシステムとして、AIアプリケーションのモデリングを可能にすることは、まだ存在しない。
本稿では,システムレベルでの自動化システムにおけるAIアプリケーションの一貫した,理解可能なモデリングを可能にするグラフィカルモデリング言語を提案する。
論文 参考訳(メタデータ) (2023-06-20T12:06:41Z) - MRKL Systems: A modular, neuro-symbolic architecture that combines large
language models, external knowledge sources and discrete reasoning [50.40151403246205]
巨大な言語モデル(LM)は、自然言語ベースの知識タスクのゲートウェイとして機能する、AIの新しい時代を支えている。
離散的な知識と推論モジュールによって補完される、複数のニューラルモデルによる柔軟なアーキテクチャを定義する。
本稿では,MRKL(Modular Reasoning, Knowledge and Language)システムと呼ばれる,このニューロシンボリックアーキテクチャについて述べる。
論文 参考訳(メタデータ) (2022-05-01T11:01:28Z) - GenNI: Human-AI Collaboration for Data-Backed Text Generation [102.08127062293111]
Table2Textシステムは、機械学習を利用した構造化データに基づいてテキスト出力を生成する。
GenNI (Generation Negotiation Interface) は、対話型ビジュアルシステムである。
論文 参考訳(メタデータ) (2021-10-19T18:07:07Z) - Distributed and Democratized Learning: Philosophy and Research
Challenges [80.39805582015133]
民主化学習(Dem-AI)という新しいデザイン哲学を提案する。
ヒトの社会的グループに触発され、提案されたDem-AIシステムの学習エージェントの専門グループは階層構造で自己組織化され、より効率的に学習タスクを遂行する。
本稿では,様々な学際分野に触発された未来のDem-AIシステムを実現するためのガイドラインとして,参照設計を提案する。
論文 参考訳(メタデータ) (2020-03-18T08:45:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。