論文の概要: From Chatbot to Digital Colleague: The Paradigm Shift Toward Persistent Autonomous AI
- arxiv url: http://arxiv.org/abs/2606.14502v1
- Date: Fri, 12 Jun 2026 14:33:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.934866
- Title: From Chatbot to Digital Colleague: The Paradigm Shift Toward Persistent Autonomous AI
- Title(参考訳): ChatbotからDigital Colleagueへ - 永続的自律AIへのパラダイムシフト
- Authors: Yongheng Zhang, Ziang Liu, Jiaxuan Zhu, Shuai Wang, Xiangqi Chen, Haojing Huang, Jiayi Kuang, Siyu Chen, Ao Shen, Hao Wu, Qiufeng Wang, Qian-Wen Zhang, Junnan Dong, Wenhao Jiang, Ying Shen, Hai-Tao Zheng, Yinghui Li, Di Yin, Xing Sun, Philip S. Yu,
- Abstract要約: 大規模言語モデル(LLM)は、推論、記憶、自己改善が可能な統合AIシステムへの根本的な変換が行われている。
我々は、この移行を、叙事詩からデジタル・コルリーグへのシフトとして概念化している:会話の答えから永続的な仕事へ。
- 参考スコア(独自算出の注目度): 74.72113315839412
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Large Language Models (LLMs) are undergoing a fundamental transformation from conversational generators into integrated AI systems capable of reasoning, action, memory, and self-improvement. We conceptualize this transition as a shift from Chatbot to Digital Colleague: from conversational answers to persistent work. We organize this transition along two tightly coupled dimensions. First, at the cognitive core level, LLMs are advancing from Chatbot-era "fast thinking" systems driven by next-token prediction toward Thinking LLMs that leverage inference-time computation, Chain-of-Thought reasoning, reflection, process supervision, and reinforcement learning to support more deliberate and reliable cognition. Second, at the tool-augmented task execution level, LLMs are progressing from tool-calling Agents that invoke external resources in an ad hoc manner toward OpenClaw-style workstation systems (OpenClaw) equipped with persistent Workspaces, skills, verification loops, and governance. The "Workspace + Skill" paradigm makes episodic tool use colleague-like via state persistence, reusable procedures, task closure, and experience reuse. We examine data construction shifts from instruction-response pairs to State-Action-Observation trajectories and evaluation from static benchmarks to sandboxed, auditable, self-evolving AI ecosystems.
- Abstract(参考訳): 大規模言語モデル(LLM)は、対話ジェネレータから推論、アクション、メモリ、自己改善が可能な統合AIシステムへの根本的な変換が行われている。
私たちはこの移行を、チャットボットからデジタルコリーグへのシフトとして概念化しています。
2つの密結合した次元に沿ってこの遷移を整理する。
まず、認識コアレベルでは、LLMがチャットボット時代の「高速思考」システムから、推論時間計算、仮説推論、リフレクション、プロセスの監督、強化学習を活用して、より意図的で信頼性の高い認知を支援するためのLLMの考え方へと進む。
第2に、ツール拡張タスク実行レベルでは、ツール呼び出しエージェントから、永続的なワークスペース、スキル、検証ループ、ガバナンスを備えたOpenClawスタイルのワークステーションシステム(OpenClaw)へのアドホックな方法で外部リソースを呼び出します。
Workspace + Skill"パラダイムは、状態の永続化、再利用可能な手順、タスクの閉鎖、経験の再利用を通じて、エピソードツールを同僚のように利用する。
本研究では,命令応答対から状態行動観測軌道へのデータ構築のシフトと,静的ベンチマークからサンドボックス型,監査可能な,自己進化型AIエコシステムへの評価について検討する。
関連論文リスト
- ROSClaw: A Hierarchical Semantic-Physical Framework for Heterogeneous Multi-Agent Collaboration [9.434833852972353]
ROSClawは、統一視覚言語モデル(VLM)コントローラにポリシー学習とタスク実行を統合する異種ロボットのためのエージェントフレームワークである。
自律的なクローズループフレームワークを確立することにより、ROSClawはロボット固有の開発への依存を最小限に抑える。
論文 参考訳(メタデータ) (2026-04-06T13:16:24Z) - Cognitive Platform Engineering for Autonomous Cloud Operations [0.14658400971135652]
本稿では,センサ,推論,自律行動を直接プラットフォームライフサイクルに統合する次世代パラダイムであるCognitive Platform Engineeringを紹介する。
Terraform、Open Policy Agent、MLベースの異常検出で構築されたプロトタイプ実装では、平均時間から解決時間、リソース効率、コンプライアンスが改善されている。
論文 参考訳(メタデータ) (2026-01-24T18:17:49Z) - Casper: Inferring Diverse Intents for Assistive Teleoperation with Vision Language Models [50.19518681574399]
現実の遠隔操作における中心的な課題は、ロボットがユーザー制御入力から幅広い人間の意図を推測することである。
我々は、事前学習された視覚言語モデルに埋め込まれたコモンセンス知識を活用する、支援型遠隔操作システムであるCasperを紹介する。
我々は,Casperがタスク性能を改善し,人間の認知負荷を低減し,直接遠隔操作や補助遠隔操作のベースラインよりもユーザ満足度が高いことを示す。
論文 参考訳(メタデータ) (2025-06-17T17:06:43Z) - A Desideratum for Conversational Agents: Capabilities, Challenges, and Future Directions [51.96890647837277]
大規模言語モデル(LLM)は、従来の対話システムから、自律的な行動、文脈認識、ユーザとのマルチターンインタラクションが可能な高度なエージェントへと、会話AIを推進してきた。
本調査では,人間レベルの知性にアプローチするよりスケーラブルなシステムにおいて,何が達成されたのか,どのような課題が持続するのか,何を行う必要があるのか,といった,次世代の会話エージェントのデシラトゥムを提示する。
論文 参考訳(メタデータ) (2025-04-07T21:01:25Z) - A Complete Survey on LLM-based AI Chatbots [46.18523139094807]
過去数十年間、データの増加を目撃し、データ収集、学習ベースのAI技術の基礎を築いた。
AIチャットボットと呼ばれる会話エージェントは、大きな言語モデル(LLM)をトレーニングし、ユーザのプロンプトに応じて新しいコンテンツ(知識)を生成するために、そのようなデータに大きく依存している。
本稿では,様々な分野におけるLLMベースのチャットボットの進化と展開に関する完全な調査を行う。
論文 参考訳(メタデータ) (2024-06-17T09:39:34Z) - MOKA: Open-World Robotic Manipulation through Mark-Based Visual Prompting [97.52388851329667]
我々は,自由形式の言語命令で指定されたロボット操作タスクを解決するために,マーキングオープンワールドキーポイントアフォード(Moka)を導入する。
我々のアプローチの中心は、VLMの観測画像と物理世界におけるロボットの行動に関する予測を橋渡しする、コンパクトな点ベースの可測性表現である。
ツールの使用,変形可能な身体操作,オブジェクト再構成など,さまざまなテーブルトップ操作タスクにおけるMokaの性能評価と解析を行った。
論文 参考訳(メタデータ) (2024-03-05T18:08:45Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。