論文の概要: Deep Learning for Sequential Decision Making under Uncertainty: Foundations, Frameworks, and Frontiers
- arxiv url: http://arxiv.org/abs/2604.11507v1
- Date: Mon, 13 Apr 2026 14:11:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.590151
- Title: Deep Learning for Sequential Decision Making under Uncertainty: Foundations, Frameworks, and Frontiers
- Title(参考訳): 不確実性に基づくシークエンシャル意思決定のための深層学習:基盤,フレームワーク,フロンティア
- Authors: I. Esra Buyuktahtakin,
- Abstract要約: 本チュートリアルでは、不確実性の下での逐次意思決定のためのディープラーニングに関するOR/MS中心の視点を示す。
その中心的な前提は、ディープラーニングは最適化の代替としてではなく、それを補完するものとして価値があることである。
このチュートリアルでは、重要な意思決定基盤をレビューし、現代のAIの主要なニューラルネットワークに接続し、学習と最適化を統合するための主要なアプローチについて論じている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial intelligence (AI) is moving increasingly beyond prediction to support decisions in complex, uncertain, and dynamic environments. This shift creates a natural intersection with operations research and management sciences (OR/MS), which have long offered conceptual and methodological foundations for sequential decision-making under uncertainty. At the same time, recent advances in deep learning, including feedforward neural networks, LSTMs, transformers, and deep reinforcement learning, have expanded the scope of data-driven modeling and opened new possibilities for large-scale decision systems. This tutorial presents an OR/MS-centered perspective on deep learning for sequential decision-making under uncertainty. Its central premise is that deep learning is valuable not as a replacement for optimization, but as a complement to it. Deep learning brings adaptability and scalable approximation, whereas OR/MS provides the structural rigor needed to represent constraints, recourse, and uncertainty. The tutorial reviews key decision-making foundations, connects them to the major neural architectures in modern AI, and discusses leading approaches to integrating learning and optimization. It also highlights emerging impact in domains such as supply chains, healthcare and epidemic response, agriculture, energy, and autonomous operations. More broadly, it frames these developments as part of a wider transition from predictive AI toward decision-capable AI and highlights the role of OR/MS in shaping the next generation of integrated learning--optimization systems.
- Abstract(参考訳): 人工知能(AI)は、複雑な、不確実で、動的環境における意思決定を支援するために、予測を超えてますます動き始めている。
このシフトは、不確実性の下でのシーケンシャルな意思決定のための概念的および方法論的基盤を長年提供してきたオペレーションリサーチ・マネジメント科学(OR/MS)と自然に交差する。
同時に、フィードフォワードニューラルネットワーク、LSTM、トランスフォーマー、深層強化学習など、近年のディープラーニングの進歩により、データ駆動モデリングの範囲が拡大し、大規模意思決定システムへの新たな可能性も開かれた。
本チュートリアルでは、不確実性の下での逐次意思決定のためのディープラーニングに関するOR/MS中心の視点を示す。
その中心的な前提は、ディープラーニングは最適化の代替としてではなく、それを補完するものとして価値があることである。
ディープラーニングは適応性とスケーラブルな近似をもたらすが、OR/MSは制約やリコース、不確実性を表現するのに必要な構造的厳密さを提供する。
このチュートリアルでは、重要な意思決定基盤をレビューし、現代のAIの主要なニューラルネットワークに接続し、学習と最適化を統合するための主要なアプローチについて論じている。
また、サプライチェーン、医療と疫病の対応、農業、エネルギー、自律運転といった領域における新たな影響を強調している。
より広義には、これらの開発は予測AIから意思決定可能なAIへの移行の一環であり、次世代の学習最適化システムを形成する上でのOR/MSの役割を強調している。
関連論文リスト
- Advances and Frontiers of LLM-based Issue Resolution in Software Engineering: A Comprehensive Survey [59.3507264893654]
課題解決は、現実世界の開発に不可欠な複雑なソフトウェアエンジニアリングタスクです。
SWE-benchのようなベンチマークでは、このタスクは大規模言語モデルでは極めて困難であることが判明した。
本稿では,この新興領域を体系的に調査する。
論文 参考訳(メタデータ) (2026-01-15T18:55:03Z) - Flexible Swarm Learning May Outpace Foundation Models in Essential Tasks [0.0]
ファウンデーションモデルはAIを急速に進歩させ、彼らの決定が現実世界のドメインにおける人間の戦略を上回るかどうかという疑問を提起している。
一般的な課題は、複雑なシステムを動的環境に適応させることである。
モノリシックな基盤モデルは、それを克服する上で概念的な限界に直面している、と私たちは主張する。
対話型小型エージェントネットワーク(SAN)の分散アーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-10-07T18:10:31Z) - A Comprehensive Review of AI Agents: Transforming Possibilities in Technology and Beyond [3.96715377510494]
Reviewは、次世代のAIエージェントシステムを、より堅牢で適応性があり、信頼できる自律的知性へと導くことを目指している。
認知科学に触発されたモデル、階層的強化学習フレームワーク、および大規模言語モデルに基づく推論から洞察を合成する。
我々は、これらのエージェントを現実世界のシナリオに展開する際の倫理的、安全性、解釈可能性に関する懸念について論じる。
論文 参考訳(メタデータ) (2025-08-16T07:38:45Z) - Quantum-Evolutionary Neural Networks for Multi-Agent Federated Learning [0.0]
本稿では,量子インスパイアされたニューラルネットワークと進化的アルゴリズムを組み合わせて,マルチエージェントシステムにおけるリアルタイム意思決定を最適化する新しいフレームワークを提案する。
このフレームワークは、エージェントがリアルタイムで環境に適応できるように設計されており、自律システムやスマートシティ、ヘルスケアといった分野のアプリケーションに対する意思決定プロセスを最適化する。
論文 参考訳(メタデータ) (2025-05-16T20:51:37Z) - A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - Intelligent Offloading in Vehicular Edge Computing: A Comprehensive Review of Deep Reinforcement Learning Approaches and Architectures [9.21746609806009]
インテリジェントトランスポーテーションシステム(ITS)の複雑さは、エッジサーバ、車両ノード、UAVなどの外部インフラストラクチャへの計算オフロードに大きな関心を惹き付けている。
深部強化学習(DRL)による車両エッジコンピューティング(VEC)用オフロードの最近の進歩
学習パラダイム(シングルエージェント、マルチエージェントなど)、システムアーキテクチャ(集中型、分散型、階層型)、最適化目標(レイテンシ、エネルギー、公正性など)に基づいて、既存の作業の分類と比較を行う。
論文 参考訳(メタデータ) (2025-02-10T19:02:20Z) - Investigating Bi-Level Optimization for Learning and Vision from a
Unified Perspective: A Survey and Beyond [114.39616146985001]
機械学習やコンピュータビジョンの分野では、モチベーションやメカニズムが異なるにもかかわらず、複雑な問題の多くは、一連の密接に関連するサブプロトコルを含んでいる。
本稿では,BLO(Bi-Level Optimization)の観点から,これらの複雑な学習と視覚問題を一様に表現する。
次に、値関数に基づく単一レベル再構成を構築し、主流勾配に基づくBLO手法を理解し、定式化するための統一的なアルゴリズムフレームワークを確立する。
論文 参考訳(メタデータ) (2021-01-27T16:20:23Z) - AI Centered on Scene Fitting and Dynamic Cognitive Network [4.228224431041357]
より強力な人工知能を実現するためには、エンドツーエンドの関数計算を変更する必要がある。
また、動的認知ネットワークモデル(DCNet)と呼ばれる具体的なスキームについても論じている。
論文 参考訳(メタデータ) (2020-10-02T06:13:41Z) - Distributed and Democratized Learning: Philosophy and Research
Challenges [80.39805582015133]
民主化学習(Dem-AI)という新しいデザイン哲学を提案する。
ヒトの社会的グループに触発され、提案されたDem-AIシステムの学習エージェントの専門グループは階層構造で自己組織化され、より効率的に学習タスクを遂行する。
本稿では,様々な学際分野に触発された未来のDem-AIシステムを実現するためのガイドラインとして,参照設計を提案する。
論文 参考訳(メタデータ) (2020-03-18T08:45:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。