論文の概要: Learning State-Dependent Policy Parametrizations for Dynamic Technician Routing with Rework
- arxiv url: http://arxiv.org/abs/2409.01815v1
- Date: Tue, 3 Sep 2024 11:56:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 01:47:58.130586
- Title: Learning State-Dependent Policy Parametrizations for Dynamic Technician Routing with Rework
- Title(参考訳): リワークによる動的技術者ルーティングのための状態依存型政策パラメトリゼーションの学習
- Authors: Jonas Stein, Florentin D Hildebrandt, Barrett W Thomas, Marlin W Ulmer,
- Abstract要約: 家庭の修理と設置には、技術者が顧客を訪れ、異なる複雑さのタスクを解決する必要がある。
カスタマーの地理的拡散は 技術者のスキルと タスク要件の 完全な一致を達成します
本稿では、これらの要因の国家依存的バランスを強化学習を通して提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Home repair and installation services require technicians to visit customers and resolve tasks of different complexity. Technicians often have heterogeneous skills and working experiences. The geographical spread of customers makes achieving only perfect matches between technician skills and task requirements impractical. Additionally, technicians are regularly absent due to sickness. With non-perfect assignments regarding task requirement and technician skill, some tasks may remain unresolved and require a revisit and rework. Companies seek to minimize customer inconvenience due to delay. We model the problem as a sequential decision process where, over a number of service days, customers request service while heterogeneously skilled technicians are routed to serve customers in the system. Each day, our policy iteratively builds tours by adding "important" customers. The importance bases on analytical considerations and is measured by respecting routing efficiency, urgency of service, and risk of rework in an integrated fashion. We propose a state-dependent balance of these factors via reinforcement learning. A comprehensive study shows that taking a few non-perfect assignments can be quite beneficial for the overall service quality. We further demonstrate the value provided by a state-dependent parametrization.
- Abstract(参考訳): 家庭の修理と設置には、技術者が顧客を訪れ、異なる複雑さのタスクを解決する必要がある。
技術者はしばしば異質な技術と労働経験を持っている。
顧客の地理的拡散は、技術者のスキルとタスク要求の完全な一致を非現実的に達成するだけである。
さらに、技術者は病気のために定期的に欠席している。
タスク要件と技術者のスキルに関する完全な課題では、いくつかのタスクは未解決のままであり、再検討と再作業が必要である。
企業は遅延による顧客の不便を最小化しようとしている。
我々は、問題をシーケンシャルな意思決定プロセスとしてモデル化し、多くのサービスデイにおいて、顧客がサービスを要求する一方で、不均一に熟練した技術者がシステム内の顧客にサービスを提供するようにルーティングされる。
当社のポリシーは,毎日,"重要な"顧客を追加することで,ツアーを反復的に構築しています。
重要度は、ルーティング効率、サービスの緊急性、再作業のリスクを考慮し、分析的考察に基づいて測定される。
本稿では、これらの要因の国家依存的バランスを強化学習を通して提案する。
包括的な調査では、いくつかの非完全な割り当てをすることで、サービス品質全体にとって非常に有益であることが示されています。
さらに、状態依存パラメトリゼーションによって提供される値を示す。
関連論文リスト
- CRMArena: Understanding the Capacity of LLM Agents to Perform Professional CRM Tasks in Realistic Environments [90.29937153770835]
CRMArenaは、プロフェッショナルな作業環境に根ざした現実的なタスクにおいて、AIエージェントを評価するために設計されたベンチマークである。
現状のLDMエージェントはReActプロンプトのタスクの40%以下で成功し,機能呼び出し能力でも55%以下であった。
この結果から,実環境に展開する関数呼び出しやルールフォローにおいて,エージェント機能の向上の必要性が示唆された。
論文 参考訳(メタデータ) (2024-11-04T17:30:51Z) - WorkR: Occupation Inference for Intelligent Task Assistance [8.720927048233458]
本研究では、受動的センシングを利用して様々なタスクアクティビティから広汎な信号をキャプチャするフレームワークWorkRを紹介する。
アプリケーション利用,移動,社会的相互作用,環境からの信号は,ユーザの職業を知らせるものである,と我々は主張する。
匿名化された、コンテキストに富んだアクティビティとタスクログデータセットを用いた実験により、我々のモデルは91%以上の精度で正確な職業推定が可能であることを実証した。
論文 参考訳(メタデータ) (2024-07-26T05:23:55Z) - Learning Task Decomposition to Assist Humans in Competitive Programming [90.4846613669734]
タスク分解学習のための新しい目的,いわゆる値(AssistV)を導入する。
我々は、さまざまな分解されたソリューションに対して、人間の修理経験のデータセットを収集する。
人間の177時間以内の研究では、非専門家が33.3%の問題を解き、それらを3.3倍スピードアップさせ、無支援の専門家にマッチさせる権限を与える。
論文 参考訳(メタデータ) (2024-06-07T03:27:51Z) - Contact Complexity in Customer Service [21.106010378612876]
カスタマーサービスサポートに手を差し伸べる顧客は、複雑さのさまざまな問題に直面している可能性がある。
これに取り組むために、顧客の問題の複雑さを正確に予測する機械学習モデルが非常に望ましい。
我々は,接触複雑性を定義するための新しい機械学習手法を開発した。
論文 参考訳(メタデータ) (2024-02-24T00:09:27Z) - Can Foundation Models Watch, Talk and Guide You Step by Step to Make a
Cake? [62.59699229202307]
AIの進歩にもかかわらず、インタラクティブなタスクガイダンスシステムの開発は依然として大きな課題である。
我々は、人間のユーザと人間のインストラクターとの自然なインタラクションに基づいて、新しいマルチモーダルベンチマークデータセット、ウォッチ、トーク、ガイド(WTaG)を作成しました。
いくつかの基礎モデルを活用して、これらのモデルが認識可能なタスクガイダンスに迅速に適応できるかを調査した。
論文 参考訳(メタデータ) (2023-11-01T15:13:49Z) - Onsite Job Scheduling by Adaptive Genetic Algorithm [0.0]
ジョブスケジューリング(Job Scheduling)は、複数のデポを持つ車両問題(VRP)の特殊版である。
ジョブスケジューリング(Job Scheduling)は、複数のデポを持つ車両問題(VRP)の特殊版である。
その結果,仕事や技術者の移動経路を最適化し,所要時間とSLAに関する制約を最小化することができた。
論文 参考訳(メタデータ) (2023-06-04T08:13:33Z) - Generalizing to New Tasks via One-Shot Compositional Subgoals [23.15624959305799]
以前は見つからなかったタスクをほとんど、あるいはまったく監督せずに一般化する能力は、現代の機械学習研究において重要な課題である。
適応型「近未来」サブゴールを用いて、模倣学習エージェントを訓練することにより、これらの問題に対処しようとするCASEを導入する。
実験の結果,提案手法は従来よりも30%向上していることがわかった。
論文 参考訳(メタデータ) (2022-05-16T14:30:11Z) - Combining Modular Skills in Multitask Learning [149.8001096811708]
モジュラー設計は、ニューラルネットワークが様々な知識の面をアンタングルして再結合し、新しいタスクにより系統的に一般化することを奨励する。
この研究では、各タスクは(潜在的に小さな)インベントリから潜在的な離散スキルのサブセットと関連付けられていると仮定する。
ネットワークのモジュラー設計により、強化学習におけるサンプル効率が著しく向上し、教師あり学習における数ショットの一般化が図られる。
論文 参考訳(メタデータ) (2022-02-28T16:07:19Z) - Towards Collaborative Question Answering: A Preliminary Study [63.91687114660126]
我々は、モデレーターによって調整された複数の専門家エージェントが協力して、単一のエージェントだけでは答えられない質問に答える新しいQAタスクCollabQAを提案する。
専門家に分散可能な,大規模な知識グラフの合成データセットを作成する。
専門家が完璧で均一でない限り,コラボレーション構造を導入することなく,この問題が解決可能であることを示す。
論文 参考訳(メタデータ) (2022-01-24T14:27:00Z) - Latent Skill Planning for Exploration and Transfer [49.25525932162891]
本稿では,この2つの手法を1つの強化学習エージェントに統合する方法について検討する。
テスト時の高速適応に部分的償却の考え方を活用する。
私たちは、困難なロコモーションタスクのスイートでデザイン決定のメリットを実演しています。
論文 参考訳(メタデータ) (2020-11-27T18:40:03Z) - Finding teams that balance expert load and task coverage [7.831410227443101]
本稿では,各タスクが必須スキルとオプションスキルから構成される問題を考える。
BalancedTA問題(およびその変種)はNPハードであり、実際にそれを解決するために設計効率が良いことを示す。
論文 参考訳(メタデータ) (2020-11-03T18:04:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。