論文の概要: Capturing waste collection planning expert knowledge in a fitness
function through preference learning
- arxiv url: http://arxiv.org/abs/2402.01849v1
- Date: Fri, 2 Feb 2024 19:04:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 23:50:34.207488
- Title: Capturing waste collection planning expert knowledge in a fitness
function through preference learning
- Title(参考訳): 選好学習によるフィットネス機能における廃棄物収集計画知識の獲得
- Authors: Laura Fern\'andez D\'iaz, Miriam Fern\'andez D\'iaz, Jos\'e Ram\'on
Quevedo, Elena Monta\~n\'es
- Abstract要約: 本稿では,経路計画品質を評価するための適合度関数を構築した。
いくつかの重要なパフォーマンス指標と嗜好判断を慎重に確立する。
C-$index($98%、$94%)が21の指標のうち6または8の値に到達しているため、実験結果はこの仮説を裏付ける。
- 参考スコア(独自算出の注目度): 3.6505908567219585
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper copes with the COGERSA waste collection process. Up to now,
experts have been manually designed the process using a trial and error
mechanism. This process is not globally optimized, since it has been
progressively and locally built as council demands appear. Planning
optimization algorithms usually solve it, but they need a fitness function to
evaluate a route planning quality. The drawback is that even experts are not
able to propose one in a straightforward way due to the complexity of the
process. Hence, the goal of this paper is to build a fitness function though a
preference framework, taking advantage of the available expert knowledge and
expertise. Several key performance indicators together with preference
judgments are carefully established according to the experts for learning a
promising fitness function. Particularly, the additivity property of them makes
the task be much more affordable, since it allows to work with routes rather
than with route plannings. Besides, a feature selection analysis is performed
over such indicators, since the experts suspect of a potential existing (but
unknown) redundancy among them. The experiment results confirm this hypothesis,
since the best $C-$index ($98\%$ against around $94\%$) is reached when 6 or 8
out of 21 indicators are taken. Particularly, truck load seems to be a highly
promising key performance indicator, together to the travelled distance along
non-main roads. A comparison with other existing approaches shows that the
proposed method clearly outperforms them, since the $C-$index goes from $72\%$
or $90\%$ to $98\%$.
- Abstract(参考訳): 本稿では,COGERSA廃棄物収集プロセスに対処する。
これまで専門家は、試行錯誤のメカニズムを使って手動でプロセスを設計してきた。
このプロセスは、評議会の要求が現れるにつれて段階的かつ局所的に構築されているため、グローバルに最適化されていない。
計画最適化アルゴリズムは通常それを解くが、経路計画品質を評価するために適合度関数が必要である。
欠点は、専門家でさえ、プロセスの複雑さのために、簡単に提案できないことだ。
したがって,本論文の目標は,利用可能な専門家の知識と専門知識を生かして,選好フレームワークを用いたフィットネス機能の構築である。
有望なフィットネス機能を学ぶための専門家により、好み判定とともにいくつかの重要なパフォーマンス指標を慎重に確立する。
特に、それらの添加性は、経路計画よりもルートで作業できるので、タスクをより安価にすることができる。
さらに、専門家は、その中の潜在的な(しかし未知の)冗長性を疑っているため、このような指標に対して特徴選択分析が行われる。
実験の結果、21の指標のうち6つまたは8つが取られると、最高の$c-$index(約9,4\%$に対して98\%$)が得られるため、この仮説が裏付けられる。
特に、トラックの負荷は、非主要道路を走行する距離と共に、非常に有望なパフォーマンス指標であるように見える。
なぜなら、$C-$index は 72\%$ または 90\%$ から 98\%$ になるからである。
関連論文リスト
- How to Leverage Diverse Demonstrations in Offline Imitation Learning [39.24627312800116]
不完全な実演を伴うオフライン模倣学習(IL)は、専門家データの不足により注目を集めている。
本稿では, 結果の状態に基づいて正の挙動を識別する, 単純で効果的なデータ選択手法を提案する。
次に、専門家と選択したデータを正しく活用できる軽量な行動クローニングアルゴリズムを考案する。
論文 参考訳(メタデータ) (2024-05-24T04:56:39Z) - Inverse Reinforcement Learning with Sub-optimal Experts [56.553106680769474]
与えられた専門家の集合と互換性のある報酬関数のクラスの理論的性質について検討する。
以上の結果から,複数の準最適専門家の存在が,相反する報酬の集合を著しく減少させる可能性が示唆された。
我々は,最適なエージェントの1つに十分近い準最適専門家のパフォーマンスレベルが最適である場合に,最小限の最適化を行う一様サンプリングアルゴリズムを解析する。
論文 参考訳(メタデータ) (2024-01-08T12:39:25Z) - Behavior Alignment via Reward Function Optimization [23.92721220310242]
設計者のドメイン知識と環境のプライマリ報酬を反映した補助報酬を統合する新しいフレームワークを導入する。
提案手法の有効性を,小型実験から高次元制御課題に至るまで,様々な課題に対して評価する。
論文 参考訳(メタデータ) (2023-10-29T13:45:07Z) - No-Regret Online Prediction with Strategic Experts [16.54912614895861]
オンラインバイナリ予測の一般化をエキスパートアドバイスフレームワークを用いて研究し、各ラウンドで、学習者は、Kドルの専門家のプールからmgeq 1ドルの専門家を選ぶことができる。
我々は、専門家が戦略的に行動し、彼らの信念を誤報することでアルゴリズムの予測への影響を最大化することを目的とした設定に焦点を当てる。
目標は,次の2つの要件を満たすアルゴリズムを設計することです。 1) $textitIncentive-compatible$: 専門家に信念を真実に報告させるインセンティブ,2) $textitNo-regret$: Achieve。
論文 参考訳(メタデータ) (2023-05-24T16:43:21Z) - Progressive-Hint Prompting Improves Reasoning in Large Language Models [63.98629132836499]
本稿では,プログレッシブ・ヒント・プロンプト(PHP)と呼ばれる新しいプロンプト手法を提案する。
事前に生成された回答をヒントとして使用することで、ユーザとLLM(Large Language Models)間の自動多元的対話を可能にする。
我々は7つのベンチマークで広範囲かつ包括的な実験を行った。その結果、PHPは高い効率を保ちながら精度を大幅に向上することが示された。
論文 参考訳(メタデータ) (2023-04-19T16:29:48Z) - Optimal Sparse Recovery with Decision Stumps [7.24496247221802]
木に基づく手法は,多種多様な条件下で,強力な特徴選択特性が得られることを示す。
また,本分析の副産物として,アクティブ機能数$s$が不明な場合でも,回復を確実に保証できることを示す。
論文 参考訳(メタデータ) (2023-03-08T00:43:06Z) - Bayesian Optimization Over Iterative Learners with Structured Responses:
A Budget-aware Planning Approach [31.918476422203412]
本稿では,HPO 問題を解決するため,Budget-Aware Planning for Iterative Learningers (BAPI) と呼ばれる新しい手法を提案する。
反復学習者のための多様なHPOベンチマークの実験では、ほとんどの場合、BAPIは最先端のベースラインよりも優れた性能を示している。
論文 参考訳(メタデータ) (2022-06-25T18:44:06Z) - On the Representation Collapse of Sparse Mixture of Experts [102.83396489230375]
専門家のまばらな混合は、一定の計算オーバーヘッドを必要としながら、より大きなモデルキャパシティを提供する。
入力トークンを隠された表現に従ってベストマッチした専門家に分散するためにルーティング機構を使用する。
しかし、そのようなルーティングメカニズムを学ぶことで、専門家のセントロイドを中心にトークンのクラスタリングが促進され、表現の崩壊の傾向が示唆される。
論文 参考訳(メタデータ) (2022-04-20T01:40:19Z) - Compactness Score: A Fast Filter Method for Unsupervised Feature
Selection [66.84571085643928]
本稿では,CSUFS (Compactness Score) と呼ばれる高速な教師なし特徴選択手法を提案する。
提案アルゴリズムは既存のアルゴリズムよりも正確で効率的である。
論文 参考訳(メタデータ) (2022-01-31T13:01:37Z) - Provably Efficient Reward-Agnostic Navigation with Linear Value
Iteration [143.43658264904863]
我々は、最小二乗値スタイルのアルゴリズムで一般的に使用される、より標準的なベルマン誤差の概念の下での反復が、ほぼ最適値関数の学習において強力なPAC保証を提供することを示す。
そこで本稿では,任意の(線形な)報酬関数に対して,最適に近いポリシーを学習するためにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2020-08-18T04:34:21Z) - Hierarchical Reinforcement Learning as a Model of Human Task
Interleaving [60.95424607008241]
我々は、強化学習によって駆動される監督制御の階層モデルを開発する。
このモデルは、タスクインターリービングの既知の経験的効果を再現する。
その結果、階層的RLがタスクインターリービングのもっともらしいモデルとして支持された。
論文 参考訳(メタデータ) (2020-01-04T17:53:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。