論文の概要: Standardized feature extraction from pairwise conflicts applied to the
train rescheduling problem
- arxiv url: http://arxiv.org/abs/2204.03061v1
- Date: Wed, 6 Apr 2022 19:52:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-08 13:29:41.761170
- Title: Standardized feature extraction from pairwise conflicts applied to the
train rescheduling problem
- Title(参考訳): 列車再スケジュール問題に適用した相反からの特徴抽出の標準化
- Authors: Anik\'o Kopacz, \'Agnes Mester, S\'andor Kolumb\'an and Csat\'o Lehel
- Abstract要約: 本研究では,2つの列車間の衝突を同定し,最適に解決する解析手法を提案する。
これらの矛盾を考慮に入れた最も関連性の高い情報を特徴付ける観測空間を設計する。
この方法で得られたデータは、強化学習フレームワークのコンテキストにおけるアクションに変換される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a train rescheduling algorithm which applies a standardized
feature selection based on pairwise conflicts in order to serve as input for
the reinforcement learning framework. We implement an analytical method which
identifies and optimally solves every conflict arising between two trains, then
we design a corresponding observation space which features the most relevant
information considering these conflicts. The data obtained this way then
translates to actions in the context of the reinforcement learning framework.
We test our preliminary model using the evaluation metrics of the Flatland
Challenge. The empirical results indicate that the suggested feature space
provides meaningful observations, from which a sensible scheduling policy can
be learned.
- Abstract(参考訳): 強化学習フレームワークのインプットとして,一対の競合に基づく標準化された特徴選択を適用した列車再スケジューリングアルゴリズムを提案する。
本研究では,両列車間の衝突を識別・最適に解決する解析手法を実装し,これらの衝突を考慮した最も関連する情報を特徴とする観測空間の設計を行う。
この方法で得られたデータは、強化学習フレームワークのコンテキストにおけるアクションに変換される。
フラットランドチャレンジの評価指標を用いて予備モデルをテストする。
実験結果から,提案する機能空間は有意義な観察を提供し,そこから合理的なスケジューリングポリシーを学習できることが示唆された。
関連論文リスト
- READ: Improving Relation Extraction from an ADversarial Perspective [33.44949503459933]
関係抽出(RE)に特化して設計された対角的学習法を提案する。
提案手法では,シーケンスレベルの摂動とトークンレベルの摂動の両方をサンプルに導入し,個別の摂動語彙を用いてエンティティとコンテキストの摂動の探索を改善する。
論文 参考訳(メタデータ) (2024-04-02T16:42:44Z) - Foundations of Reinforcement Learning and Interactive Decision Making [81.76863968810423]
本稿では,頻度主義的アプローチとベイズ的アプローチを用いた探索・探索ジレンマに対処するための統一的な枠組みを提案する。
ニューラルネットワークのような近似とフレキシブルなモデルクラスを機能させるために特別な注意が払われる。
論文 参考訳(メタデータ) (2023-12-27T21:58:45Z) - Federated Learning for Heterogeneous Bandits with Unobserved Contexts [0.0]
我々は、未知のコンテキストを持つ多腕コンテキスト包帯のフェデレーション問題について検討する。
線形パラメタライズされた報酬関数に対して,除去に基づくアルゴリズムを提案し,後悔の束縛を証明した。
論文 参考訳(メタデータ) (2023-03-29T22:06:24Z) - Linear Combinatorial Semi-Bandit with Causally Related Rewards [5.347237827669861]
ネットワークのトポロジを学習することで因果関係を決定する政策を提案する。
提案アルゴリズムのサブ線形後悔境界を確立する。
論文 参考訳(メタデータ) (2022-12-25T16:05:21Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Is it all a cluster game? -- Exploring Out-of-Distribution Detection
based on Clustering in the Embedding Space [7.856998585396422]
新しい入力がトレーニング分布と大きく異なるタイミングを決定するためには、ディープニューラルネットワークの安全性クリティカルな応用が不可欠である。
埋め込み空間におけるクラスタの構造と分離について検討し、教師付きコントラスト学習が十分に分離されたクラスタに繋がることを示す。
異なるトレーニング方法、クラスタリング戦略、距離メトリクス、しきい値設定アプローチの分析において、明確な勝者は存在しない。
論文 参考訳(メタデータ) (2022-03-16T11:22:23Z) - Unpaired Referring Expression Grounding via Bidirectional Cross-Modal
Matching [53.27673119360868]
表現基盤の参照はコンピュータビジョンにおいて重要かつ困難な課題である。
本稿では,これらの課題に対処する新しい双方向クロスモーダルマッチング(BiCM)フレームワークを提案する。
私たちのフレームワークは、2つの一般的なグラウンドデータセットで、以前の作業の6.55%と9.94%を上回っています。
論文 参考訳(メタデータ) (2022-01-18T01:13:19Z) - On Covariate Shift of Latent Confounders in Imitation and Reinforcement
Learning [69.48387059607387]
模擬・強化学習において,未観測の共同設立者と専門家データを併用することの問題点を考察する。
我々は、外部報酬を伴わずに、確立した専門家データから学ぶことの限界を分析する。
我々は,支援医療とレコメンデーションシステムシミュレーションの課題に挑戦する上で,我々の主張を実証的に検証する。
論文 参考訳(メタデータ) (2021-10-13T07:31:31Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Fair Representation Learning using Interpolation Enabled Disentanglement [9.043741281011304]
a) 下流タスクに対する学習された表現の有用性を確保しつつ、公平な不整合表現を同時に学べるか、(b) 提案手法が公正かつ正確であるかどうかに関する理論的知見を提供する。
前者に対応するために,補間可能外乱を用いた公正表現学習法FRIEDを提案する。
論文 参考訳(メタデータ) (2021-07-31T17:32:12Z) - Congestion-aware Multi-agent Trajectory Prediction for Collision
Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。
学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。
実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文 参考訳(メタデータ) (2021-03-26T02:42:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。