Fugu-MT 論文翻訳(概要): Standardized feature extraction from pairwise conflicts applied to the train rescheduling problem

論文の概要: Standardized feature extraction from pairwise conflicts applied to the train rescheduling problem

arxiv url: http://arxiv.org/abs/2204.03061v1
Date: Wed, 6 Apr 2022 19:52:43 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-08 13:29:41.761170
Title: Standardized feature extraction from pairwise conflicts applied to the train rescheduling problem
Title（参考訳）: 列車再スケジュール問題に適用した相反からの特徴抽出の標準化
Authors: Anik\'o Kopacz, \'Agnes Mester, S\'andor Kolumb\'an and Csat\'o Lehel
Abstract要約: 本研究では,2つの列車間の衝突を同定し,最適に解決する解析手法を提案する。これらの矛盾を考慮に入れた最も関連性の高い情報を特徴付ける観測空間を設計する。この方法で得られたデータは、強化学習フレームワークのコンテキストにおけるアクションに変換される。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a train rescheduling algorithm which applies a standardized feature selection based on pairwise conflicts in order to serve as input for the reinforcement learning framework. We implement an analytical method which identifies and optimally solves every conflict arising between two trains, then we design a corresponding observation space which features the most relevant information considering these conflicts. The data obtained this way then translates to actions in the context of the reinforcement learning framework. We test our preliminary model using the evaluation metrics of the Flatland Challenge. The empirical results indicate that the suggested feature space provides meaningful observations, from which a sensible scheduling policy can be learned.
Abstract（参考訳）: 強化学習フレームワークのインプットとして,一対の競合に基づく標準化された特徴選択を適用した列車再スケジューリングアルゴリズムを提案する。本研究では,両列車間の衝突を識別・最適に解決する解析手法を実装し,これらの衝突を考慮した最も関連する情報を特徴とする観測空間の設計を行う。この方法で得られたデータは、強化学習フレームワークのコンテキストにおけるアクションに変換される。フラットランドチャレンジの評価指標を用いて予備モデルをテストする。実験結果から,提案する機能空間は有意義な観察を提供し,そこから合理的なスケジューリングポリシーを学習できることが示唆された。

関連論文リスト

Efficient Preference-Based Reinforcement Learning: Randomized Exploration Meets Experimental Design [11.313040194648828]
マルコフ決定過程における人間のフィードバックからの強化学習について検討する。中心的な課題は、基礎となる報酬を特定するために、情報的嗜好クエリを選択するアルゴリズムを設計することである。本稿では,ランダム化探索に基づくメタアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-06-11T08:27:16Z)
READ: Improving Relation Extraction from an ADversarial Perspective [33.44949503459933]
関係抽出(RE)に特化して設計された対角的学習法を提案する。提案手法では,シーケンスレベルの摂動とトークンレベルの摂動の両方をサンプルに導入し,個別の摂動語彙を用いてエンティティとコンテキストの摂動の探索を改善する。
論文参考訳（メタデータ） (2024-04-02T16:42:44Z)
Learning covariate importance for matching in policy-relevant observational research [2.6361497319422176]
優先性を考慮した1対1マッチングアルゴリズム(PAMA)を提案する。専門家によってペアリングされ、それを使って追加のユニットにマッチするユニットのサブセットデータから、共変量重大度を学習する半教師付きフレームワークである。これは、実世界での学校教育と新型コロナウイルスの感染に関する研究に応用されている。
論文参考訳（メタデータ） (2024-03-19T02:24:16Z)
Foundations of Reinforcement Learning and Interactive Decision Making [81.76863968810423]
本稿では,頻度主義的アプローチとベイズ的アプローチを用いた探索・探索ジレンマに対処するための統一的な枠組みを提案する。ニューラルネットワークのような近似とフレキシブルなモデルクラスを機能させるために特別な注意が払われる。
論文参考訳（メタデータ） (2023-12-27T21:58:45Z)
Federated Learning for Heterogeneous Bandits with Unobserved Contexts [0.0]
我々は、未知のコンテキストを持つ多腕コンテキスト包帯のフェデレーション問題について検討する。線形パラメタライズされた報酬関数に対して,除去に基づくアルゴリズムを提案し,後悔の束縛を証明した。
論文参考訳（メタデータ） (2023-03-29T22:06:24Z)
Linear Combinatorial Semi-Bandit with Causally Related Rewards [5.347237827669861]
ネットワークのトポロジを学習することで因果関係を決定する政策を提案する。提案アルゴリズムのサブ線形後悔境界を確立する。
論文参考訳（メタデータ） (2022-12-25T16:05:21Z)
Towards Out-of-Distribution Sequential Event Prediction: A Causal Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文参考訳（メタデータ） (2022-10-24T07:54:13Z)
Is it all a cluster game? -- Exploring Out-of-Distribution Detection based on Clustering in the Embedding Space [7.856998585396422]
新しい入力がトレーニング分布と大きく異なるタイミングを決定するためには、ディープニューラルネットワークの安全性クリティカルな応用が不可欠である。埋め込み空間におけるクラスタの構造と分離について検討し、教師付きコントラスト学習が十分に分離されたクラスタに繋がることを示す。異なるトレーニング方法、クラスタリング戦略、距離メトリクス、しきい値設定アプローチの分析において、明確な勝者は存在しない。
論文参考訳（メタデータ） (2022-03-16T11:22:23Z)
Unpaired Referring Expression Grounding via Bidirectional Cross-Modal Matching [53.27673119360868]
表現基盤の参照はコンピュータビジョンにおいて重要かつ困難な課題である。本稿では,これらの課題に対処する新しい双方向クロスモーダルマッチング(BiCM)フレームワークを提案する。私たちのフレームワークは、2つの一般的なグラウンドデータセットで、以前の作業の6.55%と9.94%を上回っています。
論文参考訳（メタデータ） (2022-01-18T01:13:19Z)
On Covariate Shift of Latent Confounders in Imitation and Reinforcement Learning [69.48387059607387]
模擬・強化学習において,未観測の共同設立者と専門家データを併用することの問題点を考察する。我々は、外部報酬を伴わずに、確立した専門家データから学ぶことの限界を分析する。我々は,支援医療とレコメンデーションシステムシミュレーションの課題に挑戦する上で,我々の主張を実証的に検証する。
論文参考訳（メタデータ） (2021-10-13T07:31:31Z)
A method of supervised learning from conflicting data with hidden contexts [6.459225559630302]
我々は、複数の観測不能領域からトレーニングデータを抽出する、より一般的な教師付き学習問題を定式化する。このデータに固有の矛盾は、標準的な経験的リスク最小化トレーニングを非効率にする。本稿では、異なる予測モデルに競合するデータを割り当てることを学ぶアロケーション関数を導入する手法LEAFを提案する。
論文参考訳（メタデータ） (2021-08-27T04:18:45Z)
Learning Bias-Invariant Representation by Cross-Sample Mutual Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文参考訳（メタデータ） (2021-08-11T21:17:02Z)
Fair Representation Learning using Interpolation Enabled Disentanglement [9.043741281011304]
a) 下流タスクに対する学習された表現の有用性を確保しつつ、公平な不整合表現を同時に学べるか、(b) 提案手法が公正かつ正確であるかどうかに関する理論的知見を提供する。前者に対応するために,補間可能外乱を用いた公正表現学習法FRIEDを提案する。
論文参考訳（メタデータ） (2021-07-31T17:32:12Z)
Congestion-aware Multi-agent Trajectory Prediction for Collision Avoidance [110.63037190641414]
渋滞パターンを明示的に学習し、新しい「センス--学習--Reason--予測」フレームワークを考案する。学習段階を2段階に分解することで、「学生」は「教師」から文脈的手がかりを学習し、衝突のない軌跡を生成する。実験では,提案モデルが合成データセットにおいて衝突のない軌道予測を生成できることを実証する。
論文参考訳（メタデータ） (2021-03-26T02:42:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。