論文の概要: Reinforcement Learning for Standards Design
- arxiv url: http://arxiv.org/abs/2110.06909v1
- Date: Wed, 13 Oct 2021 17:46:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 15:37:58.386484
- Title: Reinforcement Learning for Standards Design
- Title(参考訳): 標準設計のための強化学習
- Authors: Shahrukh Khan Kasi, Sayandev Mukherjee, Lin Cheng, Bernardo A.
Huberman
- Abstract要約: そこで本稿では,所定のエアインターフェース上での制御および符号化方式の選択を「自動化」する手法を提案する。
提案手法では,コンストラクタエンティティが提案を評価対象エンティティに送信し,提案のスコアを返す。
- 参考スコア(独自算出の注目度): 1.4849450097895007
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Communications standards are designed via committees of humans holding
repeated meetings over months or even years until consensus is achieved. This
includes decisions regarding the modulation and coding schemes to be supported
over an air interface. We propose a way to "automate" the selection of the set
of modulation and coding schemes to be supported over a given air interface and
thereby streamline both the standards design process and the ease of extending
the standard to support new modulation schemes applicable to new higher-level
applications and services. Our scheme involves machine learning, whereby a
constructor entity submits proposals to an evaluator entity, which returns a
score for the proposal. The constructor employs reinforcement learning to
iterate on its submitted proposals until a score is achieved that was
previously agreed upon by both constructor and evaluator to be indicative of
satisfying the required design criteria (including performance metrics for
transmissions over the interface).
- Abstract(参考訳): コミュニケーション標準は、合意に達するまで数ヶ月、あるいは数年にわたって、繰り返し会議を行う人間の委員会によって設計される。
これには、エアインターフェース上でサポートされる変調およびコーディングスキームに関する決定が含まれる。
本稿では,与えられたairインターフェース上でサポートすべき変調方式と符号化方式の選択を"自動"して,標準設計プロセスと標準の拡張を合理化し,新たな高レベルアプリケーションやサービスに適用可能な新しい変調方式をサポートする方法を提案する。
提案手法では、機械学習を用いて、コンストラクタエンティティが提案をエキュレータエンティティに送信し、提案のスコアを返します。
コンストラクタは、要求される設計基準(インターフェース上の伝送性能指標を含む)を満たすために、コンストラクタとエミュレータの両方によって以前に合意されたスコアが達成されるまで、提案する提案を反復的に繰り返して強化学習する。
関連論文リスト
- Hierarchical Reinforcement Learning for Temporal Abstraction of Listwise Recommendation [51.06031200728449]
我々はmccHRLと呼ばれる新しいフレームワークを提案し、リストワイドレコメンデーションにおける時間的抽象化のレベルを異なるものにする。
階層的な枠組みの中では、ハイレベルエージェントがユーザ知覚の進化を研究し、低レベルエージェントがアイテム選択ポリシーを作成している。
その結果,本手法による性能改善は,いくつかのよく知られたベースラインと比較して有意な結果が得られた。
論文 参考訳(メタデータ) (2024-09-11T17:01:06Z) - LLM-enhanced Reranking in Recommender Systems [49.969932092129305]
リグレードはレコメンデーションシステムにおいて重要な要素であり、レコメンデーションアルゴリズムの出力を精査する上で重要な役割を果たす。
そこで我々は,様々な格付け基準をシームレスに統合する包括的格付けフレームワークを提案する。
カスタマイズ可能な入力機構も統合されており、言語モデルのフォーカスを特定の再配置のニーズに合わせることができる。
論文 参考訳(メタデータ) (2024-06-18T09:29:18Z) - Two-Stage Surrogate Modeling for Data-Driven Design Optimization with
Application to Composite Microstructure Generation [1.912429179274357]
本稿では,科学・工学分野における逆問題に対処する2段階の機械学習に基づく代理モデリングフレームワークを提案する。
最初の段階では、"Learner"と呼ばれる機械学習モデルは、予測出力が望ましい結果と密接に一致している入力デザイン空間内の候補の限られたセットを特定する。
第2段では、第1段で生成された縮小候補空間を評価するために、「評価器」として機能する別の代理モデルを用いる。
論文 参考訳(メタデータ) (2024-01-04T00:25:12Z) - Set-to-Sequence Ranking-based Concept-aware Learning Path Recommendation [49.85548436111153]
SRC(Set-to-Sequence Ranking-based Concept-Aware Learning Path Recommendation)という新しいフレームワークを提案する。
SRCは、セット・ツー・シーケンス・パラダイムの下でレコメンデーション・タスクを定式化する。
実世界の2つの公開データセットと1つの産業データセットについて広範な実験を行う。
論文 参考訳(メタデータ) (2023-06-07T08:24:44Z) - Design Space Exploration and Explanation via Conditional Variational
Autoencoders in Meta-model-based Conceptual Design of Pedestrian Bridges [52.77024349608834]
本稿では,条件付き変分オートエンコーダ(CVAE)による人間設計者向上のための性能駆動型設計探索フレームワークを提案する。
CVAEはスイスの歩行者橋の合成例18万件で訓練されている。
論文 参考訳(メタデータ) (2022-11-29T17:28:31Z) - Designing MacPherson Suspension Architectures using Bayesian
Optimization [21.295015276123962]
コンプライアンステストは、まず、規律モデルを用いたコンピュータシミュレーションによって行われる。
このシミュレーションを通した設計は、物理的プロトタイピングとして考慮される。
提案手法は汎用的で,スケーラブルで,効率的であることを示す。
論文 参考訳(メタデータ) (2022-06-17T21:50:25Z) - Model-based Deep Learning Receiver Design for Rate-Splitting Multiple
Access [65.21117658030235]
本研究では,モデルベース深層学習(MBDL)に基づく実用的なRSMA受信機の設計を提案する。
MBDL受信機は、符号なしシンボル誤り率(SER)、リンクレベルシミュレーション(LLS)によるスループット性能、平均トレーニングオーバーヘッドの観点から評価される。
その結果,MBDLはCSIRが不完全なSIC受信機よりも優れていた。
論文 参考訳(メタデータ) (2022-05-02T12:23:55Z) - House-GAN++: Generative Adversarial Layout Refinement Networks [37.60108582423617]
我々のアーキテクチャはグラフ制約付きGANと条件付きGANの統合であり、そこでは以前に生成されたレイアウトが次の入力制約となる。
我々の研究の驚くべき発見は、コンポーネントワイドGTコンディショニングと呼ばれる単純な非イテレーティブトレーニングプロセスが、そのようなジェネレータの学習に有効であることである。
論文 参考訳(メタデータ) (2021-03-03T18:15:52Z) - Sequential Learning-based IaaS Composition [0.11470070927586014]
時間条件優先ネットワーク(TempCP-net)に含まれる決定変数
時系列類似度尺度に基づくtextitk-d tree indexingを用いて、リクエストの集合のグローバル嗜好ランキングを算出する。
構成における要求の受け入れや拒否に要求の長さを適用する、オンポリシーに基づく逐次選択学習手法を設計する。
論文 参考訳(メタデータ) (2021-02-24T23:16:01Z) - Modular Networks for Compositional Instruction Following [102.152217117883]
本稿では,多様なサブゴールのシーケンスを記述する自然言語命令に従うモジュールアーキテクチャを提案する。
実行すべきモジュールのシーケンスは、命令をセグメント化し、各セグメントのサブゴール型を予測することを学ぶことで選択される。
ALFREDの標準の非モジュラー列列列列法と比較すると、モジュラー化は新たなサブゴラル合成への一般化を改善することが判明した。
論文 参考訳(メタデータ) (2020-10-24T03:48:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。