論文の概要: Synthetically Generating Human-like Data for Sequential Decision Making
Tasks via Reward-Shaped Imitation Learning
- arxiv url: http://arxiv.org/abs/2304.07280v1
- Date: Fri, 14 Apr 2023 17:48:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-17 12:52:12.177912
- Title: Synthetically Generating Human-like Data for Sequential Decision Making
Tasks via Reward-Shaped Imitation Learning
- Title(参考訳): Reward-Shaped Imitation Learning を用いたシーケンス決定タスクのための人型データの合成
- Authors: Bryan Brandt and Prithviraj Dasgupta
- Abstract要約: 我々は,コンピュータゲームのような対話型人間AIシステムにおいて,人間の判断と密接に類似するデータを合成的に生成する問題を考える。
そこで本研究では,人間から収集した意思決定データのごく小さなセットから始まりながら,人間的な意思決定データを生成する新しいアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.5801044612920815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of synthetically generating data that can closely
resemble human decisions made in the context of an interactive human-AI system
like a computer game. We propose a novel algorithm that can generate synthetic,
human-like, decision making data while starting from a very small set of
decision making data collected from humans. Our proposed algorithm integrates
the concept of reward shaping with an imitation learning algorithm to generate
the synthetic data. We have validated our synthetic data generation technique
by using the synthetically generated data as a surrogate for human interaction
data to solve three sequential decision making tasks of increasing complexity
within a small computer game-like setup. Different empirical and statistical
analyses of our results show that the synthetically generated data can
substitute the human data and perform the game-playing tasks almost
indistinguishably, with very low divergence, from a human performing the same
tasks.
- Abstract(参考訳): 我々は,コンピュータゲームのような対話型人間AIシステムにおいて,人間の判断と密接に類似するデータを合成的に生成する問題を考える。
本研究では,人間から収集された意思決定データの中から,人工的,人間的,意思決定データを生成する新しいアルゴリズムを提案する。
提案アルゴリズムは、報酬形成の概念と模倣学習アルゴリズムを統合して合成データを生成する。
我々は,人工的に生成されたデータをヒューマンインタラクションデータのサロゲートとして利用し,小型コンピュータゲーム環境における複雑さの増大という3つの逐次的決定課題を解決し,合成データ生成手法の検証を行った。
実験データと統計データを比較した結果, 人工的に生成したデータは, 人間のデータに代えて, ゲームプレイングタスクを, ほぼ区別がつかず, 非常に低いばらつきで行うことができることがわかった。
関連論文リスト
- A Little Human Data Goes A Long Way [28.80639362933004]
Fact Verification (FV) と Question Answering (QA) における合成データの利用について検討する。
純粋に合成されたデータに基づいてトレーニングされたモデルは、125個の人為的なデータポイントを含むことで、確実に改善できることがわかった。
論文 参考訳(メタデータ) (2024-10-17T00:04:02Z) - Can AI Serve as a Substitute for Human Subjects in Software Engineering
Research? [24.39463126056733]
本稿では,人工知能(AI)の能力を活用したソフトウェア工学研究における定性データ収集手法を提案する。
定性的データの代替源としてAI生成合成テキストの可能性を探る。
観察研究とユーザ評価における人間の行動のエミュレートを目的とした新しい基礎モデルの開発について論じる。
論文 参考訳(メタデータ) (2023-11-18T14:05:52Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - Let's Synthesize Step by Step: Iterative Dataset Synthesis with Large
Language Models by Extrapolating Errors from Small Models [69.76066070227452]
※データ合成*はラベル付きデータの少ない小さなモデルをトレーニングするための有望な方法です。
本稿では,この分散ギャップを縮めるデータ合成フレームワークであるStep* (**S3**) による合成ステップを提案する。
提案手法は,合成データセットと実データとのギャップを小さくすることで,小型モデルの性能を向上させる。
論文 参考訳(メタデータ) (2023-10-20T17:14:25Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Human-Centric Multimodal Machine Learning: Recent Advances and Testbed
on AI-based Recruitment [66.91538273487379]
人間中心のアプローチでAIアプリケーションを開発する必要性には、ある程度のコンセンサスがある。
i)ユーティリティと社会的善、(ii)プライバシとデータ所有、(iii)透明性と説明責任、(iv)AIによる意思決定プロセスの公正性。
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
論文 参考訳(メタデータ) (2023-02-13T16:44:44Z) - Advancing Semi-Supervised Learning for Automatic Post-Editing: Data-Synthesis by Mask-Infilling with Erroneous Terms [5.366354612549173]
高品質な合成データを作成するためのデータ合成手法に着目する。
本稿では,結果の合成データが実際のデータにある翻訳誤りを模倣するデータ合成手法を提案する。
実験結果から, 提案手法により生成した合成データを用いることで, 既存の合成データよりもAPEの性能が有意に向上することがわかった。
論文 参考訳(メタデータ) (2022-04-08T07:48:57Z) - Synt++: Utilizing Imperfect Synthetic Data to Improve Speech Recognition [18.924716098922683]
合成データによる機械学習は、合成データと実際のデータ分布のギャップのため、簡単ではない。
本稿では,分散ギャップに起因する問題を緩和するために,トレーニング中の2つの新しい手法を提案する。
これらの手法は,合成データを用いた音声認識モデルの訓練を著しく改善することを示す。
論文 参考訳(メタデータ) (2021-10-21T21:11:42Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - Foundations of Bayesian Learning from Synthetic Data [1.6249267147413522]
我々はベイズパラダイムを用いて、合成データから学習する際のモデルパラメータの更新を特徴付ける。
ベイジアン・アップデートの最近の成果は、決定理論に基づく新しい、堅牢な合成学習のアプローチを支持している。
論文 参考訳(メタデータ) (2020-11-16T21:49:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。