論文の概要: Teaching Models new APIs: Domain-Agnostic Simulators for Task Oriented
Dialogue
- arxiv url: http://arxiv.org/abs/2110.06905v1
- Date: Wed, 13 Oct 2021 17:39:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 15:01:09.886031
- Title: Teaching Models new APIs: Domain-Agnostic Simulators for Task Oriented
Dialogue
- Title(参考訳): 新しいAPIを教える:タスク指向対話のためのドメインに依存しないシミュレータ
- Authors: Moya Chen, Paul A. Crook, Stephen Roller
- Abstract要約: 大規模言語モデルは,API実装と目標リストのみを具備した,新しいドメインでのタスク指向対話をシミュレートできることを示す。
これらのシミュレーションは、人間の評価とよく相関するオンライン自動メトリクスを定式化することができる。
- 参考スコア(独自算出の注目度): 10.819838310471791
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We demonstrate that large language models are able to simulate Task Oriented
Dialogues in novel domains, provided only with an API implementation and a list
of goals. We show these simulations can formulate online, automatic metrics
that correlate well with human evaluations. Furthermore, by checking for
whether the User's goals are met, we can use simulation to repeatedly generate
training data and improve the quality of simulations themselves. With no human
intervention or domain-specific training data, our simulations bootstrap
end-to-end models which achieve a 37\% error reduction in previously unseen
domains. By including as few as 32 domain-specific conversations, bootstrapped
models can match the performance of a fully-supervised model with $10\times$
more data. To our knowledge, this is the first time simulations have been shown
to be effective at bootstrapping models without explicitly requiring any
domain-specific training data, rule-engineering, or humans-in-the-loop.
- Abstract(参考訳): 大規模言語モデルでは,タスク指向の対話を新たなドメインでシミュレートすることが可能であり,apiの実装と目標リストのみを提供する。
これらのシミュレーションは、人間の評価とよく相関するオンライン自動メトリクスを定式化することができる。
さらに,ユーザの目標が満たされているかどうかを確認することにより,シミュレーションを用いて繰り返しトレーニングデータを生成し,シミュレーション自体の品質を向上させることができる。
人間の介入やドメイン固有のトレーニングデータがないため、シミュレーションでは、これまで見られなかったドメインで37 %のエラー削減を実現したエンドツーエンドモデルをブートストラップする。
32のドメイン固有の会話を含むことで、ブートストラップされたモデルは、完全な教師付きモデルのパフォーマンスと10ドル以上のデータとを一致させることができる。
私たちの知る限りでは、ドメイン固有のトレーニングデータ、ルールエンジニアリング、ループ内の人間を明示的に必要とせずに、モデルのブートストラップに効果的なシミュレーションが示されているのはこれが初めてです。
関連論文リスト
- Data Shapley in One Training Run [88.59484417202454]
Data Shapleyは、機械学習コンテキストにおけるデータのコントリビューションに寄与するための、原則化されたフレームワークを提供する。
既存のアプローチでは、計算集約的な異なるデータサブセット上の再学習モデルが必要である。
本稿では、対象とするデータモデルに対するスケーラブルなデータ属性を提供することにより、これらの制限に対処するIn-Run Data Shapleyを紹介する。
論文 参考訳(メタデータ) (2024-06-16T17:09:24Z) - Beyond Human Data: Scaling Self-Training for Problem-Solving with Language Models [115.501751261878]
人為的なデータに基づく微調整言語モデル(LM)が普及している。
我々は、スカラーフィードバックにアクセス可能なタスクにおいて、人間のデータを超えることができるかどうか検討する。
ReST$EM$はモデルサイズに好適にスケールし、人間のデータのみによる微調整を大幅に上回っていることがわかった。
論文 参考訳(メタデータ) (2023-12-11T18:17:43Z) - Neural Likelihood Approximation for Integer Valued Time Series Data [0.0]
我々は、基礎となるモデルの無条件シミュレーションを用いて訓練できるニューラルな可能性近似を構築した。
本手法は,多くの生態学的および疫学的モデルを用いて推定を行うことにより実証する。
論文 参考訳(メタデータ) (2023-10-19T07:51:39Z) - Robust Category-Level 3D Pose Estimation from Synthetic Data [17.247607850702558]
CADモデルから生成されたオブジェクトポーズ推定のための新しい合成データセットであるSyntheticP3Dを紹介する。
逆レンダリングによるポーズ推定を行うニューラルネットワークモデルをトレーニングするための新しいアプローチ(CC3D)を提案する。
論文 参考訳(メタデータ) (2023-05-25T14:56:03Z) - Architecture, Dataset and Model-Scale Agnostic Data-free Meta-Learning [119.70303730341938]
データフリーメタトレーニングにおけるePisode cUrriculum inversion(ECI)と、内部ループ後のinvErsion calibRation(ICFIL)を提案する。
ECIは、メタモデルのリアルタイムフィードバックに応じて、擬似エピソードの難易度を適応的に増加させる。
本稿では,ECIを用いたメタトレーニングの最適化過程を,エンド・ツー・エンド方式で近似形式として定式化する。
論文 参考訳(メタデータ) (2023-03-20T15:10:41Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z) - Model Reprogramming: Resource-Efficient Cross-Domain Machine Learning [65.268245109828]
視覚、言語、音声などのデータに富む領域では、ディープラーニングが高性能なタスク固有モデルを提供するのが一般的である。
リソース制限されたドメインでのディープラーニングは、(i)限られたデータ、(ii)制約付きモデル開発コスト、(iii)効果的な微調整のための適切な事前学習モデルの欠如など、多くの課題に直面している。
モデル再プログラミングは、ソースドメインから十分に訓練されたモデルを再利用して、モデル微調整なしでターゲットドメインのタスクを解くことで、リソース効率のよいクロスドメイン機械学習を可能にする。
論文 参考訳(メタデータ) (2022-02-22T02:33:54Z) - Style-transfer GANs for bridging the domain gap in synthetic pose
estimator training [8.508403388002133]
画素レベルの画像変換に汎用的なGANモデルを採用することを提案する。
得られたモデルは、トレーニング中または推論時に、ドメインギャップをブリッジするために使用される。
ドメインランダム化の程度で訓練されたモデルと比較すると,モデルの性能は大幅に向上した。
論文 参考訳(メタデータ) (2020-04-28T17:35:03Z) - BayesFlow: Learning complex stochastic models with invertible neural
networks [3.1498833540989413]
可逆ニューラルネットワークに基づく世界規模のベイズ推定手法を提案する。
BayesFlowは、観測されたデータを最大情報的な要約統計に埋め込むよう訓練された要約ネットワークを組み込んでいる。
本研究では, 人口動態, 疫学, 認知科学, 生態学の難易度モデルに対するベイズフローの有用性を実証する。
論文 参考訳(メタデータ) (2020-03-13T13:39:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。