論文の概要: Epicure: Distilling Sequence Model Predictions into Patterns
- arxiv url: http://arxiv.org/abs/2308.08203v1
- Date: Wed, 16 Aug 2023 08:08:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-17 14:23:16.477285
- Title: Epicure: Distilling Sequence Model Predictions into Patterns
- Title(参考訳): Epicure: シーケンスモデル予測をパターンに拡張する
- Authors: Miltiadis Allamanis, Earl T. Barr
- Abstract要約: 本稿では,シーケンスモデルの予測を単純なパターンに置き換える手法であるEpicureを提案する。
Epicureは10%の誤報率で、最良のモデル予測と比較して61%の地味な名前に一致するパターンを予測する。
- 参考スコア(独自算出の注目度): 18.509245510034713
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most machine learning models predict a probability distribution over concrete
outputs and struggle to accurately predict names over high entropy sequence
distributions. Here, we explore finding abstract, high-precision patterns
intrinsic to these predictions in order to make abstract predictions that
usefully capture rare sequences. In this short paper, we present Epicure, a
method that distils the predictions of a sequence model, such as the output of
beam search, into simple patterns. Epicure maps a model's predictions into a
lattice that represents increasingly more general patterns that subsume the
concrete model predictions.
On the tasks of predicting a descriptive name of a function given the source
code of its body and detecting anomalous names given a function, we show that
Epicure yields accurate naming patterns that match the ground truth more often
compared to just the highest probability model prediction. For a false alarm
rate of 10%, Epicure predicts patterns that match 61% more ground-truth names
compared to the best model prediction, making Epicure well-suited for scenarios
that require high precision.
- Abstract(参考訳): ほとんどの機械学習モデルは、具体的な出力よりも確率分布を予測し、高いエントロピーシーケンス分布よりも正確に名前を予測するのに苦労する。
ここでは,これらの予測に内在する抽象的かつ高精度なパターンを探索し,レアシーケンスを効果的にキャプチャする抽象的予測を行う。
本稿では,ビーム探索の出力などのシーケンスモデルの予測を単純なパターンに分解する手法であるepicureを提案する。
epicureはモデルの予測を、具体的モデル予測を仮定するより一般的なパターンの格子にマッピングする。
身体のソースコードが与えられた関数の記述的名前を予測し、関数が与えられた異常な名前を検出するタスクにおいて、Epicureは、単に高い確率モデル予測よりも、基底真実にマッチする正確な命名パターンを得られることを示す。
Epicureは10%の誤報率で、最高のモデル予測と比較して61%の地味な名前にマッチするパターンを予測し、高い精度を必要とするシナリオに適している。
関連論文リスト
- On the Efficient Marginalization of Probabilistic Sequence Models [3.5897534810405403]
この論文は、複雑な確率的クエリに答えるために自己回帰モデルを使うことに焦点を当てている。
我々は,モデルに依存しない逐次モデルにおいて,境界化のための新しい,効率的な近似手法のクラスを開発する。
論文 参考訳(メタデータ) (2024-03-06T19:29:08Z) - Best of Many in Both Worlds: Online Resource Allocation with Predictions under Unknown Arrival Model [16.466711636334587]
オンライン意思決定者は、到着や要求など、将来の変数に関する予測を得ることが多い。
意思決定者にとって予測精度は未知であるため、予測に盲目的に追従することは有害である。
我々は未知の予測精度に頑健な方法で予測を利用するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-02-21T04:57:32Z) - Predictive Churn with the Set of Good Models [64.05949860750235]
近似機械学習モデルの集合に対する競合予測の効果について検討する。
ラーショモン集合内のモデル間の係り受けに関する理論的結果を示す。
当社のアプローチは、コンシューマ向けアプリケーションにおいて、より予測し、削減し、混乱を避けるためにどのように使用できるかを示します。
論文 参考訳(メタデータ) (2024-02-12T16:15:25Z) - Rationalizing Predictions by Adversarial Information Calibration [65.19407304154177]
我々は2つのモデルを共同で訓練する: 1つは、正確だがブラックボックスな方法でタスクを解く典型的なニューラルモデルであり、もう1つは、予測の理論的根拠を付加するセレクタ・予測モデルである。
我々は,2つのモデルから抽出した情報を,それらの違いが欠落した特徴や過度に選択された特徴の指標であるように校正するために,敵対的手法を用いる。
論文 参考訳(メタデータ) (2023-01-15T03:13:09Z) - Finding Islands of Predictability in Action Forecasting [7.215559809521136]
将来のアクションシーケンスは1つの抽象化レベルではなく、変数でより正確にモデル化されていることを示す。
本稿では,ベイズニューラルネットワークと階層的畳み込みセグメンテーションモデルを組み合わせて,将来の行動を正確に予測し,抽象化レベルを最適に選択する手法を提案する。
論文 参考訳(メタデータ) (2022-10-13T21:01:16Z) - HYPRO: A Hybridly Normalized Probabilistic Model for Long-Horizon
Prediction of Event Sequences [7.149677544861951]
本稿では,ハイブリッド正規化確率モデルHYPROを提案する。
複数の実世界のデータセットに対する実験により、提案したHYPROモデルが従来のモデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T17:18:26Z) - Predictive Multiplicity in Probabilistic Classification [25.111463701666864]
確率的分類における予測的乗数性を測定するための枠組みを提案する。
実世界のタスクにおける予測多重度の発生頻度と頻度を実証する。
その結果,予測多重度をより広範囲に報告する必要性が強調された。
論文 参考訳(メタデータ) (2022-06-02T16:25:29Z) - Pathologies of Pre-trained Language Models in Few-shot Fine-tuning [50.3686606679048]
実例が少ない事前学習言語モデルはラベル間に強い予測バイアスを示すことを示す。
わずかな微調整で予測バイアスを軽減できるが,本分析では,非タスク関連の特徴を捉えることで,モデルの性能向上を図っている。
これらの観察は、より少ない例でモデルのパフォーマンスを追求することは、病理学的予測行動を引き起こす可能性があることを警告する。
論文 参考訳(メタデータ) (2022-04-17T15:55:18Z) - Complex Event Forecasting with Prediction Suffix Trees: Extended
Technical Report [70.7321040534471]
複合イベント認識(CER)システムは、イベントのリアルタイムストリーム上のパターンを"即時"検出する能力によって、過去20年間に人気が高まっている。
このような現象が実際にCERエンジンによって検出される前に、パターンがいつ発生するかを予測する方法が不足している。
複雑なイベント予測の問題に対処しようとする形式的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-01T09:52:31Z) - Video Prediction via Example Guidance [156.08546987158616]
ビデオ予測タスクでは、将来のコンテンツとダイナミクスのマルチモーダルな性質を捉えることが大きな課題である。
本研究では,有効な将来状態の予測を効果的に行うための,シンプルで効果的なフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-03T14:57:24Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。