論文の概要: Efficient Model Selection for Predictive Pattern Mining Model by Safe
Pattern Pruning
- arxiv url: http://arxiv.org/abs/2306.13561v1
- Date: Fri, 23 Jun 2023 15:34:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-26 12:17:42.622587
- Title: Efficient Model Selection for Predictive Pattern Mining Model by Safe
Pattern Pruning
- Title(参考訳): safe pattern pruningによる予測パターンマイニングモデルの効率的なモデル選択
- Authors: Takumi Yoshida, Hiroyuki Hanada, Kazuya Nakagawa, Kouichi Taji, Koji
Tsuda, Ichiro Takeuchi
- Abstract要約: 予測パターンマイニングにおけるパターン番号の爆発に対処するために,安全パターンパニング法(SPP)を提案する。
提案手法の有効性を実証するために,集合,グラフ,シーケンスを含む回帰および分類問題に関する数値実験を行った。
- 参考スコア(独自算出の注目度): 14.892080531048956
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predictive pattern mining is an approach used to construct prediction models
when the input is represented by structured data, such as sets, graphs, and
sequences. The main idea behind predictive pattern mining is to build a
prediction model by considering substructures, such as subsets, subgraphs, and
subsequences (referred to as patterns), present in the structured data as
features of the model. The primary challenge in predictive pattern mining lies
in the exponential growth of the number of patterns with the complexity of the
structured data. In this study, we propose the Safe Pattern Pruning (SPP)
method to address the explosion of pattern numbers in predictive pattern
mining. We also discuss how it can be effectively employed throughout the
entire model building process in practical data analysis. To demonstrate the
effectiveness of the proposed method, we conduct numerical experiments on
regression and classification problems involving sets, graphs, and sequences.
- Abstract(参考訳): 予測パターンマイニング(英: Predictive pattern mining)は、入力が集合、グラフ、シーケンスなどの構造化データで表されるときに予測モデルを構築するために用いられるアプローチである。
予測パターンマイニングの背景にある主な考え方は、モデルの特徴として構造化データに存在するサブセット、サブグラフ、サブシーケンス(パターンとして参照)といったサブ構造を考慮し、予測モデルを構築することである。
予測パターンマイニングにおける最大の課題は、構造化データの複雑さを伴うパターン数の指数関数的増加である。
本研究では,予測パターンマイニングにおけるパターン番号の爆発に対処するために,セーフパターンプルーニング(SPP)法を提案する。
また、実際のデータ分析において、モデル構築プロセス全体を通して効果的に活用する方法についても論じる。
提案手法の有効性を実証するために,集合,グラフ,シーケンスを含む回帰および分類問題に関する数値実験を行った。
関連論文リスト
- Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Approximate learning of parsimonious Bayesian context trees [0.0]
提案するフレームワークは、合成および実世界のデータ例に基づいてテストされる。
これは、実際のタンパク質配列やハニーポットコンピュータターミナルセッションに適合すると、既存のシーケンスモデルより優れている。
論文 参考訳(メタデータ) (2024-07-27T11:50:40Z) - Fusion of Gaussian Processes Predictions with Monte Carlo Sampling [61.31380086717422]
科学と工学において、私たちはしばしば興味のある変数の正確な予測のために設計されたモデルで作業します。
これらのモデルが現実の近似であることを認識し、複数のモデルを同じデータに適用し、結果を統合することが望ましい。
論文 参考訳(メタデータ) (2024-03-03T04:21:21Z) - Generalizing Backpropagation for Gradient-Based Interpretability [103.2998254573497]
モデルの勾配は、半環を用いたより一般的な定式化の特別な場合であることを示す。
この観測により、バックプロパゲーションアルゴリズムを一般化し、他の解釈可能な統計を効率的に計算することができる。
論文 参考訳(メタデータ) (2023-07-06T15:19:53Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Pathologies of Pre-trained Language Models in Few-shot Fine-tuning [50.3686606679048]
実例が少ない事前学習言語モデルはラベル間に強い予測バイアスを示すことを示す。
わずかな微調整で予測バイアスを軽減できるが,本分析では,非タスク関連の特徴を捉えることで,モデルの性能向上を図っている。
これらの観察は、より少ない例でモデルのパフォーマンスを追求することは、病理学的予測行動を引き起こす可能性があることを警告する。
論文 参考訳(メタデータ) (2022-04-17T15:55:18Z) - Dichotomic Pattern Mining with Applications to Intent Prediction from
Semi-Structured Clickstream Datasets [10.76469643992931]
半構造化データセット上で動作するパターンマイニングフレームワークを提案する。
パターン埋め込みは、半構造化データと機械学習モデルの間のインテグレータの役割を担っていることを示す。
論文 参考訳(メタデータ) (2022-01-23T05:00:50Z) - Regularization of Mixture Models for Robust Principal Graph Learning [0.0]
D$次元データポイントの分布から主グラフを学習するために,Mixture Modelsの正規化バージョンを提案する。
モデルのパラメータは期待最大化手順によって反復的に推定される。
論文 参考訳(メタデータ) (2021-06-16T18:00:02Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - Pattern Similarity-based Machine Learning Methods for Mid-term Load
Forecasting: A Comparative Study [0.0]
パターン類似性に基づく年次電力需要予測手法について検討した。
モデルの不可欠な部分は、時系列シーケンスのパターンを用いた時系列表現である。
近接モデル,ファジィ近傍モデル,カーネル回帰モデル,一般回帰ニューラルネットワークの4つのモデルを考える。
論文 参考訳(メタデータ) (2020-03-03T12:14:36Z) - Predicting Multidimensional Data via Tensor Learning [0.0]
本研究では,本データセットの内在的多次元構造を保持するモデルを開発する。
モデルパラメータを推定するために、オルタネート・リースト・スクエアスアルゴリズムを開発した。
提案モデルは,予測文献に存在するベンチマークモデルより優れている。
論文 参考訳(メタデータ) (2020-02-11T11:57:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。