論文の概要: Random Intersection Chains
- arxiv url: http://arxiv.org/abs/2104.04714v1
- Date: Sat, 10 Apr 2021 08:41:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 14:33:55.470766
- Title: Random Intersection Chains
- Title(参考訳): ランダムインターセクションチェーン
- Authors: Qiuqiang Lin, Chuanhou Gao
- Abstract要約: 本稿では,ランダム交叉連鎖と呼ばれるカテゴリー的特徴の相互作用を選択する手法を提案する。
ランダムな交差点を使って頻繁なパターンを検出し、最も有意義なパターンを選択する。
連鎖の数と長さが適切に選択された場合、尾ノードのパターンはデータセットの中では最も頻繁なパターンであることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactions between several features sometimes play an important role in
prediction tasks. But taking all the interactions into consideration will lead
to an extremely heavy computational burden. For categorical features, the
situation is more complicated since the input will be extremely
high-dimensional and sparse if one-hot encoding is applied. Inspired by
association rule mining, we propose a method that selects interactions of
categorical features, called Random Intersection Chains. It uses random
intersections to detect frequent patterns, then selects the most meaningful
ones among them. At first a number of chains are generated, in which each node
is the intersection of the previous node and a random chosen observation. The
frequency of patterns in the tail nodes is estimated by maximum likelihood
estimation, then the patterns with largest estimated frequency are selected.
After that, their confidence is calculated by Bayes' theorem. The most
confident patterns are finally returned by Random Intersection Chains. We show
that if the number and length of chains are appropriately chosen, the patterns
in the tail nodes are indeed the most frequent ones in the data set. We analyze
the computation complexity of the proposed algorithm and prove the convergence
of the estimators. The results of a series of experiments verify the efficiency
and effectiveness of the algorithm.
- Abstract(参考訳): いくつかの特徴間の相互作用は、予測タスクにおいて重要な役割を果たすことがある。
しかし、すべての相互作用を考慮に入れると、非常に重い計算負担が発生する。
分類的特徴については、入力が非常に高次元で、ワンホット符号化が適用されればスパースになるので、状況はより複雑になる。
連関規則マイニングに触発されて,ランダム交叉連鎖と呼ばれるカテゴリー特徴の相互作用を選択する手法を提案する。
ランダムな交差点を使って頻繁なパターンを検出し、最も有意義なパターンを選択する。
最初は複数の連鎖が生成され、各ノードは前ノードの交叉であり、ランダムに選択された観測である。
テールノード内のパターンの頻度を最大確率推定により推定し、最も推定頻度の高いパターンを選択する。
その後、彼らの信頼度はベイズの定理によって計算される。
最も自信のあるパターンはRandom Intersection Chainsによって最終的に返される。
連鎖の数と長さが適切に選択された場合、尾ノードのパターンはデータセットの中では最も頻繁なパターンであることを示す。
提案アルゴリズムの計算複雑性を解析し,推定器の収束性を証明する。
一連の実験の結果、アルゴリズムの効率と有効性が検証された。
関連論文リスト
- Random Fourier Signature Features [8.766411351797885]
代数はシグネチャカーネルと呼ばれる任意の長さの列の類似性の最も強力な尺度の1つを生み出す。
署名カーネルのスケールを、配列の長さと数で2次的に計算する以前のアルゴリズム。
本研究では,非ユークリッド領域に作用するシグネチャカーネルのランダムなフーリエ特徴量に基づくアクセラレーションを開発する。
論文 参考訳(メタデータ) (2023-11-20T22:08:17Z) - Learning Temporal Point Processes for Efficient Retrieval of Continuous
Time Event Sequences [24.963828650935913]
NEUROSEQRETは,あるクエリシーケンスに対して,関連する連続時間イベントシーケンスの検索とランク付けを学習する。
精度と効率のトレードオフを提供する関係モデルの2つの変種を開発する。
いくつかのデータセットを用いて行った実験では、NEUROSEQRETの精度がいくつかのベースラインを超えていることが示されている。
論文 参考訳(メタデータ) (2022-02-17T11:16:31Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Complex Event Forecasting with Prediction Suffix Trees: Extended
Technical Report [70.7321040534471]
複合イベント認識(CER)システムは、イベントのリアルタイムストリーム上のパターンを"即時"検出する能力によって、過去20年間に人気が高まっている。
このような現象が実際にCERエンジンによって検出される前に、パターンがいつ発生するかを予測する方法が不足している。
複雑なイベント予測の問題に対処しようとする形式的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-01T09:52:31Z) - Determinantal Beam Search [75.84501052642361]
ビームサーチは、ニューラルシーケンスモデルをデコードするためのゴーツー戦略である。
複数のソリューションを要求するユースケースでは、多様あるいは代表的なセットがしばしば望まれる。
ビームサーチを一連の部分決定問題として繰り返し行うことにより、アルゴリズムを多種多様なサブセット選択プロセスに変換することができる。
論文 参考訳(メタデータ) (2021-06-14T13:01:46Z) - Modeling Sequences as Distributions with Uncertainty for Sequential
Recommendation [63.77513071533095]
既存のシーケンシャルメソッドの多くは、ユーザが決定論的であると仮定する。
項目-項目遷移は、いくつかの項目において著しく変動し、ユーザの興味のランダム性を示す。
本稿では,不確実性を逐次モデルに注入する分散型トランスフォーマーシークエンシャルレコメンデーション(DT4SR)を提案する。
論文 参考訳(メタデータ) (2021-06-11T04:35:21Z) - A Preference Random Walk Algorithm for Link Prediction through Mutual
Influence Nodes in Complex Networks [1.345669927504424]
局所ランダムウォークは準局所的手法のカテゴリで最もよく知られたアルゴリズムの1つであると考えられている。
ほとんどのデータセットでは、この手法は著しく類似したノードを正確に評価することができない。
より強い影響を持つノードへのランダムウォーキングを奨励し,局所的ランダムウォーキングを改善するための効率的な手法を提案する。
論文 参考訳(メタデータ) (2021-05-20T03:35:38Z) - Alleviate Exposure Bias in Sequence Prediction \\ with Recurrent Neural
Networks [47.52214243454995]
繰り返しニューラルネットワーク(RNN)を訓練する一般的な戦略は、各ステップで入力として地上の真実を取ることです。
本稿では,RNNの長期的依存関係をよりよく把握するための,完全微分可能なトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-22T06:15:22Z) - Consensus-Guided Correspondence Denoising [67.35345850146393]
本稿では,地域間コンセンサス学習フレームワークと対応関係を異色化し,対応関係をロバストに識別する。
ローカル地域からグローバル地域への動的グラフから推定されるコンセンサススコアに基づいて,信頼度の高い候補を初期マッチングから蒸留する新しい「プルーニング」ブロックを導入した。
本手法は、堅牢なラインフィッティング、ワイドベースライン画像マッチング、画像ローカリゼーションベンチマークを顕著なマージンで上回る。
論文 参考訳(メタデータ) (2021-01-03T09:10:00Z) - Consistency of a Recurrent Language Model With Respect to Incomplete
Decoding [67.54760086239514]
逐次言語モデルから無限長のシーケンスを受信する問題について検討する。
不整合に対処する2つの対策として、トップkと核サンプリングの一貫性のある変種と、自己終端の繰り返し言語モデルを提案する。
論文 参考訳(メタデータ) (2020-02-06T19:56:15Z) - Scalable Influence Estimation Without Sampling [9.873635079670091]
ネットワーク上の拡散過程では、初期スプレッドラーの集合に影響を受けるノードがいくつあると期待されているか?
本稿では、スケーラブルな動的メッセージパッシングアプローチに基づいて、一般的な独立モデルにおける影響関数を推定するアルゴリズムを提案する。
また、線形しきい値モデルのバージョンに対する動的メッセージパッシング方程式も提供する。
論文 参考訳(メタデータ) (2019-12-29T22:15:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。