論文の概要: Pre and Post Counting for Scalable Statistical-Relational Model
Discovery
- arxiv url: http://arxiv.org/abs/2110.09767v1
- Date: Tue, 19 Oct 2021 07:03:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-20 13:59:15.873901
- Title: Pre and Post Counting for Scalable Statistical-Relational Model
Discovery
- Title(参考訳): スケーラブルな統計的関係モデル発見のためのプレ・ポストカウント
- Authors: Richard Mar and Oliver Schulte
- Abstract要約: 統計的関係モデル発見は、関係データに統計的に関連のあるパターンを見つけることを目的としている。
命題的(非リレーショナル)なグラフィカルモデルと同様に、モデル発見における大きなスケーラビリティのボトルネックは、インスタンス数を計算することである。
本稿では,リレーショナル学習における事前集計とポストカウント戦略間のメモリとスピードのトレードオフを詳細に検討する。
- 参考スコア(独自算出の注目度): 19.18886406228943
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Statistical-Relational Model Discovery aims to find statistically relevant
patterns in relational data. For example, a relational dependency pattern may
stipulate that a user's gender is associated with the gender of their friends.
As with propositional (non-relational) graphical models, the major scalability
bottleneck for model discovery is computing instantiation counts: the number of
times a relational pattern is instantiated in a database. Previous work on
propositional learning utilized pre-counting or post-counting to solve this
task. This paper takes a detailed look at the memory and speed trade-offs
between pre-counting and post-counting strategies for relational learning. A
pre-counting approach computes and caches instantiation counts for a large set
of relational patterns before model search. A post-counting approach computes
an instantiation count dynamically on-demand for each candidate pattern
generated during the model search. We describe a novel hybrid approach,
tailored to relational data, that achieves a sweet spot with pre-counting for
patterns involving positive relationships (e.g. pairs of users who are friends)
and post-counting for patterns involving negative relationships (e.g. pairs of
users who are not friends). Our hybrid approach scales model discovery to
millions of data facts.
- Abstract(参考訳): 統計的関係モデル発見は、関係データに統計的に関連するパターンを見つけることを目的としている。
例えば、関係依存パターンは、ユーザの性別が友人の性別に関連付けられることを規定することができる。
命題的(非関係的)なグラフィカルモデルと同様に、モデル発見の主要なスケーラビリティボトルネックはインスタンス数を計算することである。
命題学習に関する以前の研究は、この問題を解決するために事前集計や後集計を利用した。
本稿では,リレーショナル学習における事前集計とポストカウンティング戦略間のメモリとスピードのトレードオフを詳細に検討する。
事前カウントアプローチは、モデル検索の前に大量のリレーショナルパターンのインスタンス数を計算しキャッシュする。
ポストカウントアプローチは、モデル検索中に生成された候補パターン毎に動的にインスタンス数を算出する。
本研究では,ポジティブな関係性(例えば,友人であるユーザのペア)や,ネガティブな関係性(例えば,友人でないユーザのペア)を含むパターンのポストカウントといったパターンを事前にカウントする,新たなハイブリッドアプローチについて説明する。
私たちのハイブリッドアプローチは、モデル発見を数百万のデータ事実にスケールします。
関連論文リスト
- Exploring Query Efficient Data Generation towards Data-free Model Stealing in Hard Label Setting [38.755154033324374]
データフリーモデルは、ターゲットモデルの構造、パラメータ、トレーニングデータにアクセスすることなく、ターゲットモデルの機能を代替モデルに複製する。
本稿では Query Efficient Data Generation (textbfQEDG) と呼ばれる新しいデータフリーモデルステーリング手法を提案する。
対象モデルの決定境界に密接に一様に整合する十分なサンプルの生成を保証するために、2つの異なる損失関数を導入する。
論文 参考訳(メタデータ) (2024-12-18T03:03:15Z) - Probabilistic Modeling for Sequences of Sets in Continuous-Time [14.423456635520084]
設定値データを連続的にモデリングするための一般的なフレームワークを開発する。
また,そのようなモデルを用いて確率的クエリに答える推論手法も開発している。
論文 参考訳(メタデータ) (2023-12-22T20:16:10Z) - A Federated Data Fusion-Based Prognostic Model for Applications with Multi-Stream Incomplete Signals [1.2277343096128712]
本稿では、複数のユーザが共同で障害時間予測モデルを構築することができるフェデレーション予測モデルを提案する。
数値解析により,提案モデルの性能は古典的非フェデレーション予測モデルと同一であることが示唆された。
論文 参考訳(メタデータ) (2023-11-13T17:08:34Z) - Single-Stage Visual Relationship Learning using Conditional Queries [60.90880759475021]
TraCQは、マルチタスク学習問題とエンティティペアの分布を回避する、シーングラフ生成の新しい定式化である。
我々は,DETRをベースとしたエンコーダ-デコーダ条件付きクエリを用いて,エンティティラベル空間を大幅に削減する。
実験結果から、TraCQは既存のシングルステージシーングラフ生成法よりも優れており、Visual Genomeデータセットの最先端の2段階メソッドを多く上回っていることがわかった。
論文 参考訳(メタデータ) (2023-06-09T06:02:01Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - Relation Extraction as Open-book Examination: Retrieval-enhanced Prompt
Tuning [109.7767515627765]
本稿では,関係抽出のための新たな半パラメトリックなプロンプトチューニング手法を提案する。
我々のモデルは、トレーニング中に重みに格納された知識を通して関係を推測する。
本手法は,標準的な教師付き設定と少数ショット設定の両方で最先端を実現することができる。
論文 参考訳(メタデータ) (2022-05-04T23:38:37Z) - Can I see an Example? Active Learning the Long Tail of Attributes and
Relations [64.50739983632006]
視覚シーンの属性や関係を問う,新たな逐次能動学習フレームワークを提案する。
従来のアクティブな学習手法では、特定の例のラベルを求めるが、エージェントが特定のカテゴリからサンプルを求めることができるように、このフレーミングを反転させる。
このフレーミングを用いて、データ分布の尾からサンプルを求めるアクティブサンプリング手法を導入し、Visual Genomeの古典的アクティブラーニング手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-03-11T19:28:19Z) - Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles [66.15398165275926]
本稿では,データセット固有のパターンを自動的に検出・無視する手法を提案する。
我々の方法は、より高い容量モデルでアンサンブルで低容量モデルを訓練する。
視覚的質問応答データセットの10ポイントゲインを含む,すべての設定の改善を示す。
論文 参考訳(メタデータ) (2020-11-07T22:20:03Z) - Clustering-based Unsupervised Generative Relation Extraction [3.342376225738321]
クラスタリングに基づく教師なし生成関係抽出フレームワーク(CURE)を提案する。
我々は「エンコーダ・デコーダ」アーキテクチャを用いて自己教師付き学習を行い、エンコーダが関係情報を抽出できるようにする。
我々のモデルは、ニューヨーク・タイムズ(NYT)と国連並列コーパス(UNPC)の標準データセットにおいて、最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2020-09-26T20:36:40Z) - NASE: Learning Knowledge Graph Embedding for Link Prediction via Neural
Architecture Search [9.634626241415916]
リンク予測は、知識グラフ(KG)におけるエンティティ間の欠落した接続を予測するタスクである
これまでの研究では、Automated Machine Learning(AutoML)を使用して、データセットに最適なモデルを探していた。
リンク予測タスクのための新しいニューラルネットワーク探索(NAS)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-18T03:34:09Z) - Overcoming Statistical Shortcuts for Open-ended Visual Counting [54.858754825838865]
出力ラベルに関係なく、カウントする適切なメカニズムを学習するモデルを開発することを目的としている。
まず,統計的ショートカットに過度に依存するモデルを罰するModifying Count Distributionプロトコルを提案する。
第2に、視覚分析と自然言語質問に基づく数え上げを専門とする空間カウントネットワーク(SCN)を導入する。
論文 参考訳(メタデータ) (2020-06-17T18:02:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。