論文の概要: Greedy Discovery of Ordinal Factors
- arxiv url: http://arxiv.org/abs/2302.11554v1
- Date: Sun, 19 Feb 2023 20:33:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-23 14:08:23.350862
- Title: Greedy Discovery of Ordinal Factors
- Title(参考訳): 順序因子の欲望の発見
- Authors: Dominik D\"urrschnabel, Gerd Stumme
- Abstract要約: 大規模なデータセットでは、構造を発見して分析することは困難である。
順序因子は、その基本構造に基づいて、タグのサブセットを線形順序で配置する。
このような順序因子からなる完全な順序因子化は、元のデータセットを正確に表現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In large datasets, it is hard to discover and analyze structure. It is thus
common to introduce tags or keywords for the items. In applications, such
datasets are then filtered based on these tags. Still, even medium-sized
datasets with a few tags result in complex and for humans hard-to-navigate
systems. In this work, we adopt the method of ordinal factor analysis to
address this problem. An ordinal factor arranges a subset of the tags in a
linear order based on their underlying structure. A complete ordinal
factorization, which consists of such ordinal factors, precisely represents the
original dataset. Based on such an ordinal factorization, we provide a way to
discover and explain relationships between different items and attributes in
the dataset. However, computing even just one ordinal factor of high
cardinality is computationally complex. We thus propose the greedy algorithm in
this work. This algorithm extracts ordinal factors using already existing fast
algorithms developed in formal concept analysis. Then, we leverage to propose a
comprehensive way to discover relationships in the dataset. We furthermore
introduce a distance measure based on the representation emerging from the
ordinal factorization to discover similar items. To evaluate the method, we
conduct a case study on different datasets.
- Abstract(参考訳): 大規模なデータセットでは、構造の発見と分析が難しい。
したがって、アイテムにタグやキーワードを導入するのが一般的である。
アプリケーションでは、このようなデータセットはこれらのタグに基づいてフィルタリングされる。
それでも、タグがいくつかある中型のデータセットでさえ、複雑で、人間が操作しにくいシステムになる。
本研究では,この問題に対処するために順序因子分析法を採用する。
順序因子は、タグのサブセットをその基礎構造に基づいて線形順序に配置する。
このような順序因子からなる完全な順序因子化は、元のデータセットを正確に表現する。
このような順序因子化に基づいて、データセット内のさまざまな項目と属性間の関係を発見し、説明する方法を提供する。
しかし、高濃度の1つの順序因子でさえ計算が複雑である。
そこで本研究では, グリーディアルゴリズムを提案する。
このアルゴリズムは、形式的概念解析で開発された既存の高速アルゴリズムを用いて順序因子を抽出する。
次に,データセット内の関係を包括的に発見する手法を提案する。
さらに、順序因子化から生じる表現に基づいて距離測定を導入し、類似した項目を発見する。
本手法を評価するために,異なるデータセットのケーススタディを行う。
関連論文リスト
- Regularization-Based Methods for Ordinal Quantification [49.606912965922504]
順序の場合、すなわち n>2 クラスの集合上で全順序が定義される場合について研究する。
本稿では,従来のアルゴリズムよりも優れた正規化OQアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-13T16:04:06Z) - Relation-aware Ensemble Learning for Knowledge Graph Embedding [68.94900786314666]
我々は,既存の手法を関係性に配慮した方法で活用し,アンサンブルを学習することを提案する。
関係認識アンサンブルを用いてこれらのセマンティクスを探索すると、一般的なアンサンブル法よりもはるかに大きな検索空間が得られる。
本稿では,リレーショナルなアンサンブル重みを独立に検索する分割探索合成アルゴリズムRelEns-DSCを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:40:12Z) - Towards Ordinal Data Science [0.0]
普通データ科学は、基本的な新しい研究課題として普通データ科学を確立することを目的としている。
本研究の目的は,標準データ科学を根本的に新しい研究課題として確立することである。
論文 参考訳(メタデータ) (2023-07-13T14:50:04Z) - Maximal Ordinal Two-Factorizations [0.0]
与えられた大きさの2要素化の存在を決定することはNP完全問題であることを示す。
大規模な順序の2要素化を計算できるアルゴリズムOrd2Factorを提供する。
論文 参考訳(メタデータ) (2023-04-06T19:26:03Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Ordinal Causal Discovery [2.0305676256390934]
本稿では,多くの実世界のアプリケーションに含まれる順序情報を利用して,因果構造を一意に識別する,識別可能な順序因果探索手法を提案する。
提案手法は, カテゴリー別および非カテゴリ別の両方において, 最先端の代替手法と比較して, 良好かつ堅牢な性能を有することを示す。
論文 参考訳(メタデータ) (2022-01-19T03:11:26Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Adversarial Examples for $k$-Nearest Neighbor Classifiers Based on
Higher-Order Voronoi Diagrams [69.4411417775822]
逆例は機械学習モデルにおいて広く研究されている現象である。
そこで本研究では,$k$-nearest 近傍分類の逆ロバスト性を評価するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-19T08:49:10Z) - Relational Algorithms for k-means Clustering [17.552485682328772]
本稿では,関係アルゴリズムモデルにおいて効率的なk平均近似アルゴリズムを提案する。
実行時間は潜在的に$N$よりも小さくなり、リレーショナルデータベースが表すデータポイントの数はクラスタ化される。
論文 参考訳(メタデータ) (2020-08-01T23:21:40Z) - dMelodies: A Music Dataset for Disentanglement Learning [70.90415511736089]
我々は、研究者が様々な領域でアルゴリズムの有効性を実証するのに役立つ新しいシンボリック・ミュージック・データセットを提案する。
これはまた、音楽用に特別に設計されたアルゴリズムを評価する手段を提供する。
データセットは、遠絡学習のためのディープネットワークのトレーニングとテストに十分な大きさ(約13万データポイント)である。
論文 参考訳(メタデータ) (2020-07-29T19:20:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。