論文の概要: Redescription Model Mining
- arxiv url: http://arxiv.org/abs/2107.04462v1
- Date: Fri, 9 Jul 2021 14:26:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-12 13:37:26.175394
- Title: Redescription Model Mining
- Title(参考訳): 再記述モデルマイニング
- Authors: Felix I. Stamm, Martin Becker, Markus Strohmaier, Florian Lemmerich
- Abstract要約: 再記述モデルマイニング(reescription Model Mining)は、2つのデータセットにまたがる解釈可能なパターンを識別する新しいアプローチである。
提案手法は,将来性のあるパターンを選択し,効率的なアルゴリズムを提案し,実世界のデータにその可能性を示す。
- 参考スコア(独自算出の注目度): 1.6511440197186915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces Redescription Model Mining, a novel approach to
identify interpretable patterns across two datasets that share only a subset of
attributes and have no common instances. In particular, Redescription Model
Mining aims to find pairs of describable data subsets -- one for each dataset
-- that induce similar exceptional models with respect to a prespecified model
class. To achieve this, we combine two previously separate research areas:
Exceptional Model Mining and Redescription Mining. For this new problem
setting, we develop interestingness measures to select promising patterns,
propose efficient algorithms, and demonstrate their potential on synthetic and
real-world data. Uncovered patterns can hint at common underlying phenomena
that manifest themselves across datasets, enabling the discovery of possible
associations between (combinations of) attributes that do not appear in the
same dataset.
- Abstract(参考訳): 本稿では,属性のサブセットのみを共有し,共通インスタンスを持たない2つのデータセットにまたがる解釈可能なパターンを識別する,新しい手法であるRedescription Model Miningを紹介する。
特に、再記述モデルマイニング(redescription model mining)は、予測可能なデータサブセットのペア(データセット毎にひとつ)を見つけることを目的としている。
これを実現するために、以前は2つの研究領域、例外モデルマイニングと再定義マイニングを組み合わせた。
この新しい問題設定のために, 有望なパターンの選択, 効率的なアルゴリズムの提案, 合成データおよび実世界データの可能性を示すための興味深い尺度を開発した。
未知のパターンは、データセットにまたがって現れる共通の基礎的な現象をヒントにすることができ、同じデータセットに現れない属性間の(組み合わせ)関連を発見できる。
関連論文リスト
- Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。
特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。
この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文 参考訳(メタデータ) (2024-07-20T17:14:31Z) - Revisiting Permutation Symmetry for Merging Models between Different
Datasets [3.234560001579257]
異なるデータセット間のマージモデルの特性について検討する。
その結果,統合モデルの精度は,データセットが多様化するにつれて著しく低下することがわかった。
データセットの縮合によって生成された縮合データセットは、元のデータセットの代用として使用できることを示す。
論文 参考訳(メタデータ) (2023-06-09T03:00:34Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - IMACS: Image Model Attribution Comparison Summaries [16.80986701058596]
我々は,勾配に基づくモデル属性とアグリゲーションと可視化技術を組み合わせたIMACSを提案する。
IMACSは評価データセットから適切な入力特徴を抽出し、類似性に基づいてクラスタ化し、類似した入力特徴に対するモデル属性の違いを可視化する。
本稿では,衛星画像上で訓練した2つのモデル間の領域シフトによる行動差を明らかにする方法を示す。
論文 参考訳(メタデータ) (2022-01-26T21:35:14Z) - Hierarchical Few-Shot Generative Models [18.216729811514718]
本稿では,ニューラルネットワークを階層的なアプローチに拡張する潜伏変数のアプローチについて検討する。
以上の結果から,階層的な定式化は,小データ構造における集合内の内在的変動をよりよく捉えることが示唆された。
論文 参考訳(メタデータ) (2021-10-23T19:19:39Z) - An Ample Approach to Data and Modeling [1.0152838128195467]
さまざまな分野の概念とメソッドを統合するモデルの構築方法をモデル化するためのフレームワークについて説明する。
参照M*メタモデルフレームワークは、厳密な同値関係の観点からデータセットと各モデルの関連付けに批判的に依存する。
開発されたフレームワークがデータクラスタリング、複雑性、共同研究、ディープラーニング、クリエイティビティに関する洞察を提供する方法について、いくつかの考察がなされている。
論文 参考訳(メタデータ) (2021-10-05T01:26:09Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles [66.15398165275926]
本稿では,データセット固有のパターンを自動的に検出・無視する手法を提案する。
我々の方法は、より高い容量モデルでアンサンブルで低容量モデルを訓練する。
視覚的質問応答データセットの10ポイントゲインを含む,すべての設定の改善を示す。
論文 参考訳(メタデータ) (2020-11-07T22:20:03Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Data from Model: Extracting Data from Non-robust and Robust Models [83.60161052867534]
この研究は、データとモデルの関係を明らかにするために、モデルからデータを生成する逆プロセスについて検討する。
本稿では,データ・トゥ・モデル(DtM)とデータ・トゥ・モデル(DfM)を連続的に処理し,特徴マッピング情報の喪失について検討する。
以上の結果から,DtMとDfMの複数シーケンスの後にも,特にロバストモデルにおいて精度低下が制限されることが示唆された。
論文 参考訳(メタデータ) (2020-07-13T05:27:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。