Fugu-MT 論文翻訳(概要): Discovering Frequent Gradual Itemsets with Imprecise Data

論文の概要: Discovering Frequent Gradual Itemsets with Imprecise Data

arxiv url: http://arxiv.org/abs/2005.11045v1
Date: Fri, 22 May 2020 08:02:15 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-30 08:32:12.181696
Title: Discovering Frequent Gradual Itemsets with Imprecise Data
Title（参考訳）: 不正確なデータによる頻繁な経時的項目集合の発見
Authors: Micha\"el Chirmeni Boujike, Jerry Lonlac, Norbert Tsopze, Engelbert Mephu Nguifo
Abstract要約: The more/less X, The more/less Y" という形式の属性の複雑な共変分をモデル化する段階的なパターンは、多くの現実世界のアプリケーションにおいて重要な役割を果たす。本稿では,増加または減少を考慮した漸進性しきい値を導入することを提案する。
参考スコア（独自算出の注目度）: 0.4874780144224056
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The gradual patterns that model the complex co-variations of attributes of the form "The more/less X, The more/less Y" play a crucial role in many real world applications where the amount of numerical data to manage is important, this is the biological data. Recently, these types of patterns have caught the attention of the data mining community, where several methods have been defined to automatically extract and manage these patterns from different data models. However, these methods are often faced the problem of managing the quantity of mined patterns, and in many practical applications, the calculation of all these patterns can prove to be intractable for the user-defined frequency threshold and the lack of focus leads to generating huge collections of patterns. Moreover another problem with the traditional approaches is that the concept of gradualness is defined just as an increase or a decrease. Indeed, a gradualness is considered as soon as the values of the attribute on both objects are different. As a result, numerous quantities of patterns extracted by traditional algorithms can be presented to the user although their gradualness is only a noise effect in the data. To address this issue, this paper suggests to introduce the gradualness thresholds from which to consider an increase or a decrease. In contrast to literature approaches, the proposed approach takes into account the distribution of attribute values, as well as the user's preferences on the gradualness threshold and makes it possible to extract gradual patterns on certain databases where literature approaches fail due to too large search space. Moreover, results from an experimental evaluation on real databases show that the proposed algorithm is scalable, efficient, and can eliminate numerous patterns that do not verify specific gradualness requirements to show a small set of patterns to the user.
Abstract（参考訳）: The more/less X, The more/less Y" という形式の属性の複雑な共変分をモデル化する段階的パターンは、管理する数値データが重要である多くの実世界のアプリケーションにおいて重要な役割を果たす。最近、これらのパターンはデータマイニングコミュニティの注目を集めており、異なるデータモデルからパターンを自動的に抽出し管理するためのいくつかの方法が定義されている。しかし、これらの手法は、しばしば採掘されたパターンの量を管理する問題に直面しており、多くの実践的応用において、これらのパターンの計算は、ユーザ定義の周波数閾値に対して難解であることが証明され、焦点の欠如によって大量のパターンが生成される。さらに、従来のアプローチの別の問題は、漸進性の概念が増加または減少として定義されることである。実際、両方のオブジェクトの属性の値が異なると、漸進性が考慮される。その結果、従来のアルゴリズムによって抽出された多くのパターンがユーザに提示されるが、その漸進性はデータのノイズ効果に過ぎない。この問題に対処するため,本稿では,増加や減少を考えるための漸進性閾値を導入することを提案する。文献的アプローチとは対照的に,提案手法では,属性値の分布やユーザの選好を漸進性閾値で考慮し,検索空間が大きすぎるために文学的アプローチが失敗している特定のデータベース上で段階的パターンを抽出することができる。さらに, 実データベースを用いた実験結果から, 提案アルゴリズムはスケーラブルで効率的であり, ユーザに対して少量のパターンを示すために, 特定の漸進性要件を検証しない多数のパターンを排除できることが示唆された。

関連論文リスト

Rethinking Contrastive Learning in Graph Anomaly Detection: A Clean-View Perspective [54.605073936695575]
グラフ異常検出は、Webセキュリティやファイナンシャル不正検出などの分野で広く応用されているグラフベースのデータにおいて、異常なパターンを特定することを目的としている。既存の手法は対照的な学習に依存しており、ノードとその局所部分グラフの間のより低い類似性は異常を示すと仮定する。干渉エッジの存在は、対照的な学習過程を損なう破壊的なノイズをもたらすため、この仮定を無効にする。コントラスト学習プロセスにおいて重要な干渉源を特定するために,複数スケールの異常認識モジュールを含むクリーンビュー拡張グラフ異常検出フレームワーク(CVGAD)を提案する。
論文参考訳（メタデータ） (2025-05-23T15:05:56Z)
Synthetic Data for Portfolios: A Throw of the Dice Will Never Abolish Chance [0.0]
本稿では、特にポートフォリオとリスクマネジメントにおいて、生成モデルの限界についてより深く理解するために貢献する。本稿では,米国株式の宇宙における従来の評価基準を満たす多変量回帰生成のためのパイプラインを提案する。
論文参考訳（メタデータ） (2025-01-07T18:50:24Z)
Towards Scalable and Deep Graph Neural Networks via Noise Masking [59.058558158296265]
グラフニューラルネットワーク(GNN)は多くのグラフマイニングタスクで顕著に成功している。計算とストレージのコストが高いため、大きなグラフにスケールすることは困難です。既存のモデル単純化作業と互換性のあるプラグアンドプレイモジュールであるノイズマスキング(RMask)を用いたランダムウォークを提案する。
論文参考訳（メタデータ） (2024-12-19T07:48:14Z)
Enhancing Fine-Grained Visual Recognition in the Low-Data Regime Through Feature Magnitude Regularization [23.78498670529746]
抽出した特徴量の均等分布を保証するために正規化手法を導入する。その明らかな単純さにもかかわらず、我々の手法は様々な細粒度視覚認識データセットに対して顕著な性能向上を示した。
論文参考訳（メタデータ） (2024-09-03T07:32:46Z)
Pattern based learning and optimisation through pricing for bin packing problem [50.83768979636913]
確率変数の分布のような問題条件が変化すると、以前の状況でうまく機能するパターンはより効果的になるかもしれないと論じる。本研究では,パターンを効率的に同定し,各条件に対する値の動的定量化を行う新しい手法を提案する。本手法は,制約を満たす能力と目的値に対する影響に基づいて,パターンの値の定量化を行う。
論文参考訳（メタデータ） (2024-08-27T17:03:48Z)
USD: Unsupervised Soft Contrastive Learning for Fault Detection in Multivariate Time Series [6.055410677780381]
本研究では,データ拡張とソフトコントラスト学習の組み合わせを導入し,より正確に状態行動の多面的特性を捉えることを目的としている。この二重戦略は、正常な状態と異常な状態を区別するモデルの能力を著しく向上させ、複数のデータセットと設定で障害検出性能が著しく向上する。
論文参考訳（メタデータ） (2024-05-25T14:48:04Z)
Latent variable model for high-dimensional point process with structured missingness [4.451479907610764]
縦断データは医療、社会学、地震学など多くの分野で重要である。実世界のデータセットは高次元であり、構造化された欠陥パターンを含み、測定時間ポイントは未知のプロセスによって管理される。これらの制限に対処可能な、柔軟で効率的な潜在変数モデルを提案する。
論文参考訳（メタデータ） (2024-02-08T15:41:48Z)
Stochastic Amortization: A Unified Approach to Accelerate Feature and Data Attribution [62.71425232332837]
雑音ラベル付きモデルを用いたトレーニングは安価で驚くほど効果的であることを示す。このアプローチは、いくつかの特徴属性とデータ評価手法を著しく加速し、しばしば既存のアプローチよりも桁違いにスピードアップする。
論文参考訳（メタデータ） (2024-01-29T03:42:37Z)
ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文参考訳（メタデータ） (2023-04-07T15:17:48Z)
Learning with Noisy labels via Self-supervised Adversarial Noisy Masking [33.87292143223425]
対向雑音マスキングと呼ばれる新しいトレーニング手法を提案する。入力データとラベルを同時に調整し、ノイズの多いサンプルが過度に収まらないようにする。合成および実世界のノイズデータセットの両方でテストされる。
論文参考訳（メタデータ） (2023-02-14T03:13:26Z)
Perceptual Score: What Data Modalities Does Your Model Perceive? [73.75255606437808]
モデルが入力特徴の異なる部分集合に依存する度合いを評価する指標である知覚スコアを導入する。近年,視覚的質問応答に対するマルチモーダルモデルでは,前者よりも視覚的データを知覚しにくい傾向がみられた。知覚スコアを使用することで、スコアをデータサブセットのコントリビューションに分解することで、モデルのバイアスを分析することもできる。
論文参考訳（メタデータ） (2021-10-27T12:19:56Z)
Goal-directed Generation of Discrete Structures with Conditional Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文参考訳（メタデータ） (2020-10-05T20:03:13Z)
Variable Skipping for Autoregressive Range Density Estimation [84.60428050170687]
深部自己回帰モデルを用いた距離密度推定を高速化する手法である可変スキップについて述べる。可変スキップは、10-100$timesの効率向上をもたらすことを示す。
論文参考訳（メタデータ） (2020-07-10T19:01:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。