論文の概要: Optimal Pattern Detection Tree for Symbolic Rule-Based Classification
- arxiv url: http://arxiv.org/abs/2605.14374v1
- Date: Thu, 14 May 2026 04:53:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.627933
- Title: Optimal Pattern Detection Tree for Symbolic Rule-Based Classification
- Title(参考訳): 記号規則に基づく分類のための最適パターン検出木
- Authors: Young-Chae Hong, Yangho Chen,
- Abstract要約: 本稿では,新しい混合整数プログラミングに基づくルールベース機械学習モデルであるOPDT(Optimal Pattern Detection Tree)を提案する。
OPDTは、適度なランタイム内で、適度なサイズのデータセットで最適性を保証するパターンを発見する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pattern discovery in data plays a crucial role across diverse domains, including healthcare, risk assessment, and machinery maintenance. In contrast to black-box deep learning models, symbolic rule discovery emerges as a key data mining task, generating human-interpretable rules that offer both transparency and intuitive explainability. This paper introduces the Optimal Pattern Detection Tree (OPDT), a rule-based machine learning model based on novel mixed-integer programming to discover a single optimal pattern in data through binary classification. To incorporate prior knowledge and compliance requirements, we further introduce the Branching Structure Constraints (BSC) framework, which enables decision makers to encode domain knowledge and constraints directly into the model. This optimization-based approach discovers a hidden underlying pattern in datasets, when it exists, by identifying an optimal rule that maximizes coverage while minimizing the false positive rate due to misclassification. Our computational experiments show that OPDT discovers a pattern with optimality guarantees on moderately sized datasets within reasonable runtime.
- Abstract(参考訳): データにおけるパターン発見は、医療、リスクアセスメント、機械保守など、さまざまな領域において重要な役割を担っている。
ブラックボックスのディープラーニングモデルとは対照的に、象徴的なルール発見は重要なデータマイニングタスクとして現れ、透明性と直感的な説明性の両方を提供する人間解釈可能なルールを生成する。
本稿では、新しい混合整数プログラミングに基づくルールベース機械学習モデルであるOPDT(Optimal Pattern Detection Tree)を導入し、バイナリ分類によるデータの最適パターンの探索を行う。
事前の知識とコンプライアンス要件を組み込むため、我々はさらに分岐構造制約(BSC)フレームワークを導入し、意思決定者がドメインの知識と制約を直接モデルにエンコードできるようにする。
この最適化ベースのアプローチは、データセットに隠れた基盤パターンを発見し、それが存在するとき、誤分類による偽陽性率を最小限にしながらカバレッジを最大化する最適なルールを識別する。
計算実験により,OPDTは適度なランタイム内で,適度なサイズのデータセットに対して最適性を保証するパターンを発見した。
関連論文リスト
- Evaluating Ensemble and Deep Learning Models for Static Malware Detection with Dimensionality Reduction Using the EMBER Dataset [0.0]
本研究では,EMBERデータセットを用いた静的マルウェア検出における機械学習アルゴリズムの有効性について検討した。
LightGBM, XGBoost, CatBoost, Random Forest, Extra Trees, HistGradientBoosting, k-Nearest Neighbors (KNN), TabNetの8つの分類モデルを評価した。
モデルは精度、精度、リコール、F1スコア、AUCに基づいて評価され、予測性能とロバスト性の両方を調べる。
論文 参考訳(メタデータ) (2025-07-22T18:45:10Z) - Interpretable Anomaly Detection in Encrypted Traffic Using SHAP with Machine Learning Models [0.0]
本研究の目的は,暗号化されたネットワークトラフィックにおける異常検出のための解釈可能な機械学習ベースのフレームワークを開発することである。
モデルはトレーニングされ、3つのベンチマークで暗号化されたトラフィックデータセットで評価される。
SHAPビジュアライゼーションは、異常予測に寄与する最も影響力のあるトラフィック特徴を明らかにした。
論文 参考訳(メタデータ) (2025-05-22T05:50:39Z) - Smart Exploration in Reinforcement Learning using Bounded Uncertainty Models [0.8602553195689513]
強化学習(Reinforcement Learning, RL)は、不確実な環境で意思決定を行うための強力なフレームワークである。
先行モデル知識を取り入れて探索をガイドし,学習プロセスを加速することで,この問題に対処する。
シミュレーション研究において,BUMEXと呼ばれる探索手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-04-08T12:33:38Z) - Machine Learning Techniques for Pattern Recognition in High-Dimensional Data Mining [0.0]
本稿では,サポートベクトルマシン(SVM)に基づく頻繁なパターンデータマイニングアルゴリズムを提案する。
頻繁なパターンマイニングタスクを分類問題に変換することにより、SVMモデルを導入し、パターン抽出の精度と堅牢性を向上させる。
実験により、SVMモデルは、高いデータ空間と多数のトランザクションを持つ環境において、優れたパフォーマンス上のアドバンテージを持つことが示された。
論文 参考訳(メタデータ) (2024-12-20T06:32:05Z) - Orthogonal Subspace Decomposition for Generalizable AI-Generated Image Detection [58.87142367781417]
航法的に訓練された検出器は、限定的で単調な偽のパターンに過度に適合する傾向にあり、特徴空間は高度に制約され、低ランクになる。
潜在的な治療法の1つは、ビジョンファウンデーションモデルに事前訓練された知識を取り入れて、機能領域を広げることである。
主要なコンポーネントを凍結し、残ったコンポーネントのみを適用することで、フェイクパターンを学習しながら、トレーニング済みの知識を保存します。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Optimized Feature Generation for Tabular Data via LLMs with Decision Tree Reasoning [53.241569810013836]
本稿では,大規模言語モデル(LLM)を用いて,効率的な特徴生成ルールを同定するフレームワークを提案する。
我々は、自然言語で容易に表現できるため、この推論情報を伝達するために決定木を使用します。
OCTreeは様々なベンチマークで様々な予測モデルの性能を継続的に向上させる。
論文 参考訳(メタデータ) (2024-06-12T08:31:34Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - Progressive Identification of True Labels for Partial-Label Learning [112.94467491335611]
部分ラベル学習(Partial-label Learning, PLL)は、典型的な弱教師付き学習問題であり、各トレーニングインスタンスには、真のラベルである候補ラベルのセットが設けられている。
既存のほとんどの手法は、特定の方法で解決しなければならない制約付き最適化として精巧に設計されており、計算複雑性をビッグデータにスケールアップするボトルネックにしている。
本稿では,モデルと最適化アルゴリズムの柔軟性を備えた分類器の新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-19T08:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。