論文の概要: Information Gained Subgroup Discovery in Datasets
- arxiv url: http://arxiv.org/abs/2307.15089v1
- Date: Wed, 26 Jul 2023 21:42:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-31 14:52:00.395738
- Title: Information Gained Subgroup Discovery in Datasets
- Title(参考訳): データセットにおける情報獲得サブグループ発見
- Authors: Daniel G\'omez-Bravo, Aaron Garc\'ia, Guillermo Vigueras, Bel\'en
R\'ios, Mariano Provencio, Alejandro Rodr\'iguez-Gonz\'alez
- Abstract要約: 肺がんががん死の主な原因となっている。2023年には238,340人以上の肺がん患者が死亡し、170,070人以上が死亡すると推定されている。
正しい治療を選択することは、生存可能性を高め、患者の生活の質を向上させる重要な要素である。
本稿では,情報ゲインとOdds比を考慮したサブグループ探索アルゴリズムであるInformation Gained Subgroup Discoveryを提案する。
- 参考スコア(独自算出の注目度): 55.41644538483948
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lung cancer is the leading cause of cancer death. More than 238,340 new cases
of lung cancer patients are expected in 2023, with an estimation of more than
127,070 deaths. Choosing the correct treatment is an important element to
enhance the probability of survival and to improve patient's quality of life.
Cancer treatments might provoke secondary effects. These toxicities cause
different health problems that impact the patient's quality of life. Hence,
reducing treatments toxicities while maintaining or improving their
effectivenes is an important goal that aims to be pursued from the clinical
perspective. On the other hand, clinical guidelines include general knowledge
about cancer treatment recommendations to assist clinicians. Although they
provide treatment recommendations based on cancer disease aspects and
individual patient features, a statistical analysis taking into account
treatment outcomes is not provided here. Therefore, the comparison between
clinical guidelines with treatment patterns found in clinical data, would allow
to validate the patterns found, as well as discovering alternative treatment
patterns. In this work, we present Information Gained Subgroup Discovery, a
Subgroup Discovery algorithm that aims to find most relevant patterns taking
into account Information gain and Odds ratio. Thus, we analyze a dataset
containing lung cancer patients information including patients' data,
prescribed treatments and their outcomes. Obtained results are validated
through clinicians and compared with clinical guidelines. We conclude that this
new algorithm achieves highest acceptance of found patterns in this dataset,
while also improving indices of Subgroup Discovery.
- Abstract(参考訳): 肺がんは、がんの主要な死因である。
2023年には238,340人以上が肺がん患者で、死者は127,070人以上と推定されている。
正しい治療を選択することは、生存確率を高め、患者の生活の質を改善する上で重要な要素である。
がん治療は二次効果を引き起こす可能性がある。
これらの毒性は患者の生活の質に影響を与える様々な健康問題を引き起こす。
したがって, 治療効果の維持や改善を図りながら毒性を低下させることが, 臨床的視点から追求すべき重要な目標である。
一方で、臨床ガイドラインには、臨床医を支援するためにがん治療の推奨に関する一般的な知識が含まれている。
がん疾患の側面と個々の患者の特徴に基づく治療勧告を提供するが、治療結果を考慮した統計分析はここでは提供されない。
したがって、臨床データに見られる臨床ガイドラインと治療パターンの比較は、検出されたパターンの検証と代替治療パターンの発見を可能にする。
本研究では,情報ゲインとオッズ比を考慮した最も関連するパターンを見つけることを目的としたサブグループ発見アルゴリズムである,ゲインサブグループディスカバリーを提案する。
そこで我々は,患者のデータ,所定の治療,その結果を含む肺癌患者の情報を含むデータセットを解析した。
得られた結果は臨床医を通して検証され、臨床ガイドラインと比較される。
このアルゴリズムは,本データセットにおける発見パターンの最も高い受け入れを実現するとともに,サブグループ発見の指標も向上させる。
関連論文リスト
- RHiOTS: A Framework for Evaluating Hierarchical Time Series Forecasting Algorithms [0.393259574660092]
RHiOTSは、階層的な時系列予測モデルとアルゴリズムを実世界のデータセット上で堅牢性を評価するように設計されている。
RHiOTSは、複雑な多次元ロバストネス評価結果を直感的で容易に解釈可能なビジュアルに変換する革新的な可視化コンポーネントを組み込んでいる。
従来の統計的手法は、変換効果が非常に破壊的である場合を除き、最先端のディープラーニングアルゴリズムよりも頑健であることを示す。
論文 参考訳(メタデータ) (2024-08-06T18:52:15Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Integrating Statistical Significance and Discriminative Power in Pattern
Discovery [2.1014808520898667]
提案手法は、統計的重要性と識別力の基準を最先端のアルゴリズムに統合する。
評価実験は, 品質劣化を伴わない識別力と統計的意義を顕著に向上させたパターンの発見において, 提案手法が果たす役割を示す。
論文 参考訳(メタデータ) (2024-01-22T14:51:01Z) - Learning nonparametric DAGs with incremental information via high-order
HSIC [13.061477915002767]
そこで本研究では,DAGを同定するために,親の判断したサブセットに基づく識別可能性条件を提案する。
最適相では、一階のヒルベルト最適独立基準(HSIC)に基づく最適化問題により、推定骨格が初期決定された親部分集合として与えられる。
チューニングフェーズでは、骨格は削除、追加、DAG形式化戦略によって局所的に調整される。
論文 参考訳(メタデータ) (2023-08-11T07:07:21Z) - Interpretable Out-Of-Distribution Detection Using Pattern Identification [0.0]
データベースプログラムのアウト・オブ・ディストリビューション(OoD)検出は最重要課題である。
文献における一般的なアプローチは、イン・オブ・ディストリビューション(in-distriion、IoD)とOoDバリデーション・サンプルを必要とする検出器を訓練する傾向がある。
我々は、より解釈可能で堅牢なOoD検出器を構築するために、説明可能なAI、すなわちPartialulパターン識別アルゴリズムから既存の研究を活用することを提案する。
論文 参考訳(メタデータ) (2023-01-24T15:35:54Z) - Learning to Hash Robustly, with Guarantees [79.68057056103014]
本稿では,理論的アルゴリズムと本質的に一致する最悪ケース保証を持つハミング空間のためのNSアルゴリズムを設計する。
理論的にも実用的にも、与えられたデータセットに対してアルゴリズムが最適化できる能力を評価する。
我々のアルゴリズムは、MNISTおよびImageNetデータセットに対する最悪のパフォーマンスのクエリを、1.8倍と2.1倍の精度でリコールする。
論文 参考訳(メタデータ) (2021-08-11T20:21:30Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - A Systematic Characterization of Sampling Algorithms for Open-ended
Language Generation [71.31905141672529]
本稿では,自己回帰型言語モデルに広く採用されている祖先サンプリングアルゴリズムについて検討する。
エントロピー低減, 秩序保存, 斜面保全の3つの重要な特性を同定した。
これらの特性を満たすサンプリングアルゴリズムのセットが,既存のサンプリングアルゴリズムと同等に動作することがわかった。
論文 参考訳(メタデータ) (2020-09-15T17:28:42Z) - The Data Representativeness Criterion: Predicting the Performance of
Supervised Classification Based on Data Set Similarity [4.934817254755008]
本稿では,データ代表性基準(DRC)を提案し,トレーニングデータセットが新たな未知のデータセットの表現方法を決定する。
本稿では、DRCがデータセットの類似性を定量化できるかどうか、およびDRCが教師付き分類アルゴリズムの性能に関係しているかどうかを検証するための原理の証明を示す。
論文 参考訳(メタデータ) (2020-02-27T15:08:13Z) - CONSAC: Robust Multi-Model Fitting by Conditional Sample Consensus [62.86856923633923]
我々は,同じ形状の複数のパラメトリックモデルを雑音測定に適合させる頑健な推定器を提案する。
複数のモデル検出のための手作り検索戦略を利用する従来の研究とは対照的に,データから検索戦略を学習する。
探索の自己教師付き学習において,提案したアルゴリズムをマルチホログラフィー推定で評価し,最先端手法よりも優れた精度を示す。
論文 参考訳(メタデータ) (2020-01-08T17:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。