論文の概要: Benchmarking machine learning for bowel sound pattern classification from tabular features to pretrained models
- arxiv url: http://arxiv.org/abs/2502.15607v1
- Date: Fri, 21 Feb 2025 17:22:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:51:47.320024
- Title: Benchmarking machine learning for bowel sound pattern classification from tabular features to pretrained models
- Title(参考訳): 図形特徴から事前学習モデルへのボウエル音響パターン分類のためのベンチマーク機械学習
- Authors: Zahra Mansour, Verena Uslar, Dirk Weyhe, Danilo Hollosi, Nils Strodthoff,
- Abstract要約: このデータセットは、ボーエル音のパターンを検出し/または分類するための機械学習モデルの性能を評価するために使用される。
結果は、特にサンプルが少ないクラスの検出において、事前訓練されたモデルの明らかな優位性を強調した。
これらの結果から,全身的な腸音の理解が向上し,今後の消化器検査への機械学習による診断応用が期待できる。
- 参考スコア(独自算出の注目度): 2.235474969689758
- License:
- Abstract: The development of electronic stethoscopes and wearable recording sensors opened the door to the automated analysis of bowel sound (BS) signals. This enables a data-driven analysis of bowel sound patterns, their interrelations, and their correlation to different pathologies. This work leverages a BS dataset collected from 16 healthy subjects that was annotated according to four established BS patterns. This dataset is used to evaluate the performance of machine learning models to detect and/or classify BS patterns. The selection of considered models covers models using tabular features, convolutional neural networks based on spectrograms and models pre-trained on large audio datasets. The results highlight the clear superiority of pre-trained models, particularly in detecting classes with few samples, achieving an AUC of 0.89 in distinguishing BS from non-BS using a HuBERT model and an AUC of 0.89 in differentiating bowel sound patterns using a Wav2Vec 2.0 model. These results pave the way for an improved understanding of bowel sounds in general and future machine-learning-driven diagnostic applications for gastrointestinal examinations
- Abstract(参考訳): 電子聴診器とウェアラブル記録センサの開発は、腸音(BS)信号の自動解析の扉を開いた。
これにより、腸音のパターン、それらの相互関係、および異なる病理との相関に関するデータ駆動分析が可能になる。
この研究は、4つの確立されたBSパターンに従ってアノテートされた16人の健常者から収集されたBSデータセットを活用する。
このデータセットは、機械学習モデルのパフォーマンスを評価し、BSパターンを検出し/または分類するために使用される。
検討されたモデルの選択は、大きなオーディオデータセットに基づいて事前訓練されたモデルとスペクトログラムに基づく表層特徴、畳み込みニューラルネットワークを用いたモデルをカバーする。
その結果、特にサンプルが少ないクラスでは、HuBERTモデルを用いてBSと非BSを区別するAUCが0.89、Wav2Vec 2.0モデルを用いて腸の音響パターンを区別するAUCが0.89であることが明らかとなった。
これらの結果は、全身的な腸音の理解を改善するための道筋と、今後の消化器検査における機械学習による診断の応用へ向けての道筋をたどるものである。
関連論文リスト
- Interpretable Temporal Class Activation Representation for Audio Spoofing Detection [7.476305130252989]
我々は、wav2vec 2.0モデルと注意的発話レベルの特徴を利用して、解釈可能性を直接モデルのアーキテクチャに統合する。
ASVspoof 2019-LAセットのEERは0.51%、min t-DCFは0.0165である。
論文 参考訳(メタデータ) (2024-06-13T05:36:01Z) - Towards Enhanced Analysis of Lung Cancer Lesions in EBUS-TBNA -- A Semi-Supervised Video Object Detection Method [0.0]
本研究は, 子宮内膜超音波(EBUS)を用いた肺病変のコンピュータ診断システムの構築を目的とする。
これまでの研究では、EBUS-TBNAへのオブジェクト検出モデルの適用が不足していた。
論文 参考訳(メタデータ) (2024-04-02T13:23:21Z) - Tuning In: Analysis of Audio Classifier Performance in Clinical Settings with Limited Data [3.0113849517062303]
本研究では,小データセットの制約を考慮した臨床環境下での音声分類のためのディープラーニングモデルの評価を行う。
我々は、DenseNetやConvNeXtを含むCNNを、ViT、SWIN、ASTといったトランスフォーマーモデルとともに分析する。
本手法は,特定の臨床データを微調整する前に,大規模データセットで事前トレーニングを行うことの利点を強調した。
論文 参考訳(メタデータ) (2024-02-07T16:41:11Z) - Analysing the Impact of Audio Quality on the Use of Naturalistic
Long-Form Recordings for Infant-Directed Speech Research [62.997667081978825]
早期言語習得のモデリングは、幼児が言語スキルをブートストラップする方法を理解することを目的としている。
近年の進歩により、より自然主義的なトレーニングデータを計算モデルに利用できるようになった。
音質がこれらのデータに対する分析やモデリング実験にどう影響するかは、現時点では不明である。
論文 参考訳(メタデータ) (2023-05-03T08:25:37Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Analyzing Robustness of End-to-End Neural Models for Automatic Speech
Recognition [11.489161072526677]
音声認識のための事前学習ニューラルネットワークのロバスト性について検討する。
本研究では,LibriSpeechおよびTIMITデータセット上で,事前学習したニューラルネットワークwav2vec2, HuBERT, DistilHuBERTのロバスト性解析を行う。
論文 参考訳(メタデータ) (2022-08-17T20:00:54Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Score-informed Networks for Music Performance Assessment [64.12728872707446]
MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T07:46:24Z) - Learning Noise-Aware Encoder-Decoder from Noisy Labels by Alternating
Back-Propagation for Saliency Detection [54.98042023365694]
本稿では,ノイズを考慮したエンコーダ・デコーダ・フレームワークを提案する。
提案モデルはニューラルネットワークによってパラメータ化された2つのサブモデルから構成される。
論文 参考訳(メタデータ) (2020-07-23T18:47:36Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。