論文の概要: Weakly Supervised Object Detection for Automatic Tooth-marked Tongue Recognition
- arxiv url: http://arxiv.org/abs/2408.16451v1
- Date: Thu, 29 Aug 2024 11:31:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-30 14:02:47.169780
- Title: Weakly Supervised Object Detection for Automatic Tooth-marked Tongue Recognition
- Title(参考訳): 歯のマーク付き舌の自動認識のための弱監視対象検出
- Authors: Yongcun Zhang, Jiajun Xu, Yina He, Shaozi Li, Zhiming Luo, Huangwei Lei,
- Abstract要約: 伝統中国医学(TCM)における舌の診断は、個人の健康状態を反映する重要な診断方法である。
歯印のある舌を識別する伝統的な方法は、実践者の経験に依存しているため主観的で矛盾する。
本稿では,視覚変換器と複数インスタンス学習WSVMを用いた全自動Weakly Supervised法を提案する。
- 参考スコア(独自算出の注目度): 19.34036038278796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tongue diagnosis in Traditional Chinese Medicine (TCM) is a crucial diagnostic method that can reflect an individual's health status. Traditional methods for identifying tooth-marked tongues are subjective and inconsistent because they rely on practitioner experience. We propose a novel fully automated Weakly Supervised method using Vision transformer and Multiple instance learning WSVM for tongue extraction and tooth-marked tongue recognition. Our approach first accurately detects and extracts the tongue region from clinical images, removing any irrelevant background information. Then, we implement an end-to-end weakly supervised object detection method. We utilize Vision Transformer (ViT) to process tongue images in patches and employ multiple instance loss to identify tooth-marked regions with only image-level annotations. WSVM achieves high accuracy in tooth-marked tongue classification, and visualization experiments demonstrate its effectiveness in pinpointing these regions. This automated approach enhances the objectivity and accuracy of tooth-marked tongue diagnosis. It provides significant clinical value by assisting TCM practitioners in making precise diagnoses and treatment recommendations. Code is available at https://github.com/yc-zh/WSVM.
- Abstract(参考訳): 伝統中国医学(TCM)における舌の診断は、個人の健康状態を反映する重要な診断方法である。
歯印のある舌を識別する伝統的な方法は、実践者の経験に依存しているため主観的で矛盾する。
本稿では,視覚変換器と複数インスタンス学習WSVMを用いた,舌抽出と歯印付き舌認識のための完全自動化Weakly Supervised法を提案する。
本手法はまず,臨床画像から舌領域を正確に検出し,抽出し,無関係な背景情報を除去する。
そこで本研究では,オブジェクト検出手法をエンド・ツー・エンドに実装する。
我々はViT(Vision Transformer)を用いて舌のイメージをパッチで処理し、複数インスタンスの損失を利用して画像レベルのアノテーションだけで歯印付き領域を識別する。
WSVMは歯印舌分類において高い精度を達成し、これらの領域をピンポイントする効果を可視化実験により実証した。
この自動的アプローチは、歯印舌診断の客観性と精度を高める。
TCMの実践者が正確な診断と治療勧告を行うのを支援することで、重要な臨床的価値を提供する。
コードはhttps://github.com/yc-zh/WSVM.comで入手できる。
関連論文リスト
- Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Ammonia-Net: A Multi-task Joint Learning Model for Multi-class
Segmentation and Classification in Tooth-marked Tongue Diagnosis [12.095100353695038]
伝統的な中国医学では、舌の歯の跡が気(黄)欠乏症を評価する重要な指標となっている。
これらの問題に対処するため,Ammonia-Net というマルチタスク共同学習モデルを提案する。
アンモニアネットは舌画像のセマンティックセグメンテーションを行い、舌と歯跡を識別する。
論文 参考訳(メタデータ) (2023-10-05T11:28:32Z) - Self-Supervised Learning with Masked Image Modeling for Teeth Numbering,
Detection of Dental Restorations, and Instance Segmentation in Dental
Panoramic Radiographs [8.397847537464534]
本研究の目的は,SimMIM や UM-MAE といった近年の自己教師型学習手法を応用して,限られた数の歯科用ラジオグラフィーのモデル効率と理解を高めることである。
我々の知る限りでは、歯科用パノラマX線写真にスイニングトランスフォーマーに自己教師あり学習法を適用した最初の研究である。
論文 参考訳(メタデータ) (2022-10-20T16:50:07Z) - Data-Efficient Vision Transformers for Multi-Label Disease
Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。
ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。
以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文 参考訳(メタデータ) (2022-08-17T09:07:45Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Two-Stage Mesh Deep Learning for Automated Tooth Segmentation and
Landmark Localization on 3D Intraoral Scans [56.55092443401416]
TS-MDLの最初の段階では、mphiMeshSegNetは0.953pm0.076$で平均Dice類似係数(DSC)に達した。
PointNet-Reg は平均絶対誤差 (MAE) が 0.623pm0.718, mm$ であり、ランドマーク検出の他のネットワークよりも優れている。
論文 参考訳(メタデータ) (2021-09-24T13:00:26Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Discriminative Nearest Neighbor Few-Shot Intent Detection by
Transferring Natural Language Inference [150.07326223077405]
データ不足を緩和するためには、ほとんどショットラーニングが注目を集めている。
深部自己注意を伴う識別的近傍分類を提示する。
自然言語推論モデル(NLI)を変換することで識別能力を高めることを提案する。
論文 参考訳(メタデータ) (2020-10-25T00:39:32Z) - An Adaptive Enhancement Based Hybrid CNN Model for Digital Dental X-ray
Positions Classification [1.0672152844970149]
適応ヒストグラム等化と畳み込みニューラルネットワーク(CNN)に基づく新しい解法を提案する。
テストセットの精度と特異性は90%を超え、AUCは0.97に達した。
論文 参考訳(メタデータ) (2020-05-01T13:55:44Z) - Individual Tooth Detection and Identification from Dental Panoramic
X-Ray Images via Point-wise Localization and Distance Regularization [10.877276642014515]
提案したネットワークは、まずすべての解剖学的歯に対して中心点回帰を行い、各歯を自動的に識別する。
歯の箱は、パッチベースでカスケードニューラルネットワークを用いて個別に局所化される。
実験結果から,提案アルゴリズムは最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-04-12T04:14:14Z) - Deep Learning for Automatic Tracking of Tongue Surface in Real-time
Ultrasound Videos, Landmarks instead of Contours [0.6853165736531939]
本稿では,ディープニューラルネットワークを用いた舌輪郭の自動追尾とリアルタイム舌輪郭追跡の新しい手法を提案する。
提案手法では,2段階の手順の代わりに舌表面のランドマークが追跡される。
本実験により,提案手法の卓越した性能を,一般化,性能,精度の観点から明らかにした。
論文 参考訳(メタデータ) (2020-03-16T00:38:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。