論文の概要: Acoustic scattering AI for non-invasive object classifications: A case study on hair assessment
- arxiv url: http://arxiv.org/abs/2506.14148v1
- Date: Tue, 17 Jun 2025 03:25:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.312486
- Title: Acoustic scattering AI for non-invasive object classifications: A case study on hair assessment
- Title(参考訳): 非侵襲的物体分類のための音響散乱AI:毛髪評価の事例研究
- Authors: Long-Vu Hoang, Tuan Nguyen, Tran Huy Dat,
- Abstract要約: 本稿では,音響散乱を用いた新しい非侵襲物体分類手法を提案する。
我々は,AIによる深層学習に基づく音声分類を用いて,髪型と湿気を分類する。
その結果, 音響散乱は, 視覚的分類に代わる, プライバシー保護・非接触的手法として注目された。
- 参考スコア(独自算出の注目度): 2.5074524384639214
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a novel non-invasive object classification approach using acoustic scattering, demonstrated through a case study on hair assessment. When an incident wave interacts with an object, it generates a scattered acoustic field encoding structural and material properties. By emitting acoustic stimuli and capturing the scattered signals from head-with-hair-sample objects, we classify hair type and moisture using AI-driven, deep-learning-based sound classification. We benchmark comprehensive methods, including (i) fully supervised deep learning, (ii) embedding-based classification, (iii) supervised foundation model fine-tuning, and (iv) self-supervised model fine-tuning. Our best strategy achieves nearly 90% classification accuracy by fine-tuning all parameters of a self-supervised model. These results highlight acoustic scattering as a privacy-preserving, non-contact alternative to visual classification, opening huge potential for applications in various industries.
- Abstract(参考訳): 本稿では, 音響散乱を用いた新しい非侵襲的物体分類手法を提案する。
入射波が物体と相互作用すると、構造と材料特性を符号化した散乱音場を生成する。
頭部と鼻の物体から音響刺激を発生させ,散乱した信号を捕捉することにより,AIによる深層学習に基づく音声分類を用いて,髪型と湿気の分類を行う。
包括的手法をベンチマークする。
(i)完全な教師付き深層学習。
(ii)埋め込み型分類
三 ファウンデーションモデル微調整の監督及び
(4)自己監督型モデル微調整。
我々の最善の戦略は、自己教師付きモデルのパラメータをすべて微調整することで、90%近い分類精度を達成する。
これらの結果は、視覚的分類に代えて、プライバシーを保護し、非接触的なものとして音響散乱が強調され、様々な産業におけるアプリケーションに大きな可能性を秘めている。
関連論文リスト
- Clustering and novel class recognition: evaluating bioacoustic deep learning feature extractors [3.320858630462999]
生体音響学では、深層学習モデルは特徴抽出器と分類器から構成される。
分類スコアのベンチマークは、特定のパフォーマンス統計に関する洞察を提供する。
非常に異なる分類群で訓練されたモデルを比較することは不可能である。
論文 参考訳(メタデータ) (2025-04-09T09:13:18Z) - Neural Edge Histogram Descriptors for Underwater Acoustic Target Recognition [42.23422932643755]
この研究は、もともと画像分類のために開発されたニューラルエッジヒストグラム記述子(NEHD)法に適応し、受動的ソナー信号を分類する。
統計的および構造的テクスチャの特徴を包括的に評価し、それらの組み合わせが大きな事前学習モデルとの競合性能を達成することを示す。
提案したNEHDベースのアプローチは、水中目標認識のための軽量で効率的なソリューションを提供し、精度を維持しながら計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2025-03-17T22:57:05Z) - Heterogeneous sound classification with the Broad Sound Taxonomy and Dataset [6.91815289914328]
本稿では,異種音の自動分類手法について検討する。
手動のアノテーションによってデータセットを構築し、精度、クラスごとの多様な表現、実世界のシナリオにおける関連性を保証する。
実験結果から,音響情報や意味情報をエンコードした音声埋め込みは,分類作業において高い精度を実現することが示された。
論文 参考訳(メタデータ) (2024-10-01T18:09:02Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - Analyze the Robustness of Classifiers under Label Noise [5.708964539699851]
教師付き学習におけるラベルノイズは、誤ったラベルまたは不正確なラベルによって特徴づけられ、モデル性能を著しく損なう。
本研究は, ラベルノイズが実用的応用に与える影響について, ますます関連する問題に焦点をあてる。
論文 参考訳(メタデータ) (2023-12-12T13:51:25Z) - Combating Label Noise With A General Surrogate Model For Sample Selection [77.45468386115306]
本稿では,視覚言語サロゲートモデルCLIPを用いて,雑音の多いサンプルを自動的にフィルタリングする手法を提案する。
提案手法の有効性を実世界および合成ノイズデータセットで検証した。
論文 参考訳(メタデータ) (2023-10-16T14:43:27Z) - Learning with Noisy Labels through Learnable Weighting and Centroid Similarity [5.187216033152917]
ノイズラベルは、医学診断や自律運転などの領域で一般的である。
本稿では,雑音ラベルの存在下で機械学習モデルを訓練するための新しい手法を提案する。
以上の結果から,本手法は既存の最先端技術よりも一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2023-03-16T16:43:24Z) - Capturing scattered discriminative information using a deep architecture
in acoustic scene classification [49.86640645460706]
本研究では,識別情報を捕捉し,同時に過度に適合する問題を緩和する様々な手法について検討する。
我々は、ディープニューラルネットワークにおける従来の非線形アクティベーションを置き換えるために、Max Feature Map法を採用する。
2つのデータ拡張方法と2つの深いアーキテクチャモジュールは、システムの過度な適合を減らし、差別的なパワーを維持するためにさらに検討されている。
論文 参考訳(メタデータ) (2020-07-09T08:32:06Z) - Unsupervised Domain Adaptation for Acoustic Scene Classification Using
Band-Wise Statistics Matching [69.24460241328521]
機械学習アルゴリズムは、トレーニング(ソース)とテスト(ターゲット)データの分散のミスマッチの影響を受けやすい。
本研究では,ターゲット領域音響シーンの各周波数帯域の1次及び2次サンプル統計値と,ソース領域学習データセットの1次と2次サンプル統計値との整合性を有する教師なし領域適応手法を提案する。
提案手法は,文献にみられる最先端の教師なし手法よりも,ソース・ドメインの分類精度とターゲット・ドメインの分類精度の両面で優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:56:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。