論文の概要: Differential contributions of machine learning and statistical analysis to language and cognitive sciences
- arxiv url: http://arxiv.org/abs/2404.14052v2
- Date: Sun, 13 Oct 2024 19:06:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-15 15:01:50.423499
- Title: Differential contributions of machine learning and statistical analysis to language and cognitive sciences
- Title(参考訳): 言語・認知科学における機械学習と統計的分析の差異
- Authors: Kun Sun, Rong Wang,
- Abstract要約: 本研究では、Buckeye Speech Corpusを用いて、機械学習と統計分析がデータ駆動型研究にどのように適用されているかを説明する。
それぞれのアプローチの理論的相違、実装手順、ユニークな目的を実証する。
この研究は、対象語に対する文脈的影響を測定する新しい尺度である意味的関連性が、発話中の単語の持続時間を理解するのにどのように貢献するかを強調した。
- 参考スコア(独自算出の注目度): 27.152245569974678
- License:
- Abstract: Data-driven approaches have revolutionized scientific research, with machine learning and statistical analysis being commonly used methodologies. Despite their widespread use, these approaches differ significantly in their techniques, objectives and implementations. Few studies have systematically applied both methods to identical datasets to highlight potential differences, particularly in language and cognitive sciences. This study employs the Buckeye Speech Corpus to illustrate how machine learning and statistical analysis are applied in data-driven research to obtain distinct insights on language production. We demonstrate the theoretical differences, implementation steps, and unique objectives of each approach through a comprehensive, tutorial-like comparison. Our analysis reveals that while machine learning excels at pattern recognition and prediction, statistical methods provide deeper insights into relationships between variables. The study highlights how semantic relevance, a novel metric measuring contextual influence on target words, contributes to understanding word duration in speech. We also systematically compare the differences between regression models used in machine learning and statistical analysis, particularly focusing on the training and fitting processes. Additionally, we clarify several common misconceptions that contribute to the confusion between these two approaches. Overall, by elucidating the complementary strengths of machine learning and statistics, this research enhances our understanding of diverse data-driven strategies in language and cognitive sciences, offering researchers valuable guidance on when and how to effectively apply these approaches in different research contexts.
- Abstract(参考訳): データ駆動型アプローチは科学研究に革命をもたらし、機械学習と統計分析が一般的に使われている。
広く使われているにもかかわらず、これらのアプローチは彼らの技術、目的、実装に大きく異なる。
両方の手法を同一のデータセットに体系的に応用した研究はほとんどなく、特に言語や認知科学において潜在的な違いを強調している。
この研究は、Buckeye Speech Corpusを用いて、機械学習と統計的分析をデータ駆動型研究に適用し、言語生産に関する異なる洞察を得る方法を説明する。
我々は、総合的なチュートリアルのような比較を通じて、それぞれのアプローチの理論的相違、実装手順、ユニークな目的を実証する。
分析の結果,機械学習はパターン認識や予測に優れるが,統計的手法は変数間の関係について深い洞察を与えることがわかった。
この研究は、対象語に対する文脈的影響を測定する新しい尺度である意味的関連性が、発話中の単語の持続時間を理解するのにどのように貢献するかを強調した。
また、機械学習で使用される回帰モデルと統計分析の違いを体系的に比較する。
さらに、これらの2つのアプローチの混同に寄与するいくつかの一般的な誤解を明らかにする。
全体として、機械学習と統計学の相補的な強みを解明することにより、言語と認知科学における多様なデータ駆動戦略の理解を深め、研究者がいつ、どのようにこれらのアプローチを異なる研究文脈で効果的に適用するかについての貴重なガイダンスを提供する。
関連論文リスト
- Causal Inference Tools for a Better Evaluation of Machine Learning [0.0]
本稿では、通常最小方形回帰(OLS)、可変解析(ANOVA)、ロジスティック回帰(ロジスティック回帰)などの重要な統計手法を紹介する。
この文書は研究者や実践者のガイドとして機能し、これらのテクニックがモデル行動、パフォーマンス、公平性に対する深い洞察を提供する方法について詳述している。
論文 参考訳(メタデータ) (2024-10-02T10:03:29Z) - Ontology Embedding: A Survey of Methods, Applications and Resources [54.3453925775069]
オントロジはドメイン知識とメタデータを表現するために広く使われている。
1つの簡単な解決策は、統計分析と機械学習を統合することである。
埋め込みに関する多くの論文が出版されているが、体系的なレビューの欠如により、研究者はこの分野の包括的な理解を妨げている。
論文 参考訳(メタデータ) (2024-06-16T14:49:19Z) - A review on data-driven constitutive laws for solids [0.0]
この記事では、法律を発見し、エンコードし、代理し、エミュレートするための最先端のデータ駆動技術を強調します。
我々の目標は、過去数十年で開発された幅広い方法論に組織化された分類を提供することである。
論文 参考訳(メタデータ) (2024-05-06T17:33:58Z) - Towards Interpretability in Audio and Visual Affective Machine Learning:
A Review [0.0]
我々は、感情的機械学習の文脈における解釈可能性の使用について、構造化された文献レビューを行う。
以上の結果から,過去5年間の解釈可能性手法の出現が示唆された。
現在、使用法は、使用方法の範囲、評価の深さ、使用事例の検討に限られている。
論文 参考訳(メタデータ) (2023-06-15T08:16:01Z) - Investigating Fairness Disparities in Peer Review: A Language Model
Enhanced Approach [77.61131357420201]
我々は、大規模言語モデル(LM)の助けを借りて、ピアレビューにおける公平性格差の徹底した厳密な研究を行う。
我々は、2017年から現在までのICLR(International Conference on Learning Representations)カンファレンスで、包括的なリレーショナルデータベースを収集、組み立て、維持しています。
我々は、著作者性別、地理、著作者、機関的名声など、興味のある複数の保護属性に対する公平性の違いを仮定し、研究する。
論文 参考訳(メタデータ) (2022-11-07T16:19:42Z) - Human-Robot Collaboration and Machine Learning: A Systematic Review of
Recent Research [69.48907856390834]
人間ロボットコラボレーション(Human-robot collaboration、HRC)とは、人間とロボットの相互作用を探索する手法である。
本稿では,HRCの文脈における機械学習技術の利用に関する詳細な文献レビューを提案する。
論文 参考訳(メタデータ) (2021-10-14T15:14:33Z) - Nonparametric Estimation of Heterogeneous Treatment Effects: From Theory
to Learning Algorithms [91.3755431537592]
プラグイン推定と擬似出力回帰に依存する4つの幅広いメタ学習戦略を解析する。
この理論的推論を用いて、アルゴリズム設計の原則を導出し、分析を実践に翻訳する方法について強調する。
論文 参考訳(メタデータ) (2021-01-26T17:11:40Z) - Interpretable Multi-dataset Evaluation for Named Entity Recognition [110.64368106131062]
本稿では,名前付きエンティティ認識(NER)タスクに対する一般的な評価手法を提案する。
提案手法は,モデルとデータセットの違いと,それらの間の相互作用を解釈することを可能にする。
分析ツールを利用可能にすることで、将来の研究者が同様の分析を実行し、この分野の進歩を促進することができる。
論文 参考訳(メタデータ) (2020-11-13T10:53:27Z) - Targeting Learning: Robust Statistics for Reproducible Research [1.1455937444848387]
ターゲティング・ラーニング(Targeted Learning)は、因果推論、機械学習、統計理論の進歩を統一して、科学的に影響のある質問に統計的信頼性で答えるのに役立つ統計分野である。
ターゲット学習のロードマップは、仮説を最小化し、利用可能な科学的知識にのみ注意深く根ざすように、統計的手続きを調整することを強調する。
論文 参考訳(メタデータ) (2020-06-12T17:17:01Z) - A Survey on Causal Inference [64.45536158710014]
因果推論は統計学、コンピュータ科学、教育、公共政策、経済学など、多くの分野において重要な研究トピックである。
観測データに対する様々な因果効果推定法が誕生した。
論文 参考訳(メタデータ) (2020-02-05T21:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。