論文の概要: Use and Misuse of Machine Learning in Anthropology
- arxiv url: http://arxiv.org/abs/2209.02811v1
- Date: Tue, 6 Sep 2022 20:32:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-08 12:07:39.960822
- Title: Use and Misuse of Machine Learning in Anthropology
- Title(参考訳): 人類学における機械学習の利用と誤用
- Authors: Jeff Calder, Reed Coil, Annie Melton, Peter J. Olver, Gilbert
Tostevin, Katrina Yezzi-Woodley
- Abstract要約: 生物学的・文化的な証拠に基づいて人類の進化を理解することを目指す古人類学の分野に焦点をあてる。
本研究の目的は,MLが古人類学に応用されている方法について,簡単な紹介を行うことである。
人類学文献の集積部において,ML手法の正しいプロトコルの一連の誤り,誤り,違反について論じる。
- 参考スコア(独自算出の注目度): 0.9786690381850356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning (ML), being now widely accessible to the research community
at large, has fostered a proliferation of new and striking applications of
these emergent mathematical techniques across a wide range of disciplines. In
this paper, we will focus on a particular case study: the field of
paleoanthropology, which seeks to understand the evolution of the human species
based on biological and cultural evidence. As we will show, the easy
availability of ML algorithms and lack of expertise on their proper use among
the anthropological research community has led to foundational misapplications
that have appeared throughout the literature. The resulting unreliable results
not only undermine efforts to legitimately incorporate ML into anthropological
research, but produce potentially faulty understandings about our human
evolutionary and behavioral past.
The aim of this paper is to provide a brief introduction to some of the ways
in which ML has been applied within paleoanthropology; we also include a survey
of some basic ML algorithms for those who are not fully conversant with the
field, which remains under active development. We discuss a series of missteps,
errors, and violations of correct protocols of ML methods that appear
disconcertingly often within the accumulating body of anthropological
literature. These mistakes include use of outdated algorithms and practices;
inappropriate train/test splits, sample composition, and textual explanations;
as well as an absence of transparency due to the lack of data/code sharing, and
the subsequent limitations imposed on independent replication. We assert that
expanding samples, sharing data and code, re-evaluating approaches to peer
review, and, most importantly, developing interdisciplinary teams that include
experts in ML are all necessary for progress in future research incorporating
ML within anthropology.
- Abstract(参考訳): 機械学習(ml)は現在、研究コミュニティに広くアクセス可能になっているが、これらの創発的な数学テクニックの、幅広い分野にわたる新しく印象的な応用が広まりつつある。
本稿では,生物的・文化的証拠に基づいて人類の進化を理解することを目的とした古人類学の分野である,特定のケーススタディに焦点を当てる。
私たちが示すように、mlアルゴリズムの可用性と、人類学研究コミュニティにおける適切な使用に関する専門知識の欠如は、文学全体に現れた基礎的な誤適用につながった。
その結果、人類学研究にMLを合法的に取り入れる努力を損なうだけでなく、人類の進化と行動の過去に関する潜在的に欠陥のある理解を生み出す。
本研究の目的は,MLが古人類学に応用されている方法のいくつかを簡潔に紹介することである。
人類学文献の集積部において,ML手法の正しいプロトコルの一連の誤り,誤り,違反について論じる。
これらの誤りには、時代遅れのアルゴリズムとプラクティスの使用、不適切なトレーニング/テスト分割、サンプル構成、テキスト説明、データ/コード共有の欠如による透明性の欠如、それに続く独立レプリケーションへの制限などが含まれる。
我々は、サンプルの拡大、データとコードの共有、ピアレビューへのアプローチの再評価、そして最も重要なことは、MLの専門家を含む学際チームの開発が、人類学にMLを取り入れた今後の研究の進展に必要である、と断言する。
関連論文リスト
- Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文 参考訳(メタデータ) (2024-07-17T20:01:21Z) - Ontology Embedding: A Survey of Methods, Applications and Resources [54.3453925775069]
オントロジはドメイン知識とメタデータを表現するために広く使われている。
1つの簡単な解決策は、統計分析と機械学習を統合することである。
埋め込みに関する多くの論文が出版されているが、体系的なレビューの欠如により、研究者はこの分野の包括的な理解を妨げている。
論文 参考訳(メタデータ) (2024-06-16T14:49:19Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Aligning Large Language Models with Human: A Survey [53.6014921995006]
広範囲なテキストコーパスで訓練されたLarge Language Models (LLM) は、幅広い自然言語処理(NLP)タスクの先導的なソリューションとして登場した。
その顕著な性能にもかかわらず、これらのモデルは、人間の指示を誤解したり、偏見のあるコンテンツを生成したり、事実的に誤った情報を生成するといった、ある種の制限を受ける傾向にある。
本調査では,これらのアライメント技術の概要について概観する。
論文 参考訳(メタデータ) (2023-07-24T17:44:58Z) - A Survey on Few-Shot Class-Incremental Learning [11.68962265057818]
FSCIL(Few-shot class-incremental Learning)は、ディープニューラルネットワークが新しいタスクを学習する上で重要な課題である。
本稿では, FSCILに関する包括的調査を行う。
FSCILはコンピュータビジョンの様々な分野で大きな成果を上げている。
論文 参考訳(メタデータ) (2023-04-17T10:15:08Z) - Knowledge-augmented Graph Machine Learning for Drug Discovery: A Survey [6.288056740658763]
グラフ機械学習(GML)は、グラフ構造化バイオメディカルデータをモデル化する優れた能力で注目されている。
近年の研究では、より正確で解釈可能な薬物発見を実現するために、外部のバイオメディカル知識をGMLパイプラインに統合することを提案した。
論文 参考訳(メタデータ) (2023-02-16T12:38:01Z) - Lost in Translation: Reimagining the Machine Learning Life Cycle in
Education [12.802237736747077]
機械学習(ML)技術は、教育においてますます普及している。
ML技術が長年の教育原則と目標をどのように支えているかを調べる必要がある。
本研究では,教育専門家へのインタビューから得られた質的な洞察をもとに,この複雑な景観を考察した。
論文 参考訳(メタデータ) (2022-09-08T17:14:01Z) - The worst of both worlds: A comparative analysis of errors in learning
from data in psychology and machine learning [17.336655978572583]
機械学習(ML)が誤診や複製の危機に直面しているという最近の懸念は、ML研究で公表された主張の一部が対面価値で評価できないことを示唆している。
教師付きMLにおける研究の関心事は、実験科学における複製危機と共通している。
論文 参考訳(メタデータ) (2022-03-12T18:26:24Z) - Understanding the Usability Challenges of Machine Learning In
High-Stakes Decision Making [67.72855777115772]
機械学習(ML)は、多種多様な成長を続ける一連のドメインに適用されている。
多くの場合、MLやデータサイエンスの専門知識を持たないドメインの専門家は、ML予測を使用してハイステークな意思決定を行うように求められます。
児童福祉スクリーニングにおけるMLユーザビリティの課題について,児童福祉スクリーニング者との一連のコラボレーションを通じて検討する。
論文 参考訳(メタデータ) (2021-03-02T22:50:45Z) - Interpretable Machine Learning -- A Brief History, State-of-the-Art and
Challenges [0.8029049649310213]
我々は、解釈可能な機械学習(IML)の分野の簡単な歴史を提示し、最先端の解釈手法の概要を説明し、課題について議論する。
この分野は若いが、回帰モデリングとルールベースの機械学習に200年以上のルーツがある。
多くの新しいIML手法が提案され、その多くがモデルに依存しないが、深層学習や木に基づくアンサンブルに特有の解釈技術も提案されている。
論文 参考訳(メタデータ) (2020-10-19T09:20:03Z) - Heterogeneous Representation Learning: A Review [66.12816399765296]
不均一表現学習(HRL)には、いくつかの独特な課題がある。
異種入力を用いて既存の学習環境をモデル化可能な統合学習フレームワークを提案する。
HRLでは触れられていない課題と今後の研究方向性を強調します。
論文 参考訳(メタデータ) (2020-04-28T05:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。