論文の概要: Informed Machine Learning, Centrality, CNN, Relevant Document Detection,
Repatriation of Indigenous Human Remains
- arxiv url: http://arxiv.org/abs/2303.14475v1
- Date: Sat, 25 Mar 2023 14:08:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 19:23:02.217399
- Title: Informed Machine Learning, Centrality, CNN, Relevant Document Detection,
Repatriation of Indigenous Human Remains
- Title(参考訳): インフォームド・機械学習、中央集権性、cnn、関連する文書の検出、先住民の遺体の送還
- Authors: Md Abul Bashar, Richi Nayak, Gareth Knapman, Paul Turnbull, Cressida
Fforde
- Abstract要約: 本稿では,データ科学者と社会科学研究者によるRRR(Research, Reconcile, Renew Network)による共同研究について報告する。
関連テキストの検索と意味分析のプロセスを自動化する機械学習ベースのソリューションの開発について、現在までの作業について説明する。
検出モデルの精度を向上させるため、専門家による文脈知識を用いたドキュメンタリーコンテンツを記述するインフォームドニューラルネットワーク(INN)モデルについて検討する。
- 参考スコア(独自算出の注目度): 1.3299507495084417
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Among the pressing issues facing Australian and other First Nations peoples
is the repatriation of the bodily remains of their ancestors, which are
currently held in Western scientific institutions. The success of securing the
return of these remains to their communities for reburial depends largely on
locating information within scientific and other literature published between
1790 and 1970 documenting their theft, donation, sale, or exchange between
institutions. This article reports on collaborative research by data scientists
and social science researchers in the Research, Reconcile, Renew Network (RRR)
to develop and apply text mining techniques to identify this vital information.
We describe our work to date on developing a machine learning-based solution to
automate the process of finding and semantically analysing relevant texts.
Classification models, particularly deep learning-based models, are known to
have low accuracy when trained with small amounts of labelled (i.e.
relevant/non-relevant) documents. To improve the accuracy of our detection
model, we explore the use of an Informed Neural Network (INN) model that
describes documentary content using expert-informed contextual knowledge. Only
a few labelled documents are used to provide specificity to the model, using
conceptually related keywords identified by RRR experts in provenance research.
The results confirm the value of using an INN network model for identifying
relevant documents related to the investigation of the global commercial trade
in Indigenous human remains. Empirical analysis suggests that this INN model
can be generalized for use by other researchers in the social sciences and
humanities who want to extract relevant information from large textual corpora.
- Abstract(参考訳): オーストラリアや他のファースト・ネイションズ(英語版)の人々が直面している問題の中には、現在西欧の科学機関で開催されている先祖の遺体の送還がある。
1790年から1970年にかけて発行された科学その他の文献に、彼らの盗難、寄付、販売、または機関間の交換を記した情報を見つけることに大きく依存している。
本稿では,データ科学者と社会科学研究者によるRRR(Research, Reconcile, Renew Network)による共同研究について報告する。
関連するテキストの検索と意味解析のプロセスを自動化した機械学習ベースのソリューションの開発に,これまで取り組んできた成果について述べる。
分類モデル、特に深層学習に基づくモデルは、少量のラベル付き文書(関連性/非関連性)で訓練された場合、精度が低いことが知られている。
検出モデルの精度を向上させるため、専門家による文脈知識を用いたドキュメンタリーコンテンツを記述するインフォームドニューラルネットワーク(INN)モデルについて検討する。
証明研究においてRRRの専門家によって特定された概念的関連キーワードを使用して、モデルに特異性を提供するために、ラベル付き文書はわずかである。
以上の結果から,在来人類の国際商取引調査に関連する関連文書の同定に,イン・ネットワーク・モデルを用いた価値が確認できた。
実証分析により、このinnモデルは、大きなテキストコーパスから関連情報を抽出したい社会科学や人文科学の他の研究者によって一般化できることが示唆された。
関連論文リスト
- From Matching to Generation: A Survey on Generative Information Retrieval [21.56093567336119]
生成情報検索(GenIR)は新たなパラダイムとして登場し,近年注目を集めている。
本稿では,GenIRの最新研究動向を体系的にレビューすることを目的とする。
論文 参考訳(メタデータ) (2024-04-23T09:05:37Z) - ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、大規模言語モデルによる研究アイデア作成エージェントである。
科学文献に基づいて繰り返し精製しながら、問題、方法、実験設計を生成する。
我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文 参考訳(メタデータ) (2024-04-11T13:36:29Z) - SciNews: From Scholarly Complexities to Public Narratives -- A Dataset for Scientific News Report Generation [20.994565065595232]
我々は、科学ニュースの自動生成を容易にするための新しいコーパスを提示する。
本データセットは,9分野にわたる学術出版物と,それに対応する科学報告から構成される。
我々は、最先端のテキスト生成モデルを用いてデータセットをベンチマークする。
論文 参考訳(メタデータ) (2024-03-26T14:54:48Z) - Towards Data-and Knowledge-Driven Artificial Intelligence: A Survey on Neuro-Symbolic Computing [73.0977635031713]
ニューラルシンボリック・コンピューティング(NeSy)は、人工知能(AI)の活発な研究領域である。
NeSyは、ニューラルネットワークにおける記号表現の推論と解釈可能性の利点と堅牢な学習の整合性を示す。
論文 参考訳(メタデータ) (2022-10-28T04:38:10Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Probing Across Time: What Does RoBERTa Know and When? [70.20775905353794]
言語知識は、ドメイン間で高速、安定、そして堅牢に獲得されることを示す。
事実と常識はより遅く、ドメインに敏感です。
クロスタイム探索は、これらのモデルが生み出す複雑で混ざった学習を理解するのに役立ち、必要な学習を迅速に行うためのより効率的なアプローチへと導いてくれると信じています。
論文 参考訳(メタデータ) (2021-04-16T04:26:39Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z) - Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文 参考訳(メタデータ) (2020-10-28T08:31:40Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。