論文の概要: Searching for chromate replacements using natural language processing
and machine learning algorithms
- arxiv url: http://arxiv.org/abs/2208.05672v1
- Date: Thu, 11 Aug 2022 07:21:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-12 13:23:06.876615
- Title: Searching for chromate replacements using natural language processing
and machine learning algorithms
- Title(参考訳): 自然言語処理と機械学習アルゴリズムを用いたクロメート置換の探索
- Authors: Shujing Zhao and Nick Birbilis
- Abstract要約: 本研究は、科学的文献の自動解釈から知識を抽出し、専門家による人間レベルの洞察を得ることが可能であることを実証する。
我々は、以前他の人によって探求されたWord2VecモデルとBERTモデルを採用し、それらを材料工学におけるユニークな挑戦に適用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The past few years has seen the application of machine learning utilised in
the exploration of new materials. As in many fields of research - the vast
majority of knowledge is published as text, which poses challenges in either a
consolidated or statistical analysis across studies and reports. Such
challenges include the inability to extract quantitative information, and in
accessing the breadth of non-numerical information. To address this issue, the
application of natural language processing (NLP) has been explored in several
studies to date. In NLP, assignment of high-dimensional vectors, known as
embeddings, to passages of text preserves the syntactic and semantic
relationship between words. Embeddings rely on machine learning algorithms and
in the present work, we have employed the Word2Vec model, previously explored
by others, and the BERT model - applying them towards a unique challenge in
materials engineering. That challenge is the search for chromate replacements
in the field of corrosion protection. From a database of over 80 million
records, a down-selection of 5990 papers focused on the topic of corrosion
protection were examined using NLP. This study demonstrates it is possible to
extract knowledge from the automated interpretation of the scientific
literature and achieve expert human level insights.
- Abstract(参考訳): ここ数年、新しい素材の探索に機械学習が使われるようになった。
多くの研究分野と同様に、知識の大多数はテキストとして出版され、研究と報告をまたがる統合的または統計的な分析に困難をもたらす。
このような課題には、量的情報を抽出できないことや、数値的でない情報の幅にアクセスすることが含まれる。
この問題に対処するために、自然言語処理(NLP)の適用は、これまでいくつかの研究で検討されてきた。
NLPでは、テキストの節への埋め込みとして知られる高次元ベクトルの割り当ては、単語間の構文的および意味的関係を保存する。
組み込みは機械学習アルゴリズムに依存しており、本研究では、以前他の人が検討した word2vec モデルと bert モデルを採用した。
この課題は、腐食防止分野におけるクロムの代替品の探索である。
8000万件以上のデータベースから, 腐食防食の話題に着目した5990件の論文を, NLPを用いて調査した。
本研究は,科学的文献の自動解釈から知識を抽出し,専門家による人間レベルの洞察を得ることが可能であることを示す。
関連論文リスト
- NLP-Powered Repository and Search Engine for Academic Papers: A Case Study on Cyber Risk Literature with CyLit [9.621564860645513]
自然言語処理(NLP)技術を活用した新しいフレームワークを提案する。
このフレームワークは、特定の研究領域内の学術文献の検索、要約、クラスタリングを自動化する。
我々は,サイバーリスク文献に特化して設計されたNLPベースのリポジトリであるCyLitを紹介する。
論文 参考訳(メタデータ) (2024-09-10T05:41:40Z) - Retrieval-Enhanced Machine Learning: Synthesis and Opportunities [60.34182805429511]
検索エンハンスメントは機械学習(ML)の幅広い範囲に拡張できる
この研究は、MLの様々な領域の文献を、現在の文献から欠落している一貫した表記で合成することで、このパラダイムの正式なフレームワークであるRetrieval-Enhanced Machine Learning (REML)を導入する。
本研究の目的は、様々な分野の研究者に対して、検索強化モデルの包括的、正式に構造化された枠組みを付与し、学際的な将来の研究を促進することである。
論文 参考訳(メタデータ) (2024-07-17T20:01:21Z) - Assaying on the Robustness of Zero-Shot Machine-Generated Text Detectors [57.7003399760813]
先進的なLarge Language Models (LLMs) とその特殊な変種を探索し、いくつかの方法でこの分野に寄与する。
トピックと検出性能の間に有意な相関関係が発見された。
これらの調査は、様々なトピックにまたがるこれらの検出手法の適応性と堅牢性に光を当てた。
論文 参考訳(メタデータ) (2023-12-20T10:53:53Z) - Surveying the Landscape of Text Summarization with Deep Learning: A
Comprehensive Review [2.4185510826808487]
ディープラーニングは、言語データの複雑な表現を学習できるモデルの開発を可能にすることによって、自然言語処理(NLP)に革命をもたらした。
NLPのディープラーニングモデルは、通常、大量のデータを使用してディープニューラルネットワークをトレーニングし、言語データ内のパターンと関係を学習する。
テキスト要約にディープラーニングを適用することは、テキスト要約タスクを実行するためにディープニューラルネットワークを使用することを指す。
論文 参考訳(メタデータ) (2023-10-13T21:24:37Z) - MAGE: Machine-generated Text Detection in the Wild [82.70561073277801]
大規模言語モデル(LLM)は人間レベルのテキスト生成を実現し、効果的なAI生成テキスト検出の必要性を強調している。
我々は、異なるLLMによって生成される多様な人文やテキストからテキストを収集することで、包括的なテストベッドを構築する。
問題にもかかわらず、トップパフォーマンス検出器は、新しいLCMによって生成された86.54%のドメイン外のテキストを識別することができ、アプリケーションシナリオの実現可能性を示している。
論文 参考訳(メタデータ) (2023-05-22T17:13:29Z) - Application of Transformers based methods in Electronic Medical Records:
A Systematic Literature Review [77.34726150561087]
本研究は,異なるNLPタスクにおける電子カルテ(EMR)のトランスフォーマーに基づく手法を用いて,最先端技術に関する体系的な文献レビューを行う。
論文 参考訳(メタデータ) (2023-04-05T22:19:42Z) - Text to Insight: Accelerating Organic Materials Knowledge Extraction via
Deep Learning [1.2774526936067927]
本研究は,有機材料の知識抽出を探求することを目的とする。
我々は,92,667件の要約から,855件の注釈文と708,376件の注釈文からなる研究データセットを構築した。
BiLSTM-CNN-CRF深層学習モデルを用いて,文献から重要な知識を自動的に抽出した。
論文 参考訳(メタデータ) (2021-09-27T01:58:35Z) - Text Mining for Processing Interview Data in Computational Social
Science [0.6820436130599382]
我々は、市販のテキスト分析技術を用いて、計算社会科学研究からのインタビューテキストデータを処理する。
局所的クラスタリングと用語的エンリッチメントが,応答の探索と定量化に有用であることがわかった。
我々は社会科学の研究にテキスト分析を使うことを奨励し、特に探索的オープンエンドな研究に力を入れている。
論文 参考訳(メタデータ) (2020-11-28T00:44:35Z) - Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文 参考訳(メタデータ) (2020-10-28T08:31:40Z) - A Survey of Embedding Space Alignment Methods for Language and Knowledge
Graphs [77.34726150561087]
単語,文,知識グラフの埋め込みアルゴリズムに関する現在の研究状況について調査する。
本稿では、関連するアライメント手法の分類と、この研究分野で使用されるベンチマークデータセットについて論じる。
論文 参考訳(メタデータ) (2020-10-26T16:08:13Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。