論文の概要: Searching for Carriers of the Diffuse Interstellar Bands Across
Disciplines, using Natural Language Processing
- arxiv url: http://arxiv.org/abs/2211.08513v2
- Date: Thu, 17 Nov 2022 18:08:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 12:56:07.387723
- Title: Searching for Carriers of the Diffuse Interstellar Bands Across
Disciplines, using Natural Language Processing
- Title(参考訳): 自然言語処理を用いたディシプリンの拡散星間バンドのキャリヤ探索
- Authors: Corentin van den Broek d'Obrenan, Fr\'ed\'eric Galliano, Jeremy
Minton, Viktor Botev, Ronin Wu
- Abstract要約: 自然言語処理は、科学者が多くの記事から自動的に情報を合成できる機械学習技術である。
我々は,Diffuse Interstellar Bands (DIBs) の担体となる化合物の学際探索にNLPを用いた。
我々は、オープンアクセスにおいて、150万のクロスドメイン記事のコーパス上でNLPモデルをトレーニングし、DIBに関する天体物理学的なパブリッシングのコーパスを用いて、このモデルを微調整した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The explosion of scientific publications overloads researchers with
information. This is even more dramatic for interdisciplinary studies, where
several fields need to be explored. A tool to help researchers overcome this is
Natural Language Processing (NLP): a machine-learning (ML) technique that
allows scientists to automatically synthesize information from many articles.
As a practical example, we have used NLP to conduct an interdisciplinary search
for compounds that could be carriers for Diffuse Interstellar Bands (DIBs), a
long-standing open question in astrophysics. We have trained a NLP model on a
corpus of 1.5 million cross-domain articles in open access, and fine-tuned this
model with a corpus of astrophysical publications about DIBs. Our analysis
points us toward several molecules, studied primarily in biology, having
transitions at the wavelengths of several DIBs and composed of abundant
interstellar atoms. Several of these molecules contain chromophores, small
molecular groups responsible for the molecule's colour, that could be promising
candidate carriers. Identifying viable carriers demonstrates the value of using
NLP to tackle open scientific questions, in an interdisciplinary manner.
- Abstract(参考訳): 科学出版物の爆発は、研究者に情報を積み重ねる。
これは、いくつかの分野を探求する必要がある学際的な研究にとってさらに劇的である。
研究者がこれを克服するためのツールが自然言語処理(NLP)である。機械学習(ML)技術で、科学者は多くの記事から情報を自動で合成する。
実用的な例として,天体物理学における長年の疑問である拡散型星間バンド (dibs) のキャリアになりうる化合物の学際探索にnlpを用いた。
我々は、オープンアクセスで150万のクロスドメイン記事のコーパス上でNLPモデルをトレーニングし、DIBに関する天体物理論文のコーパスを用いて、このモデルを微調整した。
我々の分析は、主に生物学で研究され、数個のジブの波長で遷移し、豊富な星間原子からなるいくつかの分子を指し示している。
これらの分子のいくつかは、分子の色に責任を持つ小さな分子群であるクロモフォアを含んでいる。
有効なキャリアを特定することは、学際的な方法で、オープンな科学的問題に取り組むためにNLPを使うことの価値を示す。
関連論文リスト
- MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension [34.586861881519134]
タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。
本研究は、分子をマルチモーダルな外部モジュール、すなわちMollXに装備することで、分子の理解能力を高めることを目的とする。
特に,分子の表現にSMILES文字列を直接使用する代わりに,特定のエンコーダを用いて,SMILES文字列と2次元分子グラフ表現の両方から微細な特徴を抽出する。
論文 参考訳(メタデータ) (2024-06-10T20:25:18Z) - Bridging Text and Molecule: A Survey on Multimodal Frameworks for Molecule [16.641797535842752]
本稿では,分子研究のためのマルチモーダルフレームワークに関する最初の体系的研究について述べる。
分子深層学習の発展から始まり、テキストモダリティの関与の必要性を指摘する。
さらに, 大規模言語モデルの利用, 分子課題の促進, 創薬における重要な応用について検討した。
論文 参考訳(メタデータ) (2024-03-07T03:03:13Z) - Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - Scientific Large Language Models: A Survey on Biological & Chemical Domains [47.97810890521825]
大規模言語モデル(LLM)は、自然言語理解の強化において、変革的な力として現れてきた。
LLMの応用は従来の言語境界を超えて、様々な科学分野で開発された専門的な言語システムを含んでいる。
AI for Science(AI for Science)のコミュニティで急成長している分野として、科学LLMは包括的な探査を義務付けている。
論文 参考訳(メタデータ) (2024-01-26T05:33:34Z) - ProBio: A Protocol-guided Multimodal Dataset for Molecular Biology Lab [67.24684071577211]
研究結果を複製するという課題は、分子生物学の分野に重大な障害をもたらしている。
まず、この目的に向けた最初のステップとして、ProBioという名前の包括的なマルチモーダルデータセットをキュレートする。
次に、透明なソリューショントラッキングとマルチモーダルなアクション認識という2つの挑戦的なベンチマークを考案し、BioLab設定におけるアクティビティ理解に関連する特徴と難しさを強調した。
論文 参考訳(メタデータ) (2023-11-01T14:44:01Z) - Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文 参考訳(メタデータ) (2023-06-21T02:05:48Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - An optical tweezer array of ground-state polar molecules [2.3550230036322337]
内部状態と運動状態が制御され、個別に操作可能な極性分子が多くの量子科学応用に望ましい。
この手法を5つの分子の配列に拡張し、分子間相互作用を研究する能力を解き放つ。
論文 参考訳(メタデータ) (2021-12-02T05:32:41Z) - ChemoVerse: Manifold traversal of latent spaces for novel molecule
discovery [0.7742297876120561]
所望の化学的性質を持つ分子構造を同定することが不可欠である。
ニューラルネットワークと機械学習を用いた生成モデルの最近の進歩は、薬物のような化合物の仮想ライブラリの設計に広く利用されている。
論文 参考訳(メタデータ) (2020-09-29T12:11:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。