論文の概要: Image and Data Mining in Reticular Chemistry Using GPT-4V
- arxiv url: http://arxiv.org/abs/2312.05468v1
- Date: Sat, 9 Dec 2023 05:05:25 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-12 20:33:22.260160
- Title: Image and Data Mining in Reticular Chemistry Using GPT-4V
- Title(参考訳): GPT-4Vを用いたレチキュラー化学における画像とデータマイニング
- Authors: Zhiling Zheng, Zhiguo He, Omar Khattab, Nakul Rampal, Matei A.
Zaharia, Christian Borgs, Jennifer T. Chayes, Omar M. Yaghi
- Abstract要約: GPT-4Vは、ChatGPTまたはAPIを通じてアクセス可能な、拡張された視覚機能を備えた大きな言語モデルである。
本研究は,GPT-4Vが金属-有機化合物の複雑なデータをナビゲートし,得ることができることを示す。
- 参考スコア(独自算出の注目度): 5.440238820637818
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The integration of artificial intelligence into scientific research has
reached a new pinnacle with GPT-4V, a large language model featuring enhanced
vision capabilities, accessible through ChatGPT or an API. This study
demonstrates the remarkable ability of GPT-4V to navigate and obtain complex
data for metal-organic frameworks, especially from graphical sources. Our
approach involved an automated process of converting 346 scholarly articles
into 6240 images, which represents a benchmark dataset in this task, followed
by deploying GPT-4V to categorize and analyze these images using natural
language prompts. This methodology enabled GPT-4V to accurately identify and
interpret key plots integral to MOF characterization, such as nitrogen
isotherms, PXRD patterns, and TGA curves, among others, with accuracy and
recall above 93%. The model's proficiency in extracting critical information
from these plots not only underscores its capability in data mining but also
highlights its potential in aiding the creation of comprehensive digital
databases for reticular chemistry. In addition, the extracted nitrogen isotherm
data from the selected literature allowed for a comparison between theoretical
and experimental porosity values for over 200 compounds, highlighting certain
discrepancies and underscoring the importance of integrating computational and
experimental data. This work highlights the potential of AI in accelerating
scientific discovery and innovation, bridging the gap between computational
tools and experimental research, and paving the way for more efficient,
inclusive, and comprehensive scientific inquiry.
- Abstract(参考訳): 人工知能の科学研究への統合は、ChatGPTまたはAPIを通じてアクセス可能な、視覚能力の強化を特徴とする大きな言語モデルであるGPT-4Vと新たなピンナクルに達した。
本研究は,GPT-4Vが金属-有機フレームワーク,特にグラフィカルソースから複雑なデータをナビゲートし,取得する能力を示す。
提案手法では,346の学術論文を6240の画像に自動変換し,それに続いて,GPT-4Vを用いて自然言語のプロンプトを用いて画像の分類と解析を行う。
この手法により、GPT-4Vは窒素等温線、PXRDパターン、TGA曲線などのMOF特性に不可欠な鍵プロットを93%以上の精度で正確に同定し、解釈することができる。
このモデルがこれらのプロットから重要な情報を抽出する能力は、データマイニングの能力だけでなく、レチキュラー化学のための包括的なデジタルデータベースの作成を支援する可能性も強調している。
さらに, 抽出した窒素等温性データは, 200以上の化合物の理論的および実験的なポロシティ値の比較を可能にし, 相違点を強調し, 計算および実験データの統合の重要性を強調した。
この研究は、科学の発見とイノベーションの加速、計算ツールと実験研究のギャップの橋渡し、より効率的で包括的で包括的な科学調査への道を開くためのaiの可能性を強調している。
関連論文リスト
- Knowledge Synthesis of Photosynthesis Research Using a Large Language Model [2.234461196876548]
本研究は,OpenAIのGPT-4oに基づく光合成研究アシスタント(PRAG)を提案する。
PRAGは、科学的記述に関連する5つの指標に対して平均8.7%の改善を示し、ソース透明性は25.4%増加した。
その科学的深度と領域範囲は光合成研究論文に匹敵するものであった。
論文 参考訳(メタデータ) (2025-02-03T05:10:19Z) - MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - GLaD: Synergizing Molecular Graphs and Language Descriptors for Enhanced Power Conversion Efficiency Prediction in Organic Photovoltaic Devices [43.511428925893675]
本稿では,分子グラフと言語記述子の相乗化という,有機太陽光発電(OPV)デバイスにおける電力変換効率(PCE)の予測手法を提案する。
我々は、500対のPVドナーとアクセプター分子からなるデータセットを、対応するPCE値とともに収集し、予測モデルのトレーニングデータとして利用する。
GLaDはPCEの正確な予測を実現し、効率を向上した新しいPV分子の合成を容易にする。
論文 参考訳(メタデータ) (2024-05-23T06:02:07Z) - Single and Multi-Hop Question-Answering Datasets for Reticular Chemistry with GPT-4-Turbo [0.5110571587151475]
RetChemQA"は、レチキュラー化学領域における機械学習モデルの能力を評価するために設計されたベンチマークデータセットである。
このデータセットには、シングルホップとマルチホップの問合せペアの両方が含まれており、各タイプのQ&Aは約45,000である。
質問は、NAS、ACS、RCC、Elsevier、Nature Publishing Groupなどの出版社から約2,530の学術論文を含む広範な文献コーパスから抽出された。
論文 参考訳(メタデータ) (2024-05-03T14:29:54Z) - Learning from Synthetic Data for Visual Grounding [55.21937116752679]
そこで本研究では,SynGroundが市販のビジョン・アンド・ランゲージモデルのローカライズ能力を向上できることを示す。
SynGroundで生成されたデータは、事前訓練されたALBEFモデルとBLIPモデルのポインティングゲーム精度をそれぞれ4.81%、絶対パーセンテージポイント17.11%向上させる。
論文 参考訳(メタデータ) (2024-03-20T17:59:43Z) - Extracting Protein-Protein Interactions (PPIs) from Biomedical
Literature using Attention-based Relational Context Information [5.456047952635665]
本研究は,二元的相互作用型ラベルを付加したベット型相互作用定義を用いた多元的PPIコーパスを提案する。
変換器を用いた深層学習手法は,関係表現のための関係文脈情報を利用して関係分類性能を向上させる。
このモデルの性能は, 広く研究されている4つのバイオメディカル関係抽出データセットで評価される。
論文 参考訳(メタデータ) (2024-03-08T01:43:21Z) - Mining experimental data from Materials Science literature with Large Language Models: an evaluation study [1.9849264945671101]
本研究は,大規模言語モデル (LLM) の教材科学における科学的資料から構造化情報を抽出する能力を評価することを目的としている。
我々は,情報抽出における2つの重要な課題に焦点をあてる: (i) 研究材料と物性の名前を付けたエンティティ認識(NER) と, (ii) それらのエンティティ間の関係抽出(RE) である。
これらのタスクの実行におけるLCMの性能は、BERTアーキテクチャとルールベースのアプローチ(ベースライン)に基づいて従来のモデルと比較される。
論文 参考訳(メタデータ) (2024-01-19T23:00:31Z) - GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition? [82.40761196684524]
本稿では,ゼロショット視覚認識タスクにおけるGPT-4の言語的・視覚的能力の評価に焦点を当てる。
我々は、画像、ビデオ、点群にわたるGPT-4の性能を評価するための広範な実験を行った。
言語記述が充実したGPT-4はゼロショット認識を著しく改善した。
論文 参考訳(メタデータ) (2023-11-27T11:29:10Z) - The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision) [121.42924593374127]
我々は,最新のモデルであるGPT-4Vを分析し,LMMの理解を深める。
GPT-4Vは、任意にインターリーブされたマルチモーダル入力を処理するという前例のない能力により、強力なマルチモーダルジェネラリストシステムとなっている。
GPT-4Vの、入力画像に描かれた視覚マーカーを理解するユニークな能力は、新しい人間とコンピュータの相互作用方法をもたらす。
論文 参考訳(メタデータ) (2023-09-29T17:34:51Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。