Fugu-MT 論文翻訳(概要): Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective

論文の概要: Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective

arxiv url: http://arxiv.org/abs/2306.06615v1
Date: Sun, 11 Jun 2023 08:16:25 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-13 17:45:53.117092
Title: Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective
Title（参考訳）: 大規模言語モデルを用いた分子キャプション翻訳のための分子探索
Authors: Jiatong Li, Yunqing Liu, Wenqi Fan, Xiao-Yong Wei, Hui Liu, Jiliang Tang, and Qing Li
Abstract要約: 本稿では,分子キャプション変換のための新しいフレームワーク(textbfMolReGPT)を提案する。分子理解とテキストベースの分子生成を含む分子キャプション変換によるMollReGPTの有効性を評価する。
参考スコア（独自算出の注目度）: 37.87910278902631
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Molecule discovery plays a crucial role in various scientific fields, advancing the design of tailored materials and drugs. Traditional methods for molecule discovery follow a trial-and-error process, which are both time-consuming and costly, while computational approaches such as artificial intelligence (AI) have emerged as revolutionary tools to expedite various tasks, like molecule-caption translation. Despite the importance of molecule-caption translation for molecule discovery, most of the existing methods heavily rely on domain experts, require excessive computational cost, and suffer from poor performance. On the other hand, Large Language Models (LLMs), like ChatGPT, have shown remarkable performance in various cross-modal tasks due to their great powerful capabilities in natural language understanding, generalization, and reasoning, which provides unprecedented opportunities to advance molecule discovery. To address the above limitations, in this work, we propose a novel LLMs-based framework (\textbf{MolReGPT}) for molecule-caption translation, where a retrieval-based prompt paradigm is introduced to empower molecule discovery with LLMs like ChatGPT without fine-tuning. More specifically, MolReGPT leverages the principle of molecular similarity to retrieve similar molecules and their text descriptions from a local database to ground the generation of LLMs through in-context few-shot molecule learning. We evaluate the effectiveness of MolReGPT via molecule-caption translation, which includes molecule understanding and text-based molecule generation. Experimental results show that MolReGPT outperforms fine-tuned models like MolT5-base without any additional training. To the best of our knowledge, MolReGPT is the first work to leverage LLMs in molecule-caption translation for advancing molecule discovery.
Abstract（参考訳）: 分子発見は様々な科学分野において重要な役割を担い、調整された材料や薬物の設計を進めた。従来の分子発見法は、時間とコストの両方がかかる試行錯誤プロセスに従っているが、人工知能(AI)のような計算手法は、分子キャプション翻訳のような様々なタスクを高速化するための革命的なツールとして登場した。分子発見のための分子カプセル翻訳の重要性にもかかわらず、既存の手法の多くはドメインの専門家に大きく依存しており、過剰な計算コストを必要とし、性能の低下に悩まされている。一方、chatgptのような大規模言語モデル(llm)は、自然言語理解、一般化、推論における強力な能力により、様々なクロスモーダルタスクにおいて顕著な性能を示しており、分子の発見を前進させる前例のない機会を提供している。そこで本研究では,分子キャプション変換のための新しいLLMベースのフレームワーク(\textbf{MolReGPT})を提案する。より具体的には、MollReGPTは分子類似性の原理を利用して、類似した分子とそれらのテキスト記述をローカルデータベースから取得し、コンテキスト内数発の分子学習を通じてLLMの生成を基盤とする。分子理解とテキストベースの分子生成を含む分子キャプション変換によるMollReGPTの有効性を評価する。実験結果から、MollReGPTは追加トレーニングなしでMollT5ベースのような微調整モデルよりも優れた性能を示した。私たちの知る限りでは、MollReGPTは分子キャプション翻訳のLLMを分子発見の進歩に活用する最初の研究である。

関連論文リスト

MolEdit: Knowledge Editing for Multimodal Molecule Language Models [57.85765246726558]
MolEditは分子対カプセル生成とキャプション対分子生成のためのフレームワークである。 MolEditにはMulti-Expert Knowledge Adapterが組み込まれており、異なる分子ファセットの専門の専門家に、Expertise-Aware Editing Switcherで編集をルーティングする。 MolEditは信頼性を最大18.8%向上し、効率を保ちながらベースラインよりも12.0%良いローカリティを提供する。
論文参考訳（メタデータ） (2025-11-16T20:48:37Z)
$\ ext{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-08-12T05:46:47Z)
MolReasoner: Toward Effective and Interpretable Reasoning for Molecular LLMs [30.030008221150407]
MolReasonerは、大規模言語モデルを記憶から化学推論に移行するために設計された2段階のフレームワークである。まず,GPT-4o で生成した合成Chain-of-Thought(CoT) サンプルを用いてモデルの推論能力を初期化し,化学的精度を検証した Mol-SFT を提案する。その後、Moll-RLは、化学構造と言語的記述との整合性を明確に設計した特殊報酬関数による強化学習を適用した。
論文参考訳（メタデータ） (2025-08-04T05:10:11Z)
mCLM: A Function-Infused and Synthesis-Friendly Modular Chemical Language Model [65.69164455183956]
分子をビルディングブロックにトークン化するモジュール型ケミカルランゲージモデルであるmCLMを提案し,関数と分子ビルディングブロックの両方の自然言語記述のバイリンガル言語モデルを学習する。 FDAが承認した430種類の薬物の実験では、mCLMは薬物のポテンシャルを決定するのに不可欠な6つの化学機能のうち5つを著しく改善できることがわかった。
論文参考訳（メタデータ） (2025-05-18T22:52:39Z)
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [55.87790704067848]
Mol-LLaMAは、分子を中心とした一般的な知識を把握した大きな分子言語モデルである。異なる分子エンコーダの相補的な情報を統合するモジュールを導入する。実験の結果,Moll-LLaMAは分子の一般的な特徴を理解することができることがわかった。
論文参考訳（メタデータ） (2025-02-19T05:49:10Z)
Mol-LLM: Generalist Molecular LLM with Improved Graph Utilization [8.846705148987652]
LLM(Large Language Models)は、分子タスクのための一般的なLLMの開発を動機付けている。ナイーブな次世代予測トレーニングで訓練されたLSMは、元の分子と崩壊した分子の両方に同様の確率スコアを割り当てる。本稿では, 徹底的なマルチモーダル命令チューニングと分子構造選好最適化に基づく新しいマルチモーダルトレーニング手法を提案する。
論文参考訳（メタデータ） (2025-02-05T01:14:12Z)
Speak-to-Structure: Evaluating LLMs in Open-domain Natural Language-Driven Molecule Generation [26.166926881479316]
Speak-to-Structure (S2-Bench) は、オープンドメインの自然言語駆動分子生成において、LLM(Large Language Models)を評価する最初のベンチマークである。私たちのベンチマークには、分子編集(MolEdit)、分子最適化(MolOpt)、カスタマイズされた分子生成(MolCustom)の3つの重要なタスクが含まれている。また,Llama-3.1-8B が S2-Bench 上で GPT-4o や Claude-3.5 といった最強の LLM を超えるような大規模命令チューニングデータセット OpenMolIns も導入した。
論文参考訳（メタデータ） (2024-12-19T08:51:16Z)
MolCap-Arena: A Comprehensive Captioning Benchmark on Language-Enhanced Molecular Property Prediction [44.27112553103388]
分子特性予測を拡張した大規模言語モデル(LLM)の最初の包括的なベンチマークである分子キャプションアリーナを提示する。汎用分子キャプタとドメイン特異的分子キャプタを含む20以上のLDMを,様々な予測タスクで評価した。以上の結果から,LLM抽出した知識が最先端の分子表現を向上する可能性が示唆された。
論文参考訳（メタデータ） (2024-11-01T17:03:16Z)
FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。 FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。 MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2024-10-02T23:04:58Z)
Many-Shot In-Context Learning for Molecular Inverse Design [56.65345962071059]
大規模言語モデル(LLM)は、数ショットのインコンテキスト学習(ICL)において、優れたパフォーマンスを示している。マルチショットICLで利用可能な実験データの不足を克服する,新しい半教師付き学習手法を開発した。示すように、この新しい手法は、既存の分子設計のためのICL法を大幅に改善し、科学者にとってアクセスしやすく、使いやすくする。
論文参考訳（メタデータ） (2024-07-26T21:10:50Z)
MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension [34.586861881519134]
タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。本研究は、分子をマルチモーダルな外部モジュール、すなわちMollXに装備することで、分子の理解能力を高めることを目的とする。特に,分子の表現にSMILES文字列を直接使用する代わりに,特定のエンコーダを用いて,SMILES文字列と2次元分子グラフ表現の両方から微細な特徴を抽出する。
論文参考訳（メタデータ） (2024-06-10T20:25:18Z)
Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。 TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文参考訳（メタデータ） (2024-03-20T02:15:55Z)
Large Language Models are In-Context Molecule Learners [22.06735237464927]
我々は,LLMが文脈例から分子文アライメントを学習できる新しいパラダイムとして,In-Context Molecule Adaptation (ICMA)を提案する。 ICMAは、Hybrid Context Retrieval、Post-Retrieval Re- rank、In-context Molecule Tuningの3つのステージを組み込んでいる。 ICMTは、余分な訓練コーパスや複雑な構造を伴わずに、LLMに最先端または同等のパフォーマンスを実現することができることを示す。
論文参考訳（メタデータ） (2024-03-07T03:58:28Z)
Can Large Language Models Empower Molecular Property Prediction? [16.5246941211725]
分子特性の予測は、科学分野における形質転換の可能性によって大きな注目を集めている。近年,Large Language Models (LLMs) が急速に発展し,NLPの分野に革命をもたらした。本研究では、ゼロ/フェーショットの分子分類と、LLMによって生成された新しい説明を分子の表現として用いるという2つの視点を通して、この目的に向けて前進する。
論文参考訳（メタデータ） (2023-07-14T16:06:42Z)
Mol-Instructions: A Large-Scale Biomolecular Instruction Dataset for Large Language Models [44.41299105569085]
Mol-Instructionsは、生体分子ドメイン用に設計された包括的な命令データセットである。各コンポーネントは、生体分子の特徴や行動に関するLCMの理解と予測能力を改善することを目的としている。生体分子研究の複雑な領域における大規模モデルの性能向上におけるモールインストラクションの有効性を実証する。
論文参考訳（メタデータ） (2023-06-13T14:35:34Z)
MolXPT: Wrapping Molecules with Text for Generative Pre-training [141.0924452870112]
MolXPTは、テキストでラップされたSMILESで事前訓練されたテキストと分子の統一言語モデルである。 MolXPT は MoleculeNet 上での分子特性予測の強いベースラインを上回ります。
論文参考訳（メタデータ） (2023-05-18T03:58:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。