Fugu-MT 論文翻訳(概要): SmileyLlama: Modifying Large Language Models for Directed Chemical Space Exploration

論文の概要: SmileyLlama: Modifying Large Language Models for Directed Chemical Space Exploration

arxiv url: http://arxiv.org/abs/2409.02231v1
Date: Tue, 3 Sep 2024 18:59:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-05 21:27:46.253271
Title: SmileyLlama: Modifying Large Language Models for Directed Chemical Space Exploration
Title（参考訳）: SmileyLlama: 化学宇宙探査のための大規模言語モデルの修正
Authors: Joseph M. Cavanagh, Kunyang Sun, Andrew Gritsevskiy, Dorian Bagni, Thomas D. Bannister, Teresa Head-Gordon,
Abstract要約: 我々は,Large Language Model (LLM) がケミカル言語モデル (CLM) の基礎モデルとして機能することを示す。我々はLSMを訓練して、薬物開発に特有な分子の生成などのプロンプトに反応できることを実証した。
参考スコア（独自算出の注目度）: 2.6421122712076244
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Here we show that a Large Language Model (LLM) can serve as a foundation model for a Chemical Language Model (CLM) which performs at or above the level of CLMs trained solely on chemical SMILES string data. Using supervised fine-tuning (SFT) and direct preference optimization (DPO) on the open-source Llama LLM, we demonstrate that we can train an LLM to respond to prompts such as generating molecules with properties of interest to drug development. This overall framework allows an LLM to not just be a chatbot client for chemistry and materials tasks, but can be adapted to speak more directly as a CLM which can generate molecules with user-specified properties.
Abstract（参考訳）: ここでは,Large Language Model (LLM) がケミカル言語モデル (CLM) の基礎モデルとして機能し,化学SMILES文字列データのみに基づいて訓練されたCLMのレベル以上で動作することを示す。オープンソースLlama LLMにおけるSFTと直接選好最適化(DPO)を用いて, LLMをトレーニングし, 薬物開発に特有な分子生成などのプロンプトに応答できることを実証した。この全体的なフレームワークにより、LCMは化学および材料タスクのためのチャットボットクライアントであるだけでなく、ユーザが指定した特性を持つ分子を生成することができるCLMとして、より直接的に話すことができる。

関連論文リスト

ChemActor: Enhancing Automated Extraction of Chemical Synthesis Actions with LLM-Generated Data [53.78763789036172]
ケミカルエグゼキュータとして完全微調整された大規模言語モデル(LLM)であるChemActorを紹介し,非構造化実験手順と構造化動作シーケンスを変換する。このフレームワークは、分散分散に基づくデータ選択モジュールと汎用LLMを統合し、単一の分子入力からマシン実行可能なアクションを生成する。反応記述(R2D)と記述記述処理(D2A)のタスクの実験により、ChemActorは最先端のパフォーマンスを達成し、ベースラインモデルよりも10%高い性能を示した。
論文参考訳（メタデータ） (2025-06-30T05:11:19Z)
Improving Chemical Understanding of LLMs via SMILES Parsing [18.532188836688928]
CLEANMOLは、SMILES解析をクリーンで決定論的タスクのスイートに定式化する新しいフレームワークである。適応的難易度スコアリングを伴う分子事前学習データセットを構築し,これらの課題に対してオープンソースのLCMを事前学習する。以上の結果から,CLEANMOLは構造的理解を高めるだけでなく,Moll-Instructionsベンチマークのベースラインと競合する。
論文参考訳（メタデータ） (2025-05-22T07:54:39Z)
ChemMLLM: Chemical Multimodal Large Language Model [52.95382215206681]
分子理解と生成のための化学多モーダル大規模言語モデルであるChemMLLMを提案する。また、テキスト、分子SMILES文字列、画像にまたがる5つのマルチモーダルタスクを設計し、データセットをキュレートする。実験結果から,ChemMLLMは評価された全てのタスクにおいて優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2025-05-22T07:32:17Z)
mCLM: A Function-Infused and Synthesis-Friendly Modular Chemical Language Model [65.69164455183956]
分子をビルディングブロックにトークン化するモジュール型ケミカルランゲージモデルであるmCLMを提案し,関数と分子ビルディングブロックの両方の自然言語記述のバイリンガル言語モデルを学習する。 FDAが承認した430種類の薬物の実験では、mCLMは薬物のポテンシャルを決定するのに不可欠な6つの化学機能のうち5つを著しく改善できることがわかった。
論文参考訳（メタデータ） (2025-05-18T22:52:39Z)
FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。 FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された新しいモデルである。我々は、13のタスクのうち11のタスクで最先端のパフォーマンスを達成するMoleculeNetデータセット上で、FARMを評価した。
論文参考訳（メタデータ） (2024-10-02T23:04:58Z)
Many-Shot In-Context Learning for Molecular Inverse Design [56.65345962071059]
大規模言語モデル(LLM)は、数ショットのインコンテキスト学習(ICL)において、優れたパフォーマンスを示している。マルチショットICLで利用可能な実験データの不足を克服する,新しい半教師付き学習手法を開発した。示すように、この新しい手法は、既存の分子設計のためのICL法を大幅に改善し、科学者にとってアクセスしやすく、使いやすくする。
論文参考訳（メタデータ） (2024-07-26T21:10:50Z)
MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension [34.586861881519134]
タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。本研究は、分子をマルチモーダルな外部モジュール、すなわちMollXに装備することで、分子の理解能力を高めることを目的とする。特に,分子の表現にSMILES文字列を直接使用する代わりに,特定のエンコーダを用いて,SMILES文字列と2次元分子グラフ表現の両方から微細な特徴を抽出する。
論文参考訳（メタデータ） (2024-06-10T20:25:18Z)
DrugLLM: Open Large Language Model for Few-shot Molecule Generation [20.680942401843772]
DrugLLMは、過去の修飾に基づいて次の分子を予測することで、薬物発見における分子の修飾方法を学ぶ。計算実験では、限られた例に基づいて期待された特性を持つ新しい分子を生成することができる。
論文参考訳（メタデータ） (2024-05-07T09:18:13Z)
Benchmarking Large Language Models for Molecule Prediction Tasks [7.067145619709089]
大規模言語モデル(LLM)は多くの自然言語処理(NLP)タスクの最前線にある。 LLMは分子予測タスクを効果的に扱えるのか? 6つの標準分子データセットの分類および回帰予測タスクを同定する。テキストベースのモデルと、分子の幾何学的構造を分析するために特別に設計されたモデルを含む、既存の機械学習(ML)モデルと比較する。
論文参考訳（メタデータ） (2024-03-08T05:59:56Z)
Large Language Models are In-Context Molecule Learners [22.06735237464927]
我々は,LLMが文脈例から分子文アライメントを学習できる新しいパラダイムとして,In-Context Molecule Adaptation (ICMA)を提案する。 ICMAは、Hybrid Context Retrieval、Post-Retrieval Re- rank、In-context Molecule Tuningの3つのステージを組み込んでいる。 ICMTは、余分な訓練コーパスや複雑な構造を伴わずに、LLMに最先端または同等のパフォーマンスを実現することができることを示す。
論文参考訳（メタデータ） (2024-03-07T03:58:28Z)
Knowledge Fusion of Large Language Models [73.28202188100646]
本稿では,大規模言語モデル(LLM)における知識融合の概念を紹介する。我々は、それらの集合的知識と独特な強みを外部化し、それによってターゲットモデルの能力が、どのソースLLMよりも高められるようにします。この結果から,LLMの融合により,推論やコモンセンス,コード生成など,対象モデルの性能が向上することが確認された。
論文参考訳（メタデータ） (2024-01-19T05:02:46Z)
Let Models Speak Ciphers: Multiagent Debate through Embeddings [84.20336971784495]
この問題を解決するためにCIPHER(Communicative Inter-Model Protocol Through Embedding Representation)を導入する。自然言語から逸脱することで、CIPHERはモデルの重みを変更することなく、より広い範囲の情報を符号化する利点を提供する。このことは、LLM間の通信における代替の"言語"としての埋め込みの優越性と堅牢性を示している。
論文参考訳（メタデータ） (2023-10-10T03:06:38Z)
Can Large Language Models Empower Molecular Property Prediction? [16.5246941211725]
分子特性の予測は、科学分野における形質転換の可能性によって大きな注目を集めている。近年,Large Language Models (LLMs) が急速に発展し,NLPの分野に革命をもたらした。本研究では、ゼロ/フェーショットの分子分類と、LLMによって生成された新しい説明を分子の表現として用いるという2つの視点を通して、この目的に向けて前進する。
論文参考訳（メタデータ） (2023-07-14T16:06:42Z)
Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective [53.300288393173204]
大規模言語モデル(LLM)は、様々なクロスモーダルタスクにおいて顕著なパフォーマンスを示している。本研究では,分子カプセル翻訳のためのインコンテキストFew-Shot Molecule Learningパラダイムを提案する。分子理解とテキストベースの分子生成を含む分子キャプション翻訳におけるMollReGPTの有効性を評価する。
論文参考訳（メタデータ） (2023-06-11T08:16:25Z)
LLM-Pruner: On the Structural Pruning of Large Language Models [65.02607075556742]
大規模言語モデル(LLM)は、言語理解と生成において顕著な能力を示している。タスク非依存であり、元のトレーニングデータセットへの依存を最小限に抑えるという2つの制約の範囲内でLLMの圧縮に取り組む。 LLM-Prunerという名前のこの手法は、非臨界結合構造を選択的に除去する構造プルーニングを採用する。
論文参考訳（メタデータ） (2023-05-19T12:10:53Z)
Check Your Facts and Try Again: Improving Large Language Models with External Knowledge and Automated Feedback [127.75419038610455]
大規模言語モデル(LLM)は、ダウンストリームタスクの多くに対して、人間のような、流動的な応答を生成することができる。本稿では,プラグ・アンド・プレイモジュールのセットでブラックボックスのLSMを増強するLSM-Augmenterシステムを提案する。
論文参考訳（メタデータ） (2023-02-24T18:48:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。