Fugu-MT 論文翻訳(概要): When Molecular GAN Meets Byte-Pair Encoding

論文の概要: When Molecular GAN Meets Byte-Pair Encoding

arxiv url: http://arxiv.org/abs/2409.19740v1
Date: Sun, 29 Sep 2024 15:39:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-05 21:19:41.229513
Title: When Molecular GAN Meets Byte-Pair Encoding
Title（参考訳）: Molecular GANがByte-Pairエンコーディングに出会ったとき
Authors: Huidong Tang, Chen Li, Yasuhiko Morimoto,
Abstract要約: 本研究は, バイトレベルのバイトペアエンコーディングトークンを組み込んだ分子GANを導入し, デノボ分子生成の強化に強化学習を用いた。具体的には、ジェネレータはアクターとして機能し、SMILES文字列を生成し、識別器は批評家として機能し、その品質を評価する。
参考スコア（独自算出の注目度）: 2.5398391570038736
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Deep generative models, such as generative adversarial networks (GANs), are pivotal in discovering novel drug-like candidates via de novo molecular generation. However, traditional character-wise tokenizers often struggle with identifying novel and complex sub-structures in molecular data. In contrast, alternative tokenization methods have demonstrated superior performance. This study introduces a molecular GAN that integrates a byte level byte-pair encoding tokenizer and employs reinforcement learning to enhance de novo molecular generation. Specifically, the generator functions as an actor, producing SMILES strings, while the discriminator acts as a critic, evaluating their quality. Our molecular GAN also integrates innovative reward mechanisms aimed at improving computational efficiency. Experimental results assessing validity, uniqueness, novelty, and diversity, complemented by detailed visualization analysis, robustly demonstrate the effectiveness of our GAN.
Abstract（参考訳）: GAN(Generative Adversarial Network)のような深層生成モデルは、デノボ分子生成による新規な薬物様候補の発見において重要な役割を担っている。しかし、伝統的なキャラクタリゼーションは、分子データの新規で複雑なサブ構造を特定するのにしばしば苦労する。対照的に、代替トークン化法は優れた性能を示している。本研究は, バイトレベルのバイトペアエンコーディングトークンを組み込んだ分子GANを導入し, デノボ分子生成の強化に強化学習を用いた。具体的には、ジェネレータはアクターとして機能し、SMILES文字列を生成し、識別器は批評家として機能し、その品質を評価する。我々の分子GANは、計算効率の向上を目的とした革新的な報酬機構も統合している。詳細な可視化分析によって補完された妥当性,独特性,新奇性,多様性を評価し,GANの有効性を強く実証した。

関連論文リスト

$\ ext{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-08-12T05:46:47Z)
Molecular Machine Learning Using Euler Characteristic Transforms [12.108680020079925]
分子の形状は、その物理化学的および生物学的性質を決定する。幾何学的トポロジカル記述子としてEuler Characteristics Transform (ECT)を提案する。 ECTは、マルチスケールの構造的特徴の抽出を可能にし、特徴空間における分子形状を表現およびエンコードする新しい方法を提供する。
論文参考訳（メタデータ） (2025-07-04T10:57:40Z)
Improved Molecular Generation through Attribute-Driven Integrative Embeddings and GAN Selectivity [0.0]
本稿では,変圧器を用いたベクトル埋め込みジェネレータとGAN(Generative Adrialversa Network)を併用して,所望の特性を持つ分子を生成する手法を提案する。埋め込みジェネレータは、モーガンの指紋とグローバルな分子特性を統合する新しい分子記述子を利用する。この手法は、ラベル付き臭気成分と非臭気化合物のデータセットを用いて、新規な臭気分子を生成することによって検証される。
論文参考訳（メタデータ） (2025-04-26T22:15:25Z)
A Reinforcement Learning-Driven Transformer GAN for Molecular Generation [6.397243531623856]
本研究では,これらの課題に対処するために,トランスフォーマーをベースとした新しい離散GANフレームワークであるRL-MolGANを紹介する。従来のTransformerとは異なり、RL-MolGANは最初のデコーダ-then-encoder構造を利用して、$denovo$と足場ベースの設計の両方から薬物のような分子を生成する。さらに、RL-MolGANは強化学習(RL)とモンテカルロ木探索(MCTS)技術を統合し、GANトレーニングの安定性を高め、生成分子の化学的性質を最適化する。
論文参考訳（メタデータ） (2025-03-17T04:06:10Z)
DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文参考訳（メタデータ） (2025-02-13T18:29:48Z)
FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。 FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。 MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (2024-10-02T23:04:58Z)
Crossing New Frontiers: Knowledge-Augmented Large Language Model Prompting for Zero-Shot Text-Based De Novo Molecule Design [0.0]
本研究は,ゼロショットテキスト条件デノボ分子生成タスクにおいて,大規模言語モデル(LLM)の知識増進プロンプトの利用について検討する。本フレームワークは,ベンチマークデータセット上でのSOTA(State-of-the-art)ベースラインモデルの有効性を実証する。
論文参考訳（メタデータ） (2024-08-18T11:37:19Z)
Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。 HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文参考訳（メタデータ） (2024-05-05T08:35:23Z)
Mol-AIR: Molecular Reinforcement Learning with Adaptive Intrinsic Rewards for Goal-directed Molecular Generation [0.0]
Mol-AIRは、ゴール指向分子生成のための適応型固有報酬を用いた強化学習ベースのフレームワークである。ベンチマークテストでは、Moll-AIRは所望の特性を持つ分子を生成する既存のアプローチよりも優れた性能を示す。
論文参考訳（メタデータ） (2024-03-29T10:44:51Z)
Molecular Generative Adversarial Network with Multi-Property Optimization [3.0001188337985236]
GAN(Generative Adversarial Network)のような深層生成モデルは、創薬におけるデノボ$分子生成に用いられている。本研究では,マルチプロパティ最適化によりトークンレベルで分子を生成するために,InstGANと呼ばれる即時かつグローバルな報酬を持つアクタ批判的RLに基づく新しいGANを提案する。
論文参考訳（メタデータ） (2024-03-29T08:55:39Z)
Multi-Modal Representation Learning for Molecular Property Prediction: Sequence, Graph, Geometry [6.049566024728809]
深層学習に基づく分子特性予測は、従来の手法の資源集約性に対する解決策として登場した。本稿では,分子特性予測のための新しいマルチモーダル表現学習モデルSGGRLを提案する。モダリティ間の整合性を確保するため、SGGRLは異なる分子の類似性を最小化しながら同じ分子の表現の類似性を最大化するように訓練される。
論文参考訳（メタデータ） (2024-01-07T02:18:00Z)
Towards Predicting Equilibrium Distributions for Molecular Systems with Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。 DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文参考訳（メタデータ） (2023-06-08T17:12:08Z)
MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。 MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文参考訳（メタデータ） (2022-12-20T19:32:30Z)
Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文参考訳（メタデータ） (2022-08-23T17:01:16Z)
Generative Enriched Sequential Learning (ESL) Approach for Molecular Design via Augmented Domain Knowledge [1.4410716345002657]
生成機械学習技術は、分子指紋表現に基づく新しい化学構造を生成することができる。教師付きドメイン知識の欠如は、学習手順がトレーニングデータに見られる一般的な分子に相対的に偏っていることを誤解させる可能性がある。この欠点は、例えば薬物類似度スコア(QED)の定量的推定など、ドメイン知識でトレーニングデータを増強することで軽減した。
論文参考訳（メタデータ） (2022-04-05T20:16:11Z)
Reinforced Molecular Optimization with Neighborhood-Controlled Grammars [63.84003497770347]
分子最適化のためのグラフ畳み込みポリシネットワークであるMNCE-RLを提案する。我々は、元の近傍制御された埋め込み文法を拡張して、分子グラフ生成に適用する。提案手法は, 分子最適化タスクの多種多様さにおいて, 最先端性能を実現する。
論文参考訳（メタデータ） (2020-11-14T05:42:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。