論文の概要: Intelligent System for Automated Molecular Patent Infringement Assessment
- arxiv url: http://arxiv.org/abs/2412.07819v1
- Date: Tue, 10 Dec 2024 12:14:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 23:20:26.429501
- Title: Intelligent System for Automated Molecular Patent Infringement Assessment
- Title(参考訳): 自動分子特許侵害評価のためのインテリジェントシステム
- Authors: Yaorui Shi, Sihang Li, Taiyan Zhang, Xi Fang, Jiankun Wang, Zhiyuan Liu, Guojiang Zhao, Zhengdan Zhu, Zhifeng Gao, Renxin Zhong, Linfeng Zhang, Guolin Ke, Weinan E, Hengxing Cai, Xiang Wang,
- Abstract要約: PatentFinderは、新しく設計された分子が既存の特許を侵害するかどうかを評価する新しいツール強化フレームワークである。
サブタスクの分解に適したモデルベースのツールとモデルベースのツールが組み込まれている。
PatentFinderは、大規模な言語モデルのみに依存するベースラインアプローチよりも優れています。
- 参考スコア(独自算出の注目度): 38.48937966447085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated drug discovery offers significant potential for accelerating the development of novel therapeutics by substituting labor-intensive human workflows with machine-driven processes. However, a critical bottleneck persists in the inability of current automated frameworks to assess whether newly designed molecules infringe upon existing patents, posing significant legal and financial risks. We introduce PatentFinder, a novel tool-enhanced and multi-agent framework that accurately and comprehensively evaluates small molecules for patent infringement. It incorporates both heuristic and model-based tools tailored for decomposed subtasks, featuring: MarkushParser, which is capable of optical chemical structure recognition of molecular and Markush structures, and MarkushMatcher, which enhances large language models' ability to extract substituent groups from molecules accurately. On our benchmark dataset MolPatent-240, PatentFinder outperforms baseline approaches that rely solely on large language models, demonstrating a 13.8\% increase in F1-score and a 12\% rise in accuracy. Experimental results demonstrate that PatentFinder mitigates label bias to produce balanced predictions and autonomously generates detailed, interpretable patent infringement reports. This work not only addresses a pivotal challenge in automated drug discovery but also demonstrates the potential of decomposing complex scientific tasks into manageable subtasks for specialized, tool-augmented agents.
- Abstract(参考訳): 自動化された薬物発見は、労働集約的な人間のワークフローを機械駆動のプロセスに置き換えることで、新しい治療法の開発を加速する大きな可能性を秘めている。
しかし、重要なボトルネックは、新しい設計された分子が既存の特許を侵害するかどうかを評価するための現在の自動化されたフレームワークが存在しないことであり、重大な法的および財政的なリスクが生じる。
本稿では,特許侵害のための小分子を正確にかつ包括的に評価する新しいツール強化マルチエージェントフレームワークであるPatentFinderを紹介する。
分子とマルコシュ構造の光学化学構造認識が可能なMarkushParserと、分子から置換基を正確に抽出する大規模言語モデルの能力を高めるMarkushMatcherが特徴である。
ベンチマークデータセットのMolPatent-240では、大規模な言語モデルのみに依存するベースラインアプローチのパフォーマンスが向上し、F1スコアの13.8倍、精度の12.%が向上した。
実験結果から,PatentFinderはラベルバイアスを緩和し,バランスの取れた予測を生成し,詳細な解釈可能な特許侵害報告を自律的に生成することを示した。
この研究は、自動薬物発見における重要な課題に対処するだけでなく、複雑な科学的タスクを専門のツール強化されたエージェントのための管理可能なサブタスクに分解する可能性も示している。
関連論文リスト
- AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - Towards Automated Patent Workflows: AI-Orchestrated Multi-Agent Framework for Intellectual Property Management and Analysis [0.0]
PatExpertは、特許関連のタスクを合理化し最適化するために設計された、自律的なマルチエージェント会話フレームワークである。
このフレームワークは、さまざまな特許関連のタスクに対してタスク固有の専門家エージェントをコーディネートするメタエージェントと、エラーハンドリングとフィードバックプロビジョニングのための批判エージェントで構成されている。
論文 参考訳(メタデータ) (2024-09-21T13:44:34Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - ClaimCompare: A Data Pipeline for Evaluation of Novelty Destroying Patent Pairs [2.60235825984014]
我々は、IRおよびMLモデルのトレーニングに適したラベル付き特許請求データセットを生成するように設計された、新しいデータパイプラインであるCrimCompareを紹介する。
私たちの知る限りでは、ClaymCompareは、特許データセットを破壊する新規性を複数生成できる最初のパイプラインです。
論文 参考訳(メタデータ) (2024-07-16T21:38:45Z) - Automated Neural Patent Landscaping in the Small Data Regime [6.284464997330885]
近年の特許活動の急速な拡大により、効率的かつ効果的な自動的特許造成アプローチの必要性が高まっている。
本稿では, 難解な事例に対して, 性能を著しく向上させる, 自動型ニューラルネットワーク特許造園システムを提案する。
論文 参考訳(メタデータ) (2024-07-10T19:13:37Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - A Comprehensive Survey on AI-based Methods for Patents [14.090575139188422]
AIベースのツールは、特許サイクルにおける重要なタスクを合理化し、強化する機会を提供する。
この学際的な調査は、AIと特許分析の交差点で働く研究者や実践者のリソースとして機能することを目的としている。
論文 参考訳(メタデータ) (2024-04-02T20:44:06Z) - Unveiling Black-boxes: Explainable Deep Learning Models for Patent
Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法
レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。
関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文 参考訳(メタデータ) (2023-10-31T14:11:37Z) - Automated patent extraction powers generative modeling in focused
chemical spaces [0.0]
深い生成モデルが逆分子設計のエキサイティングな道として登場した。
材料科学と化学への適用性における重要な課題の1つは、プロパティラベル付きでスケール可能なトレーニングデータセットにアクセスできないことである。
我々は、特許のデジタルファイルから、人間の介入を最小限に抑えた新しい候補を生み出すための自動パイプラインを開発する。
論文 参考訳(メタデータ) (2023-03-14T23:26:55Z) - AutoPrognosis 2.0: Democratizing Diagnostic and Prognostic Modeling in
Healthcare with Automated Machine Learning [72.2614468437919]
本稿では,診断・予後モデルを開発するための機械学習フレームワークAutoPrognosis 2.0を提案する。
我々は,英国バイオバンクを用いた糖尿病の予後リスクスコアを構築するための図解的アプリケーションを提供する。
我々のリスクスコアはWebベースの意思決定支援ツールとして実装されており、世界中の患者や臨床医がアクセスできる。
論文 参考訳(メタデータ) (2022-10-21T16:31:46Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z) - The Synthesizability of Molecules Proposed by Generative Models [3.032184156362992]
機能性分子の発見は高価で時間を要するプロセスである。
初期の薬物発見への関心が高まる技術のひとつに、デ・ノボの分子生成と最適化がある。
これらの手法は、多目的関数の最大化を目的とした新しい分子構造を示唆することができる。
しかし、これらのアプローチの実用性は、合成可能性の無知によって汚される。
論文 参考訳(メタデータ) (2020-02-17T15:41:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。