論文の概要: Intelligent System for Automated Molecular Patent Infringement Assessment
- arxiv url: http://arxiv.org/abs/2412.07819v1
- Date: Tue, 10 Dec 2024 12:14:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 14:03:47.549147
- Title: Intelligent System for Automated Molecular Patent Infringement Assessment
- Title(参考訳): 自動分子特許侵害評価のためのインテリジェントシステム
- Authors: Yaorui Shi, Sihang Li, Taiyan Zhang, Xi Fang, Jiankun Wang, Zhiyuan Liu, Guojiang Zhao, Zhengdan Zhu, Zhifeng Gao, Renxin Zhong, Linfeng Zhang, Guolin Ke, Weinan E, Hengxing Cai, Xiang Wang,
- Abstract要約: PatentFinderは、新しく設計された分子が既存の特許を侵害するかどうかを評価する新しいツール強化フレームワークである。
サブタスクの分解に適したモデルベースのツールとモデルベースのツールが組み込まれている。
PatentFinderは、大規模な言語モデルのみに依存するベースラインアプローチよりも優れています。
- 参考スコア(独自算出の注目度): 38.48937966447085
- License:
- Abstract: Automated drug discovery offers significant potential for accelerating the development of novel therapeutics by substituting labor-intensive human workflows with machine-driven processes. However, a critical bottleneck persists in the inability of current automated frameworks to assess whether newly designed molecules infringe upon existing patents, posing significant legal and financial risks. We introduce PatentFinder, a novel tool-enhanced and multi-agent framework that accurately and comprehensively evaluates small molecules for patent infringement. It incorporates both heuristic and model-based tools tailored for decomposed subtasks, featuring: MarkushParser, which is capable of optical chemical structure recognition of molecular and Markush structures, and MarkushMatcher, which enhances large language models' ability to extract substituent groups from molecules accurately. On our benchmark dataset MolPatent-240, PatentFinder outperforms baseline approaches that rely solely on large language models, demonstrating a 13.8\% increase in F1-score and a 12\% rise in accuracy. Experimental results demonstrate that PatentFinder mitigates label bias to produce balanced predictions and autonomously generates detailed, interpretable patent infringement reports. This work not only addresses a pivotal challenge in automated drug discovery but also demonstrates the potential of decomposing complex scientific tasks into manageable subtasks for specialized, tool-augmented agents.
- Abstract(参考訳): 自動化された薬物発見は、労働集約的な人間のワークフローを機械駆動のプロセスに置き換えることで、新しい治療法の開発を加速する大きな可能性を秘めている。
しかし、重要なボトルネックは、新しい設計された分子が既存の特許を侵害するかどうかを評価するための現在の自動化されたフレームワークが存在しないことであり、重大な法的および財政的なリスクが生じる。
本稿では,特許侵害のための小分子を正確にかつ包括的に評価する新しいツール強化マルチエージェントフレームワークであるPatentFinderを紹介する。
分子とマルコシュ構造の光学化学構造認識が可能なMarkushParserと、分子から置換基を正確に抽出する大規模言語モデルの能力を高めるMarkushMatcherが特徴である。
ベンチマークデータセットのMolPatent-240では、大規模な言語モデルのみに依存するベースラインアプローチのパフォーマンスが向上し、F1スコアの13.8倍、精度の12.%が向上した。
実験結果から,PatentFinderはラベルバイアスを緩和し,バランスの取れた予測を生成し,詳細な解釈可能な特許侵害報告を自律的に生成することを示した。
この研究は、自動薬物発見における重要な課題に対処するだけでなく、複雑な科学的タスクを専門のツール強化されたエージェントのための管理可能なサブタスクに分解する可能性も示している。
関連論文リスト
- AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - Towards Automated Patent Workflows: AI-Orchestrated Multi-Agent Framework for Intellectual Property Management and Analysis [0.0]
PatExpertは、特許関連のタスクを合理化し最適化するために設計された、自律的なマルチエージェント会話フレームワークである。
このフレームワークは、さまざまな特許関連のタスクに対してタスク固有の専門家エージェントをコーディネートするメタエージェントと、エラーハンドリングとフィードバックプロビジョニングのための批判エージェントで構成されている。
論文 参考訳(メタデータ) (2024-09-21T13:44:34Z) - BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction [65.93303145891628]
BatGPT-Chemは150億のパラメータを持つ大規模な言語モデルであり、再合成予測の強化に最適化されている。
我々のモデルは幅広い化学知識を捉え、反応条件の正確な予測を可能にする。
この開発により、化学者は新しい化合物を十分に扱うことができ、医薬品製造と材料科学の革新サイクルを早める可能性がある。
論文 参考訳(メタデータ) (2024-08-19T05:17:40Z) - ClaimCompare: A Data Pipeline for Evaluation of Novelty Destroying Patent Pairs [2.60235825984014]
我々は、IRおよびMLモデルのトレーニングに適したラベル付き特許請求データセットを生成するように設計された、新しいデータパイプラインであるCrimCompareを紹介する。
私たちの知る限りでは、ClaymCompareは、特許データセットを破壊する新規性を複数生成できる最初のパイプラインです。
論文 参考訳(メタデータ) (2024-07-16T21:38:45Z) - Automated Neural Patent Landscaping in the Small Data Regime [6.284464997330885]
近年の特許活動の急速な拡大により、効率的かつ効果的な自動的特許造成アプローチの必要性が高まっている。
本稿では, 難解な事例に対して, 性能を著しく向上させる, 自動型ニューラルネットワーク特許造園システムを提案する。
論文 参考訳(メタデータ) (2024-07-10T19:13:37Z) - A Comprehensive Survey on AI-based Methods for Patents [14.090575139188422]
AIベースのツールは、特許サイクルにおける重要なタスクを合理化し、強化する機会を提供する。
この学際的な調査は、AIと特許分析の交差点で働く研究者や実践者のリソースとして機能することを目的としている。
論文 参考訳(メタデータ) (2024-04-02T20:44:06Z) - Unveiling Black-boxes: Explainable Deep Learning Models for Patent
Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法
レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。
関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文 参考訳(メタデータ) (2023-10-31T14:11:37Z) - Automated patent extraction powers generative modeling in focused
chemical spaces [0.0]
深い生成モデルが逆分子設計のエキサイティングな道として登場した。
材料科学と化学への適用性における重要な課題の1つは、プロパティラベル付きでスケール可能なトレーニングデータセットにアクセスできないことである。
我々は、特許のデジタルファイルから、人間の介入を最小限に抑えた新しい候補を生み出すための自動パイプラインを開発する。
論文 参考訳(メタデータ) (2023-03-14T23:26:55Z) - AutoPrognosis 2.0: Democratizing Diagnostic and Prognostic Modeling in
Healthcare with Automated Machine Learning [72.2614468437919]
本稿では,診断・予後モデルを開発するための機械学習フレームワークAutoPrognosis 2.0を提案する。
我々は,英国バイオバンクを用いた糖尿病の予後リスクスコアを構築するための図解的アプリケーションを提供する。
我々のリスクスコアはWebベースの意思決定支援ツールとして実装されており、世界中の患者や臨床医がアクセスできる。
論文 参考訳(メタデータ) (2022-10-21T16:31:46Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。