論文の概要: Adaptive Multi-Stage Patent Claim Generation with Unified Quality Assessment
- arxiv url: http://arxiv.org/abs/2601.09120v1
- Date: Wed, 14 Jan 2026 03:44:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.251203
- Title: Adaptive Multi-Stage Patent Claim Generation with Unified Quality Assessment
- Title(参考訳): 統一品質評価による適応型多段階特許クレーム生成
- Authors: Chen-Wei Liang, Bin Guo, Zhen-Yuan Wei, Mu-Jiang-Shan Wang,
- Abstract要約: 現在の特許クレーム生成システムは、3つの基本的な制限に直面している。
本稿では,関係認識類似性分析,ドメイン適応クレーム生成,統一品質評価を通じて,これらの課題に対処する新しい3段階フレームワークを提案する。
本手法は, ベースラインが89.4%, ベースラインが76.2%であり, 自動的特許訴訟に対する包括的解決法が確立されている。
- 参考スコア(独自算出の注目度): 4.173681299587575
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current patent claim generation systems face three fundamental limitations: poor cross-jurisdictional generalization, inadequate semantic relationship modeling between claims and prior art, and unreliable quality assessment. We introduce a novel three-stage framework that addresses these challenges through relationship-aware similarity analysis, domain-adaptive claim generation, and unified quality assessment. Our approach employs multi-head attention with eight specialized heads for explicit relationship modeling, integrates curriculum learning with dynamic LoRA adapter selection across five patent domains, and implements cross-attention mechanisms between evaluation aspects for comprehensive quality assessment. Extensive experiments on USPTO HUPD dataset, EPO patent collections, and Patent-CE benchmark demonstrate substantial improvements: 7.6-point ROUGE-L gain over GPT-4o, 8.3\% BERTScore enhancement over Llama-3.1-8B, and 0.847 correlation with human experts compared to 0.623 for separate evaluation models. Our method maintains 89.4\% cross-jurisdictional performance retention versus 76.2\% for baselines, establishing a comprehensive solution for automated patent prosecution workflows.
- Abstract(参考訳): 現在の特許クレーム生成システムは、3つの基本的な制限に直面している。
本稿では,関係認識類似性分析,ドメイン適応クレーム生成,統一品質評価を通じて,これらの課題に対処する新しい3段階フレームワークを提案する。
提案手法では,5つの特許ドメインにまたがる動的LoRAアダプタ選択とカリキュラム学習を統合し,総合的な品質評価のための評価面間の相互注意機構を実装した。
USPTO HUPDデータセット、EPO特許コレクション、特許-CEベンチマークに関する大規模な実験では、GPT-4oよりも7.6ポイントのROUGE-L、Llama-3.1-8Bよりも8.3\%のBERTScore、別々の評価モデルでは0.623に比べて0.847の相関性がある。
本手法は, 品質保持率を89.4\%, ベースラインの76.2\%に維持し, 自動的特許訴追ワークフローの包括的ソリューションを確立した。
関連論文リスト
- A DeepSeek-Powered AI System for Automated Chest Radiograph Interpretation in Clinical Practice [83.11942224668127]
Janus-Pro-CXR (1B) はDeepSeek Janus-Proモデルに基づく胸部X線解釈システムである。
本システムは, 自動レポート生成において, 最先端のX線レポート生成モデルより優れる。
論文 参考訳(メタデータ) (2025-12-23T13:26:13Z) - RecGPT-V2 Technical Report [41.57739441038769]
大規模言語モデル(LLM)は、暗黙の行動パターンマッチングから明示的な意図推論へ、レコメンデータシステムを変換する大きな可能性を示している。
提案するRecGPT-V2には,暗黙的な行動パターンマッチングから明示的な意図推論へ,レコメンデータシステムを変換する4つの重要なイノベーションがある。
タオバオのオンラインA/Bテストでは、+2.98% CTR、+3.71% IPV、+2.19% TV、+11.46% NERが大幅に改善された。
論文 参考訳(メタデータ) (2025-12-16T15:40:44Z) - Catching UX Flaws in Code: Leveraging LLMs to Identify Usability Flaws at the Development Stage [0.0]
本稿では,大規模言語モデル (LLM) が開発段階において信頼性と一貫した評価を提供できるかどうかを検討する。
OpenAIのGPT-4oのパイプラインを用いて,サイトごとの3つの独立した評価で850以上の評価を作成した。
問題検出では、平均的なコーエンのカッパは0.50で、正確な一致は84%であった。
論文 参考訳(メタデータ) (2025-12-03T21:02:54Z) - RADAR: A Risk-Aware Dynamic Multi-Agent Framework for LLM Safety Evaluation via Role-Specialized Collaboration [81.38705556267917]
大規模言語モデル(LLM)の既存の安全性評価手法は、固有の制約に悩まされている。
リスク概念空間を再構築する理論的枠組みを導入する。
マルチエージェント協調評価フレームワークRADARを提案する。
論文 参考訳(メタデータ) (2025-09-28T09:35:32Z) - MAGneT: Coordinated Multi-Agent Generation of Synthetic Multi-Turn Mental Health Counseling Sessions [58.61680631581921]
合成心理カウンセリングセッション生成のための新しいマルチエージェントフレームワークであるMAGneTを紹介する。
従来の単エージェントアプローチとは異なり、MAGneTは実際のカウンセリングの構造とニュアンスをよりよく捉えている。
実験の結果,MAGneTは既存のカウンセリングセッションの質,多様性,治療的アライメントにおいて有意に優れていた。
論文 参考訳(メタデータ) (2025-09-04T12:59:24Z) - A Confidence-Diversity Framework for Calibrating AI Judgement in Accessible Qualitative Coding Tasks [0.0]
信頼性の多様性の校正は、アクセス可能なコーディングタスクの品質評価フレームワークである。
8つの最先端のLCMから5,680のコーディング決定を分析すると、自信はモデル間の合意を密接に追跡する。
論文 参考訳(メタデータ) (2025-08-04T03:47:10Z) - DinoCompanion: An Attachment-Theory Informed Multimodal Robot for Emotionally Responsive Child-AI Interaction [20.544543785877444]
DinoCompanionは、感情に反応する児童とAIのインタラクションのための、アタッチメント理論に基づく最初のマルチモーダルロボットである。
発達的にインフォームドされたAIアーキテクチャの欠如、安全性とエンゲージメントのバランスの必要性、アタッチメントベースの機能のための標準化された評価フレームワークの欠如、という3つの重要な課題に対処する。
DinoCompanionは最先端のパフォーマンス(57.15%)、GPT-4o(50.29%)、Claude-3.7-Sonnet(53.43%)を上回っている
論文 参考訳(メタデータ) (2025-06-14T12:54:07Z) - Adversarial Preference Learning for Robust LLM Alignment [24.217309343426297]
逆選択学習(英: Adversarial Preference Learning, APL)は、3つの重要な革新を取り入れた反復的逆選択学習法である。
第一に、モデル固有の嗜好確率に基づく直接的な有害度指標。
第二に、入力固有の逆数変化を合成する条件生成攻撃者。
論文 参考訳(メタデータ) (2025-05-30T09:02:07Z) - J4R: Learning to Judge with Equivalent Initial State Group Relative Policy Optimization [69.23273504123941]
私たちは、より複雑な評価設定で生じる位置バイアスに対して堅牢であるように、裁判官を訓練します。
我々はReasoningJudgeBenchというベンチマークを紹介します。
EIS-GRPOで訓練を受けた7B判事であるReasoning判事(J4R)は、GPT-4oを6.7%、そして9%で上回ります。
論文 参考訳(メタデータ) (2025-05-19T16:50:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。