論文の概要: PatRe: A Full-Stage Office Action and Rebuttal Generation Benchmark for Patent Examination
- arxiv url: http://arxiv.org/abs/2605.03571v1
- Date: Tue, 05 May 2026 09:42:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.878382
- Title: PatRe: A Full-Stage Office Action and Rebuttal Generation Benchmark for Patent Examination
- Title(参考訳): PatRe: 特許審査のためのフルステップのオフィスアクションとRebuttal Generationベンチマーク
- Authors: Qiyao Wang, Xinyi Chen, Longze Chen, Hongbo Wang, Hamid Alinejad-Rokny, Yuan Lin, Min Yang,
- Abstract要約: PatReは、完全な特許審査ライフサイクルをモデル化する最初のベンチマークである。
我々のベンチマークでは、特許審査を正当化と応答の動的なマルチターンプロセスとして再設定しています。
- 参考スコア(独自算出の注目度): 22.330452135284414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Patent examination is a complex, multi-stage process requiring both technical expertise and legal reasoning, increasingly challenged by rising application volumes. Prior benchmarks predominantly view patent examination as discriminative classification or static extraction, failing to capture its inherently interactive and iterative nature, similar to the peer review and rebuttal process in academic publishing. In this paper, we introduce PatRe, the first benchmark that models the full patent examination lifecycle, including Office Action generation and applicant rebuttal. PatRe comprises 480 real-world cases and supports both oracle and retrieval-simulated evaluation settings. Our benchmark reframes patent examination as a dynamic, multi-turn process of justification and response. Extensive experiments across various LLMs reveal critical insights into model performance, including differences between proprietary and open-source models, as well as task asymmetries between examiner analysis and applicant-side rebuttal. These findings highlight both the potential and current limitations of LLMs in modeling complex, real-world legal reasoning and technical novelty judgment in patent examination. We release our code and dataset to facilitate future research on patent examination modeling.
- Abstract(参考訳): 特許審査は複雑な多段階的なプロセスであり、技術的専門知識と法的推論の両方を必要とする。
以前のベンチマークでは、特許審査を差別的分類または静的抽出と見なしており、学術出版におけるピアレビューや反論のプロセスと同様、本質的にインタラクティブで反復的な性質を捉えていない。
本稿では,特許審査のライフサイクルをモデル化する最初のベンチマークであるPatReを紹介する。
PatReは480の現実世界のケースで構成され、オラクルと検索シミュレートされた評価設定の両方をサポートする。
我々のベンチマークでは、特許審査を正当化と応答の動的なマルチターンプロセスとして再設定しています。
様々なLLMにわたる広範囲な実験は、プロプライエタリモデルとオープンソースモデルの違いを含むモデル性能に関する重要な洞察を明らかにし、また、試験者分析と受験者側の反論の間のタスク対称性を明らかにしている。
これらの知見は, 複合的, 現実的法的推論におけるLCMの可能性と現状の限界, および特許審査における技術的新規性判定の両面を浮き彫りにした。
我々は,特許審査モデリングの今後の研究を促進するために,コードとデータセットをリリースする。
関連論文リスト
- PANORAMA: A Dataset and Benchmarks Capturing Decision Trails and Rationales in Patent Examination [44.74519851862391]
PANORAMAは米国特許試験記録8,143件のデータセットである。
我々は,特許専門家の特許審査プロセスをエミュレートする逐次ベンチマークにパスを分解する。
我々は、LLMを含むNLPを特許領域で前進させるには、現実世界の特許審査をより深く理解する必要があると論じる。
論文 参考訳(メタデータ) (2025-10-25T03:24:13Z) - SoK: Large Language Model Copyright Auditing via Fingerprinting [69.14570598973195]
既存の手法をホワイトボックスとブラックボックスのアプローチに分類する統一的な枠組みと形式的な分類法を導入する。
現実的な展開シナリオ下でのLDMフィンガープリント評価のための最初の体系的ベンチマークであるLeaFBenchを提案する。
論文 参考訳(メタデータ) (2025-08-27T12:56:57Z) - Part I: Tricks or Traps? A Deep Dive into RL for LLM Reasoning [53.85659415230589]
本稿では,広く採用されている強化学習手法を体系的にレビューする。
特定の設定に合わせてRLテクニックを選択するための明確なガイドラインを示す。
また、2つのテクニックを最小限に組み合わせることで、批判のないポリシーの学習能力を解き放つことも明らかにした。
論文 参考訳(メタデータ) (2025-08-11T17:39:45Z) - PatentMind: A Multi-Aspect Reasoning Graph for Patent Similarity Evaluation [35.13558856456741]
特許類似性評価は知的財産分析において重要な役割を果たす。
マルチアスペクト推論グラフ(MARG)に基づく特許類似性評価のための新しいフレームワークであるPatentMindを紹介する。
私たちのフレームワークは、現実世界の意思決定のための構造化され、セマンティックな基盤を提供します。
論文 参考訳(メタデータ) (2025-05-25T22:28:27Z) - Towards Better Evaluation for Generated Patent Claims [0.0]
我々は特許請求を評価するための最初の総合的なベンチマークであるPatent-CEを紹介する。
また,特許請求に特化して設計された多次元評価手法であるPatClaimEvalを提案する。
本研究は,自動特許クレーム生成システムのより正確な評価の基礎となる。
論文 参考訳(メタデータ) (2025-05-16T10:27:16Z) - Composed Multi-modal Retrieval: A Survey of Approaches and Applications [81.54640206021757]
複合マルチモーダル検索(CMR)は次世代技術として誕生する。
CMRは、参照視覚入力とテキスト修正を統合することで、画像やビデオをクエリすることを可能にする。
本稿では,CMRの基礎的課題,技術的進歩,応用について概説する。
論文 参考訳(メタデータ) (2025-03-03T09:18:43Z) - Can AI Examine Novelty of Patents?: Novelty Evaluation Based on the Correspondence between Patent Claim and Prior Art [5.655276956391884]
本稿では,特許の新規性を評価するための大規模言語モデル(LLM)の能力を評価することで,新たな課題を提起する。
本研究は,特許試験事例から得られた新規性評価に特化して設計された最初のデータセットについて述べる。
本研究は, 分類モデルが新規性を効果的に評価するのに苦慮する一方で, 生成モデルは合理的な精度で予測を行うことを示した。
論文 参考訳(メタデータ) (2025-02-10T10:09:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。