Fugu-MT 論文翻訳(概要): Technical Progress Analysis Using a Dynamic Topic Model for Technical Terms to Revise Patent Classification Codes

論文の概要: Technical Progress Analysis Using a Dynamic Topic Model for Technical Terms to Revise Patent Classification Codes

arxiv url: http://arxiv.org/abs/2012.10120v1
Date: Fri, 18 Dec 2020 09:24:01 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-01 18:18:41.939184
Title: Technical Progress Analysis Using a Dynamic Topic Model for Technical Terms to Revise Patent Classification Codes
Title（参考訳）: 動的トピックモデルを用いた特許分類法改正のための技術用語の技術進歩分析
Authors: Mana Iwata, Yoshiro Matsuda, Yoshimasa Utsumi, Yoshitoshi Tanaka, Kazuhide Nakata
Abstract要約: 日本の特許には、日本独自の特許分類コードFI(File Index)が割り当てられています。 2006年以来、リビジョンはすでに30,000以上の新しいFIを確立しています。機械学習を用いて特許分類コードの改訂を支援することで、精度と効率が向上する。
参考スコア（独自算出の注目度）: 0.41998444721319217
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Japanese patents are assigned a patent classification code, FI (File Index), that is unique to Japan. FI is a subdivision of the IPC, an international patent classification code, that is related to Japanese technology. FIs are revised to keep up with technological developments. These revisions have already established more than 30,000 new FIs since 2006. However, these revisions require a lot of time and workload. Moreover, these revisions are not automated and are thus inefficient. Therefore, using machine learning to assist in the revision of patent classification codes (FI) will lead to improved accuracy and efficiency. This study analyzes patent documents from this new perspective of assisting in the revision of patent classification codes with machine learning. To analyze time-series changes in patents, we used the dynamic topic model (DTM), which is an extension of the latent Dirichlet allocation (LDA). Also, unlike English, the Japanese language requires morphological analysis. Patents contain many technical words that are not used in everyday life, so morphological analysis using a common dictionary is not sufficient. Therefore, we used a technique for extracting technical terms from text. After extracting technical terms, we applied them to DTM. In this study, we determined the technological progress of the lighting class F21 for 14 years and compared it with the actual revision of patent classification codes. In other words, we extracted technical terms from Japanese patents and applied DTM to determine the progress of Japanese technology. Then, we analyzed the results from the new perspective of revising patent classification codes with machine learning. As a result, it was found that those whose topics were on the rise were judged to be new technologies.
Abstract（参考訳）: 日本の特許には、日本独自の特許分類コードFI(File Index)が割り当てられている。 fiは、日本の技術に関連する国際特許分類コード(ipc)のサブディビジョンである。 FIは技術開発に合わせて改訂される。これらの改訂は2006年以来すでに30,000以上の新しいfisを確立している。しかしながら、これらのリビジョンには多くの時間と作業負荷が必要です。さらに、これらのリビジョンは自動化されておらず、非効率である。したがって、機械学習を用いて特許分類コード(FI)の改訂を支援することにより、精度と効率が向上する。本研究は,機械学習による特許分類コードの改訂を支援する新たな視点から,特許文書の分析を行う。特許の時系列変化を分析するために,潜在ディリクレ割り当て(LDA)の拡張である動的トピックモデル(DTM)を用いた。また、英語とは異なり、日本語は形態素解析を必要とする。特許には日常生活で使われない多くの技術用語が含まれているため、共通辞書を用いた形態解析は不十分である。そこで,テキストから専門用語を抽出する手法を用いた。技術的用語を抽出した後,DTMに応用した。本研究では,14年間の照明クラスF21の技術的進歩を,特許分類コードの実際の改訂と比較した。言い換えれば、日本の特許から技術用語を抽出し、日本の技術の進歩を判断するためにDTMを適用した。そこで我々は,機械学習による特許分類コードの変更という新たな視点から,その結果を分析した。その結果,話題が高まりつつあるものが新技術であると判断された。

関連論文リスト

NeuCLIRTech: Chinese Monolingual and Cross-Language Information Retrieval Evaluation in a Challenging Domain [49.3943974580576]
本稿では,技術情報に対するクロスランゲージ検索のための評価収集であるNeuCLIRTechについて述べる。このコレクションは中国語で書かれた技術文書と、その機械が英語に翻訳されたもので構成されている。このコレクションは中国語での単言語検索と、クエリ言語としての英語による言語横断検索という2つの検索シナリオをサポートしている。
論文参考訳（メタデータ） (2026-02-05T05:57:55Z)
Towards Automated Quality Assurance of Patent Specifications: A Multi-Dimensional LLM Framework [0.5534764384104999]
AI草案作成ツールは特許作成において注目されているが、AIが生成する特許内容の品質の体系的評価は、重要な研究ギャップを示している。本稿では,規制コンプライアンス,技術的コヒーレンス,図形参照整合性検出モジュールを用いた特許評価を提案する。このフレームワークは、2つの特許草案作成ツールから80人の人間が認可し、80人のAIが生成する特許からなる包括的なデータセットで検証されている。
論文参考訳（メタデータ） (2025-10-29T11:20:18Z)
PANORAMA: A Dataset and Benchmarks Capturing Decision Trails and Rationales in Patent Examination [44.74519851862391]
PANORAMAは米国特許試験記録8,143件のデータセットである。我々は,特許専門家の特許審査プロセスをエミュレートする逐次ベンチマークにパスを分解する。我々は、LLMを含むNLPを特許領域で前進させるには、現実世界の特許審査をより深く理解する必要があると論じる。
論文参考訳（メタデータ） (2025-10-25T03:24:13Z)
The \textit{Questio de aqua et terra}: A Computational Authorship Verification Study [49.56191463229252]
本研究は, クエシオの真正性について, 数値的オーサシップ検証(AV)を用いて検討する。 AVシステムのファミリーを構築し、13世紀と14世紀のラテン文字のコーパスを組み立てます。 AVシステムのクエチオへの応用は、その真正性に関する非常に確実な予測を返す。
論文参考訳（メタデータ） (2025-01-07T18:42:05Z)
PatentEdits: Framing Patent Novelty as Textual Entailment [62.8514393375952]
このデータセットには105万例の修正が成功している。我々は、文章を文単位でラベル付けするアルゴリズムを設計し、これらの編集がいかに大きな言語モデルで予測できるかを確立する。引用引用文と起草文の文的含意を評価することは,どの発明的主張が変化しないか,あるいは先行技術に関して新規かを予測するのに特に有効であることを示す。
論文参考訳（メタデータ） (2024-11-20T17:23:40Z)
PaECTER: Patent-level Representation Learning using Citation-informed Transformers [0.1957338076370071]
PaECTERは、特許に特有のオープンソースドキュメントレベルのエンコーダである。我々は,特許文書の数値表現を生成するために,受験者による引用情報付き特許用BERTを微調整する。 PaECTERは、特許ドメインで使用されている現在の最先端モデルよりも類似性タスクが優れている。
論文参考訳（メタデータ） (2024-02-29T18:09:03Z)
HuatuoGPT-II, One-stage Training for Medical Adaption of LLMs [61.41790586411816]
HuatuoGPT-IIは、いくつかのベンチマークで、中国の医学領域における最先端のパフォーマンスを示している。さらに、ChatGPTやGPT-4といったプロプライエタリなモデルよりも、特に中国伝統医学において優れています。
論文参考訳（メタデータ） (2023-11-16T10:56:24Z)
Unveiling Black-boxes: Explainable Deep Learning Models for Patent Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文参考訳（メタデータ） (2023-10-31T14:11:37Z)
PaperCard for Reporting Machine Assistance in Academic Writing [48.33722012818687]
2022年11月にOpenAIが発表した質問応答システムChatGPTは,学術論文作成に活用可能な,さまざまな機能を実証した。これは学術における著者概念に関する批判的な疑問を提起する。我々は、人間の著者が記述プロセスにおけるAIの使用を透過的に宣言するための文書である"PaperCard"というフレームワークを提案する。
論文参考訳（メタデータ） (2023-10-07T14:28:04Z)
Adaptive Taxonomy Learning and Historical Patterns Modelling for Patent Classification [26.85734804493925]
本稿では,特許分類に関する特許に関する情報を包括的に検討する統合フレームワークを提案する。まず,その意味表現を導出するためのICC符号相関学習モジュールを提案する。最後に、IPC符号のセマンティクスを含む特許文書の文脈情報と、予測を行うために利用者のシーケンシャルな選好を割り当てる。
論文参考訳（メタデータ） (2023-08-10T07:02:24Z)
A Survey on Zero Pronoun Translation [69.09774294082965]
ゼロ代名詞(ZP)はプロドロップ言語では省略されることが多いが、非プロドロップ言語ではリコールされるべきである。本研究は, 神経革命後のゼロ代名詞翻訳(ZPT)における主要な研究について述べる。 1) ZPTは大規模言語モデルの発展傾向と一致している; 2) データの制限は言語やドメインの学習バイアスを引き起こす; 3) 性能改善は単一のベンチマークで報告されることが多いが、高度な手法はまだ実世界の利用には程遠い。
論文参考訳（メタデータ） (2023-05-17T13:19:01Z)
A Novel Patent Similarity Measurement Methodology: Semantic Distance and Technological Distance [0.0]
特許類似性分析は、特許侵害のリスクを評価する上で重要な役割を果たす。自然言語処理技術の最近の進歩は、このプロセスを自動化するための有望な道を提供する。本稿では,特許間の類似性を考慮し,特許の意味的類似性を考慮し,特許間の類似度を測定するハイブリッド手法を提案する。
論文参考訳（メタデータ） (2023-03-23T07:55:31Z)
The Harvard USPTO Patent Dataset: A Large-Scale, Well-Structured, and Multi-Purpose Corpus of Patent Applications [8.110699646062384]
ハーバードUSPTO特許データセット(HUPD)について紹介する。 450万件以上の特許文書があり、HUPDは同等のコーパスの2倍から3倍の大きさだ。各アプリケーションのメタデータとすべてのテキストフィールドを提供することで、このデータセットは研究者が新しいNLPタスクセットを実行することを可能にする。
論文参考訳（メタデータ） (2022-07-08T17:57:15Z)
Automated Single-Label Patent Classification using Ensemble Classifiers [0.0]
特許文書の異なる部分で訓練されたアンサンブル分類器の革新的な方法を提案する。我々の知る限りでは、特許分類問題に対してアンサンブル法が提案されたのはこれが初めてである。
論文参考訳（メタデータ） (2022-03-03T08:47:15Z)
Patent Sentiment Analysis to Highlight Patent Paragraphs [0.0]
特許文書が与えられた場合、異なるセマンティックアノテーションを識別することは興味深い研究の側面である。手動の特許分析の過程で、より読みやすくするために、段落をマークして意味情報を認識することが実際である。この作業は、セマンティック情報を自動的に強調する特許実践者を支援し、機械学習の適性を利用して持続的で効率的な特許分析を作成するのに役立つ。
論文参考訳（メタデータ） (2021-11-06T13:28:29Z)
White Paper Machine Learning in Certified Systems [70.24215483154184]
DEEL Project set-up the ML Certification 3 Workgroup (WG) set-up by the Institut de Recherche Technologique Saint Exup'ery de Toulouse (IRT)
論文参考訳（メタデータ） (2021-03-18T21:14:30Z)
A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文参考訳（メタデータ） (2020-09-25T12:01:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。