論文の概要: Technical Progress Analysis Using a Dynamic Topic Model for Technical
Terms to Revise Patent Classification Codes
- arxiv url: http://arxiv.org/abs/2012.10120v1
- Date: Fri, 18 Dec 2020 09:24:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-01 18:18:41.939184
- Title: Technical Progress Analysis Using a Dynamic Topic Model for Technical
Terms to Revise Patent Classification Codes
- Title(参考訳): 動的トピックモデルを用いた特許分類法改正のための技術用語の技術進歩分析
- Authors: Mana Iwata, Yoshiro Matsuda, Yoshimasa Utsumi, Yoshitoshi Tanaka,
Kazuhide Nakata
- Abstract要約: 日本の特許には、日本独自の特許分類コードFI(File Index)が割り当てられています。
2006年以来、リビジョンはすでに30,000以上の新しいFIを確立しています。
機械学習を用いて特許分類コードの改訂を支援することで、精度と効率が向上する。
- 参考スコア(独自算出の注目度): 0.41998444721319217
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Japanese patents are assigned a patent classification code, FI (File Index),
that is unique to Japan. FI is a subdivision of the IPC, an international
patent classification code, that is related to Japanese technology. FIs are
revised to keep up with technological developments. These revisions have
already established more than 30,000 new FIs since 2006. However, these
revisions require a lot of time and workload. Moreover, these revisions are not
automated and are thus inefficient. Therefore, using machine learning to assist
in the revision of patent classification codes (FI) will lead to improved
accuracy and efficiency. This study analyzes patent documents from this new
perspective of assisting in the revision of patent classification codes with
machine learning. To analyze time-series changes in patents, we used the
dynamic topic model (DTM), which is an extension of the latent Dirichlet
allocation (LDA). Also, unlike English, the Japanese language requires
morphological analysis. Patents contain many technical words that are not used
in everyday life, so morphological analysis using a common dictionary is not
sufficient. Therefore, we used a technique for extracting technical terms from
text. After extracting technical terms, we applied them to DTM. In this study,
we determined the technological progress of the lighting class F21 for 14 years
and compared it with the actual revision of patent classification codes. In
other words, we extracted technical terms from Japanese patents and applied DTM
to determine the progress of Japanese technology. Then, we analyzed the results
from the new perspective of revising patent classification codes with machine
learning. As a result, it was found that those whose topics were on the rise
were judged to be new technologies.
- Abstract(参考訳): 日本の特許には、日本独自の特許分類コードFI(File Index)が割り当てられている。
fiは、日本の技術に関連する国際特許分類コード(ipc)のサブディビジョンである。
FIは技術開発に合わせて改訂される。
これらの改訂は2006年以来すでに30,000以上の新しいfisを確立している。
しかしながら、これらのリビジョンには多くの時間と作業負荷が必要です。
さらに、これらのリビジョンは自動化されておらず、非効率である。
したがって、機械学習を用いて特許分類コード(FI)の改訂を支援することにより、精度と効率が向上する。
本研究は,機械学習による特許分類コードの改訂を支援する新たな視点から,特許文書の分析を行う。
特許の時系列変化を分析するために,潜在ディリクレ割り当て(LDA)の拡張である動的トピックモデル(DTM)を用いた。
また、英語とは異なり、日本語は形態素解析を必要とする。
特許には日常生活で使われない多くの技術用語が含まれているため、共通辞書を用いた形態解析は不十分である。
そこで,テキストから専門用語を抽出する手法を用いた。
技術的用語を抽出した後,DTMに応用した。
本研究では,14年間の照明クラスF21の技術的進歩を,特許分類コードの実際の改訂と比較した。
言い換えれば、日本の特許から技術用語を抽出し、日本の技術の進歩を判断するためにDTMを適用した。
そこで我々は,機械学習による特許分類コードの変更という新たな視点から,その結果を分析した。
その結果,話題が高まりつつあるものが新技術であると判断された。
関連論文リスト
- PatentEdits: Framing Patent Novelty as Textual Entailment [62.8514393375952]
このデータセットには105万例の修正が成功している。
我々は、文章を文単位でラベル付けするアルゴリズムを設計し、これらの編集がいかに大きな言語モデルで予測できるかを確立する。
引用引用文と起草文の文的含意を評価することは,どの発明的主張が変化しないか,あるいは先行技術に関して新規かを予測するのに特に有効であることを示す。
論文 参考訳(メタデータ) (2024-11-20T17:23:40Z) - HuatuoGPT-II, One-stage Training for Medical Adaption of LLMs [61.41790586411816]
HuatuoGPT-IIは、いくつかのベンチマークで、中国の医学領域における最先端のパフォーマンスを示している。
さらに、ChatGPTやGPT-4といったプロプライエタリなモデルよりも、特に中国伝統医学において優れています。
論文 参考訳(メタデータ) (2023-11-16T10:56:24Z) - Unveiling Black-boxes: Explainable Deep Learning Models for Patent
Classification [48.5140223214582]
深部不透明ニューラルネットワーク(DNN)を利用した多ラベル特許分類のための最先端手法
レイヤワイド関連伝搬(Layer-wise Relevance propagation, LRP)を導入し, 特許の詳細な分類手法を提案する。
関連性スコアを考慮し、予測された特許クラスに関連する単語を視覚化して説明を生成する。
論文 参考訳(メタデータ) (2023-10-31T14:11:37Z) - Adaptive Taxonomy Learning and Historical Patterns Modelling for Patent Classification [26.85734804493925]
本稿では,特許分類に関する特許に関する情報を包括的に検討する統合フレームワークを提案する。
まず,その意味表現を導出するためのICC符号相関学習モジュールを提案する。
最後に、IPC符号のセマンティクスを含む特許文書の文脈情報と、予測を行うために利用者のシーケンシャルな選好を割り当てる。
論文 参考訳(メタデータ) (2023-08-10T07:02:24Z) - A Survey on Zero Pronoun Translation [69.09774294082965]
ゼロ代名詞(ZP)はプロドロップ言語では省略されることが多いが、非プロドロップ言語ではリコールされるべきである。
本研究は, 神経革命後のゼロ代名詞翻訳(ZPT)における主要な研究について述べる。
1) ZPTは大規模言語モデルの発展傾向と一致している; 2) データの制限は言語やドメインの学習バイアスを引き起こす; 3) 性能改善は単一のベンチマークで報告されることが多いが、高度な手法はまだ実世界の利用には程遠い。
論文 参考訳(メタデータ) (2023-05-17T13:19:01Z) - A Novel Patent Similarity Measurement Methodology: Semantic Distance and
Technological Distance [0.0]
特許類似性分析は、特許侵害のリスクを評価する上で重要な役割を果たす。
自然言語処理技術の最近の進歩は、このプロセスを自動化するための有望な道を提供する。
本稿では,特許間の類似性を考慮し,特許の意味的類似性を考慮し,特許間の類似度を測定するハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2023-03-23T07:55:31Z) - The Harvard USPTO Patent Dataset: A Large-Scale, Well-Structured, and
Multi-Purpose Corpus of Patent Applications [8.110699646062384]
ハーバードUSPTO特許データセット(HUPD)について紹介する。
450万件以上の特許文書があり、HUPDは同等のコーパスの2倍から3倍の大きさだ。
各アプリケーションのメタデータとすべてのテキストフィールドを提供することで、このデータセットは研究者が新しいNLPタスクセットを実行することを可能にする。
論文 参考訳(メタデータ) (2022-07-08T17:57:15Z) - Automated Single-Label Patent Classification using Ensemble Classifiers [0.0]
特許文書の異なる部分で訓練されたアンサンブル分類器の革新的な方法を提案する。
我々の知る限りでは、特許分類問題に対してアンサンブル法が提案されたのはこれが初めてである。
論文 参考訳(メタデータ) (2022-03-03T08:47:15Z) - Patent Sentiment Analysis to Highlight Patent Paragraphs [0.0]
特許文書が与えられた場合、異なるセマンティックアノテーションを識別することは興味深い研究の側面である。
手動の特許分析の過程で、より読みやすくするために、段落をマークして意味情報を認識することが実際である。
この作業は、セマンティック情報を自動的に強調する特許実践者を支援し、機械学習の適性を利用して持続的で効率的な特許分析を作成するのに役立つ。
論文 参考訳(メタデータ) (2021-11-06T13:28:29Z) - White Paper Machine Learning in Certified Systems [70.24215483154184]
DEEL Project set-up the ML Certification 3 Workgroup (WG) set-up by the Institut de Recherche Technologique Saint Exup'ery de Toulouse (IRT)
論文 参考訳(メタデータ) (2021-03-18T21:14:30Z) - A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。
そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文 参考訳(メタデータ) (2020-09-25T12:01:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。