論文の概要: Technological taxonomies for hypernym and hyponym retrieval in patent
texts
- arxiv url: http://arxiv.org/abs/2212.06039v2
- Date: Tue, 13 Dec 2022 15:26:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 19:02:56.041617
- Title: Technological taxonomies for hypernym and hyponym retrieval in patent
texts
- Title(参考訳): 特許文書におけるハイパーニム・ハイポニム検索のための技術分類法
- Authors: You Zuo (ALMAnaCH), Yixuan Li, Alma Parias Garc\'ia, Kim Gerdes (LISN)
- Abstract要約: テキストからテキストへのトランスフォーマ(T5)モデルを微調整して,比較的高精度なハイパーネムと偽名を生成することができることを示す。
T5モデルは、ハイパーネムを生成可能な新しい技術的用語に分類を開放する。
- 参考スコア(独自算出の注目度): 17.549208519206605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents an automatic approach to creating taxonomies of technical
terms based on the Cooperative Patent Classification (CPC). The resulting
taxonomy contains about 170k nodes in 9 separate technological branches and is
freely available. We also show that a Text-to-Text Transfer Transformer (T5)
model can be fine-tuned to generate hypernyms and hyponyms with relatively high
precision, confirming the manually assessed quality of the resource. The T5
model opens the taxonomy to any new technological terms for which a hypernym
can be generated, thus making the resource updateable with new terms, an
essential feature for the constantly evolving field of technological
terminology.
- Abstract(参考訳): 本稿では,共同特許分類(cpc)に基づく技術用語分類の自動作成手法を提案する。
その結果得られた分類は、9つの異なる技術分野の約170kのノードを含み、自由に利用できる。
また,t5(text-to-text transfer transformer)モデルを微調整して,比較的高精度なハイパーニムや低調を生成することにより,資源の質を手作業で評価できることを示す。
T5モデルは、ハイパーネムを生成可能な新しい技術的用語に分類を開放し、新しい用語で資源を更新できるようにする。
関連論文リスト
- The Master-Slave Encoder Model for Improving Patent Text Summarization: A New Approach to Combining Specifications and Claims [4.0394257829385065]
本稿では,マスタスレーブエンコーダアーキテクチャに基づく特許テキスト抽象生成モデル(MSEA)を提案する。
公開されている特許テキストデータセットでは、それぞれルージュ-1、ルージュ-2、ルージュ-Lの0.006、0.005、0.005の改善が達成されている。
論文 参考訳(メタデータ) (2024-11-21T12:36:19Z) - A Combined Encoder and Transformer Approach for Coherent and High-Quality Text Generation [5.930799903736776]
本研究は,BERTのセマンティック解釈強度とGPT-4の生成能力を組み合わせた新しいテキスト生成モデルを提案する。
このモデルはセマンティックディープを強化し、スムーズな人間のようなテキストフローを維持し、以前のモデルに見られる制限を克服する。
論文 参考訳(メタデータ) (2024-11-19T01:41:56Z) - Creating a Fine Grained Entity Type Taxonomy Using LLMs [0.0]
本研究は, GPT-4とその先進的な反復である GPT-4 Turbo が, 詳細な実体型分類学を自律的に開発する可能性について検討する。
我々の目的は、広く分類されたエンティティタイプから始まる包括的な分類体系を構築することである。
この分類は、GPT-4の内部知識ベースを利用して反復的なプロンプト技術によって徐々に洗練される。
論文 参考訳(メタデータ) (2024-02-19T21:32:19Z) - Compositional Zero-Shot Domain Transfer with Text-to-Text Models [65.32821642379066]
ゼロショットドメイン転送のための新しい合成転写学習フレームワーク(DoT5)を提案する。
ドメイン内のラベルにアクセスすることなく、DoT5はドメイン知識とタスク知識をマルチタスクで共同で学習する。
DoT5はマルチタスク学習による合成伝達学習の有効性を示す。
特にDoT5は、現在のSOTAを7以上の絶対点の精度でゼロショット転送で上回る。
論文 参考訳(メタデータ) (2023-03-23T15:58:41Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.794640012673064]
データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
論文 参考訳(メタデータ) (2021-04-08T11:00:43Z) - GTAE: Graph-Transformer based Auto-Encoders for Linguistic-Constrained
Text Style Transfer [119.70961704127157]
近年,非並列テキストスタイルの転送が研究の関心を集めている。
現在のアプローチでは、元の文の内容やロジックを保存できない。
文を言語グラフとしてモデル化し,グラフレベルで特徴抽出とスタイル転送を行う,グラフトランスフォーマーベースのAuto-GTAEを提案する。
論文 参考訳(メタデータ) (2021-02-01T11:08:45Z) - Technical Progress Analysis Using a Dynamic Topic Model for Technical
Terms to Revise Patent Classification Codes [0.41998444721319217]
日本の特許には、日本独自の特許分類コードFI(File Index)が割り当てられています。
2006年以来、リビジョンはすでに30,000以上の新しいFIを確立しています。
機械学習を用いて特許分類コードの改訂を支援することで、精度と効率が向上する。
論文 参考訳(メタデータ) (2020-12-18T09:24:01Z) - Incorporating Terminology Constraints in Automatic Post-Editing [23.304864678067865]
語彙的に制約されたAPEに対する自己回帰モデルと非自己回帰モデルの両方を提示する。
提案手法により,95%の用語の保存が可能となり,英独ベンチマークの翻訳品質も向上する。
論文 参考訳(メタデータ) (2020-10-19T15:44:03Z) - Octet: Online Catalog Taxonomy Enrichment with Self-Supervision [67.26804972901952]
オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
論文 参考訳(メタデータ) (2020-06-18T04:53:07Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。