論文の概要: Deep Learning and Natural Language Processing in the Field of Construction
- arxiv url: http://arxiv.org/abs/2501.07911v1
- Date: Tue, 14 Jan 2025 07:53:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-15 13:25:27.055202
- Title: Deep Learning and Natural Language Processing in the Field of Construction
- Title(参考訳): 建設分野におけるディープラーニングと自然言語処理
- Authors: Rémy Kessler, Nicolas Béchet,
- Abstract要約: まず,建築分野における技術仕様の収集から用語を抽出するコーパス解析手法について述べる。
次に、言語パターンとインターネットクエリを用いてプルーニングのステップを実行し、最終用語の質を向上させる。
次に,各単語の埋め込みモデルと組み合わせをベースとした機械学習手法を提案し,抽出した用語からハイパーネムを検出する。
- 参考スコア(独自算出の注目度): 0.09208007322096533
- License:
- Abstract: This article presents a complete process to extract hypernym relationships in the field of construction using two main steps: terminology extraction and detection of hypernyms from these terms. We first describe the corpus analysis method to extract terminology from a collection of technical specifications in the field of construction. Using statistics and word n-grams analysis, we extract the domain's terminology and then perform pruning steps with linguistic patterns and internet queries to improve the quality of the final terminology. Second, we present a machine-learning approach based on various words embedding models and combinations to deal with the detection of hypernyms from the extracted terminology. Extracted terminology is evaluated using a manual evaluation carried out by 6 experts in the domain, and the hypernym identification method is evaluated with different datasets. The global approach provides relevant and promising results.
- Abstract(参考訳): 本稿では,これらの用語から用語抽出とハイパーネムの検出という2つの主要なステップを用いて,建設分野におけるハイパーネム関係を抽出するプロセスについて述べる。
まず,建築分野における技術仕様の収集から用語を抽出するコーパス解析手法について述べる。
統計学と単語n-grams分析を用いて、ドメインの用語を抽出し、言語パターンとインターネットクエリを用いてプルーニングステップを実行し、最終用語の質を向上させる。
次に,各単語の埋め込みモデルと組み合わせをベースとした機械学習手法を提案し,抽出した用語からハイパーネムを検出する。
抽出項をドメイン内の6人の専門家による手動評価を用いて評価し,異なるデータセットを用いてハイパーネム同定手法を評価する。
グローバルアプローチは、関連性があり、有望な結果をもたらす。
関連論文リスト
- Domain Embeddings for Generating Complex Descriptions of Concepts in
Italian Language [65.268245109828]
電子辞書から抽出した言語情報と語彙情報に富んだ分布意味資源を提案する。
リソースは21のドメイン固有の行列と1つの包括的なマトリックスとグラフィカルユーザインタフェースから構成される。
本モデルは,具体的概念知識に直接関連した行列を選択することにより,概念の意味的記述の推論を容易にする。
論文 参考訳(メタデータ) (2024-02-26T15:04:35Z) - A Distributed Automatic Domain-Specific Multi-Word Term Recognition
Architecture using Spark Ecosystem [0.5156484100374059]
ドメイン固有の用語を自動的に抽出する分散Sparkベースのアーキテクチャを提案する。
2つの実世界のデータセットで実験を行うことで、アーキテクチャの実現性を実証的に証明する。
論文 参考訳(メタデータ) (2023-05-24T10:05:59Z) - A bilingual approach to specialised adjectives through word embeddings
in the karstology domain [3.92181732547846]
単語埋め込みを用いた特定の意味関係を表現する形容詞の抽出実験を行う。
実験の結果は徹底的に分析され、形式的または意味的な類似性を示す形容詞のグループに分類される。
論文 参考訳(メタデータ) (2022-03-31T08:27:15Z) - Semantic Search for Large Scale Clinical Ontologies [63.71950996116403]
本稿では,大規模臨床語彙検索システムを構築するための深層学習手法を提案する。
本稿では,意味学習データに基づくトレーニングデータを生成するTriplet-BERTモデルを提案する。
このモデルは,5つの実ベンチマークデータセットを用いて評価され,提案手法は自由テキストから概念,概念まで,概念語彙の検索において高い結果が得られることを示す。
論文 参考訳(メタデータ) (2022-01-01T05:15:42Z) - Extracting Domain-specific Concepts from Large-scale Linked Open Data [0.0]
提案手法は,LOD語彙を対象ドメインに関連する用語とリンクすることにより,検索エンティティを定義する。
対象領域における概念的関係の範囲を決定するために,共通上層実体の発生と経路の連鎖関係について検討した。
論文 参考訳(メタデータ) (2021-11-22T10:25:57Z) - Text analysis and deep learning: A network approach [0.0]
本稿では,変圧器モデルとネットワーク解析を併用して,言語使用の自己参照表現を生成する手法を提案する。
我々のアプローチは、基礎となるモデルと強く整合した言語関係と、それらに関する数学的に明確に定義された操作を生成する。
我々の知る限りでは、深層言語モデルから直接意味ネットワークを抽出する最初の教師なし手法である。
論文 参考訳(メタデータ) (2021-10-08T14:18:36Z) - Deep Learning Schema-based Event Extraction: Literature Review and
Current Trends [60.29289298349322]
ディープラーニングに基づくイベント抽出技術が研究ホットスポットとなっている。
本稿では,ディープラーニングモデルに焦点をあて,最先端のアプローチを見直し,そのギャップを埋める。
論文 参考訳(メタデータ) (2021-07-05T16:32:45Z) - Hierarchical Learning Using Deep Optimum-Path Forest [55.60116686945561]
バグオブビジュアルワード(bovw)やディープラーニング技術は、コンピュータ支援医療診断を含むいくつかの領域で広く使われている。
本研究では機械学習とBoVWの概念を用いたパーキンソン病の自動同定ツールの開発に興味を持っている。
論文 参考訳(メタデータ) (2021-02-18T13:02:40Z) - Introducing Syntactic Structures into Target Opinion Word Extraction
with Deep Learning [89.64620296557177]
目的語抽出のためのディープラーニングモデルに文の構文構造を組み込むことを提案する。
また,ディープラーニングモデルの性能向上のために,新たな正規化手法を導入する。
提案モデルは,4つのベンチマークデータセット上での最先端性能を広範囲に解析し,達成する。
論文 参考訳(メタデータ) (2020-10-26T07:13:17Z) - Distributional semantic modeling: a revised technique to train term/word
vector space models applying the ontology-related approach [36.248702416150124]
ニューラルネットワークを用いた分散項表現(あるいは項埋め込み)学習による分布意味モデリングのための新しい手法を設計する。
Vec2graphは、動的かつインタラクティブなグラフとして単語埋め込み(私たちの場合の長期埋め込み)を視覚化するためのPythonライブラリである。
論文 参考訳(メタデータ) (2020-03-06T18:27:39Z) - How Far are We from Effective Context Modeling? An Exploratory Study on
Semantic Parsing in Context [59.13515950353125]
文法に基づく意味解析を行い,その上に典型的な文脈モデリング手法を適用する。
我々は,2つの大きなクロスドメインデータセットに対して,13のコンテキストモデリング手法を評価した。
論文 参考訳(メタデータ) (2020-02-03T11:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。