論文の概要: A Text Classification-Based Approach for Evaluating and Enhancing the
Machine Interpretability of Building Codes
- arxiv url: http://arxiv.org/abs/2309.14374v1
- Date: Sun, 24 Sep 2023 11:36:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 16:57:32.656930
- Title: A Text Classification-Based Approach for Evaluating and Enhancing the
Machine Interpretability of Building Codes
- Title(参考訳): テキスト分類に基づく建物コードの機械解釈可能性の評価・向上手法
- Authors: Zhe Zheng, Yu-Cheng Zhou, Ke-Yin Chen, Xin-Zheng Lu, Zhong-Tian She,
Jia-Rui Lin
- Abstract要約: 本研究では,単一節の機械解釈可能性を自動評価し,拡張するための新しい手法を提案する。
実験の結果,提案したテキスト分類アルゴリズムは既存のCNN法やRNN法よりも優れていた。
中国における150以上の建築コードの結果を分析した結果、平均的な解釈可能性(英語版)は34.40%であった。
- 参考スコア(独自算出の注目度): 9.730183895717056
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Interpreting regulatory documents or building codes into computer-processable
formats is essential for the intelligent design and construction of buildings
and infrastructures. Although automated rule interpretation (ARI) methods have
been investigated for years, most of them highly depend on the early and manual
filtering of interpretable clauses from a building code. While few of them
considered machine interpretability, which represents the potential to be
transformed into a computer-processable format, from both clause- and
document-level. Therefore, this research aims to propose a novel approach to
automatically evaluate and enhance the machine interpretability of single
clause and building codes. First, a few categories are introduced to classify
each clause in a building code considering the requirements for rule
interpretation, and a dataset is developed for model training. Then, an
efficient text classification model is developed based on a pretrained
domain-specific language model and transfer learning techniques. Finally, a
quantitative evaluation method is proposed to assess the overall
interpretability of building codes. Experiments show that the proposed text
classification algorithm outperforms the existing CNN- or RNN-based methods,
improving the F1-score from 72.16% to 93.60%. It is also illustrated that the
proposed classification method can enhance downstream ARI methods with an
improvement of 4%. Furthermore, analyzing the results of more than 150 building
codes in China showed that their average interpretability is 34.40%, which
implies that it is still hard to fully transform the entire regulatory document
into computer-processable formats. It is also argued that the interpretability
of building codes should be further improved both from the human side and the
machine side.
- Abstract(参考訳): 規制文書や建築コードをコンピュータ処理可能なフォーマットに解釈することは、建物やインフラのインテリジェントな設計と構築に不可欠である。
自動ルール解釈(ARI)法は長年研究されてきたが、そのほとんどは、ビルコードから解釈可能な節を早期かつ手動でフィルタリングすることに依存している。
コンピュータ処理可能なフォーマットに変換される可能性を表す機械解釈性は,文節レベルと文書レベルの両方から考えられたものはほとんどない。
そこで本研究では,単一節と構築コードの機械解釈性を自動的に評価し,拡張するための新しい手法を提案する。
まず、ルール解釈の要件を考慮したビルディングコードの各節を分類するためにいくつかのカテゴリを導入し、モデルトレーニング用のデータセットを開発する。
そして、事前学習されたドメイン固有言語モデルと転送学習技術に基づいて、効率的なテキスト分類モデルを構築する。
最後に, 建築コード全体の解釈可能性を評価するための定量的評価手法を提案する。
実験の結果、提案したテキスト分類アルゴリズムは既存のCNN法やRNN法よりも優れており、F1スコアは72.16%から93.60%に向上した。
また, 提案手法により, 下流ARI法を4%改善できることを示した。
さらに、中国の150以上の建築コードの結果から、その平均解釈性は34.40%であり、規制文書全体をコンピュータ処理可能なフォーマットに完全に変換することは依然として困難であることが示された。
また、人間の側と機械側の両方から、コード構築の解釈可能性をさらに改善すべきだとも主張されている。
関連論文リスト
- Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - Blueprinting the Future: Automatic Item Categorization using
Hierarchical Zero-Shot and Few-Shot Classifiers [6.907552533477328]
本研究では,ゼロショットおよび少数ショット生成事前学習変換器(GPT)を用いた階層的項目分類手法を提案する。
検査ブループリントの階層的な性質はシームレスにナビゲートされ、複数のレベルの項目を階層的に分類することができる。
人工データによる初期シミュレーションは、この方法の有効性を示し、F1スコアで測定された平均精度92.91%を達成する。
論文 参考訳(メタデータ) (2023-12-06T15:51:49Z) - Unifying Structure and Language Semantic for Efficient Contrastive
Knowledge Graph Completion with Structured Entity Anchors [0.3913403111891026]
知識グラフ補完(KGC)の目標は、すでに知られている訓練された事実を用いて、KGの欠落したリンクを予測することである。
本稿では,帰納的推論の力を失うことなく,構造情報と言語意味を効果的に統一する手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T11:17:55Z) - Scalable Learning of Latent Language Structure With Logical Offline
Cycle Consistency [71.42261918225773]
概念的には、LOCCOは、トレーニング対象のセマンティクスを使用してラベルなしテキストのアノテーションを生成する、自己学習の一形態と見なすことができる。
追加ボーナスとして、LOCCOによって生成されたアノテーションは、神経テキスト生成モデルをトレーニングするために自明に再利用することができる。
論文 参考訳(メタデータ) (2023-05-31T16:47:20Z) - A Machine Learning Approach to Classifying Construction Cost Documents
into the International Construction Measurement Standard [0.0]
原価文書で提供される自然言語記述を分類する最初の自動モデル「Bills of Quantities」を紹介した。
英国中の24の大規模なインフラ建設プロジェクトから収集された5万件以上の項目のデータセットから学習する。
論文 参考訳(メタデータ) (2022-10-24T11:35:53Z) - Computer-Assisted Creation of Boolean Search Rules for Text
Classification in the Legal Domain [0.5249805590164901]
我々はCASEと呼ばれる対話型環境を開発し、単語共起を利用して人間アノテータに関連する検索語の選択を誘導する。
このシステムは、分類規則の反復的評価と改善をシームレスに行う。
4つのデータセットからCASEシステムを用いて作成した分類器を評価し,その結果を機械学習手法と比較した。
論文 参考訳(メタデータ) (2021-12-10T19:53:41Z) - LeQua@CLEF2022: Learning to Quantify [76.22817970624875]
LeQua 2022は、テキストデータセットで'を定量化する方法を評価するための新しい実験室である。
本研究の目的は、バイナリ設定とシングルラベルのマルチクラス設定の両方において、学習方法の比較評価のための設定を提供することである。
論文 参考訳(メタデータ) (2021-11-22T14:54:20Z) - Data Augmentation in Natural Language Processing: A Novel Text
Generation Approach for Long and Short Text Classifiers [8.19984844136462]
本稿では,長文と短文の分類器の性能向上に適したテキスト生成手法を提案し,評価する。
シミュレーションされた低データレギュレーションでは、最大15.53%の加算精度ゲインが達成される。
さまざまな種類のデータセットに対するアプローチを成功に導くための意味とパターンについて議論します。
論文 参考訳(メタデータ) (2021-03-26T13:16:07Z) - TextFlint: Unified Multilingual Robustness Evaluation Toolkit for
Natural Language Processing [73.16475763422446]
NLPタスク(TextFlint)のための多言語ロバスト性評価プラットフォームを提案する。
普遍的なテキスト変換、タスク固有の変換、敵攻撃、サブポピュレーション、およびそれらの組み合わせを取り入れ、包括的な堅牢性分析を提供する。
TextFlintは、モデルの堅牢性の欠点に対処するために、完全な分析レポートとターゲットとした拡張データを生成します。
論文 参考訳(メタデータ) (2021-03-21T17:20:38Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。
そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文 参考訳(メタデータ) (2020-09-25T12:01:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。