論文の概要: Learning Context-Aware Representations of Subtrees
- arxiv url: http://arxiv.org/abs/2111.04308v1
- Date: Mon, 8 Nov 2021 07:43:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-09 23:53:07.004755
- Title: Learning Context-Aware Representations of Subtrees
- Title(参考訳): サブツリーの文脈認識表現の学習
- Authors: Cedric Cook
- Abstract要約: この論文は、Webページや要素分類への自然な応用による複雑で構造化されたデータの効率的な表現を学習する問題に取り組む。
ウェブページ内の要素を取り巻くコンテキストは問題に対して高い価値があり、現在悪用されていると仮定する。
この論文は、Web要素をDOMツリーのサブツリーとして分類するという問題を解決することを目的としている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This thesis tackles the problem of learning efficient representations of
complex, structured data with a natural application to web page and element
classification. We hypothesise that the context around the element inside the
web page is of high value to the problem and is currently under exploited. This
thesis aims to solve the problem of classifying web elements as subtrees of a
DOM tree by also considering their context.
To achieve this, first we discuss current expert knowledge systems that work
on structures, such as Tree-LSTM. Then, we propose context-aware extensions to
this model. We show that the new model achieves an average F1-score of 0.7973
on a multi-class web classification task. This model generates better
representations for various subtrees and may be used for applications such
element classification, state estimators in reinforcement learning over the Web
and more.
- Abstract(参考訳): この論文は、Webページや要素分類への自然な応用による複雑な構造化データの効率的な表現を学習する問題に取り組む。
我々は、webページ内の要素を取り巻くコンテキストが問題に対して高い価値を持ち、現在悪用されていると仮定する。
この論文は、Web要素をDOMツリーのサブツリーとして分類するという問題を解決することを目的としている。
そこで我々はまず,木-LSTMのような構造を扱う知識システムについて論じる。
次に,このモデルの文脈対応拡張を提案する。
マルチクラスWeb分類タスクにおいて, 平均F1スコアが0.7973であることを示す。
このモデルは、様々なサブツリーに対してより良い表現を生成し、要素分類、Web上の強化学習における状態推定器などの用途に使用できる。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Learning Hierarchical Prompt with Structured Linguistic Knowledge for
Vision-Language Models [43.56153167864033]
大規模言語モデル(LLM)における構造化知識を活用する新しい手法を提案する。
低レベルの即時学習のためのエンティティと属性間のペアワイズ関連をキャプチャする、関係誘導型アテンションモジュールを導入する。
さらに、高レベルのプロンプトとグローバルレベルのプロンプトを組み込むことで、提案された階層構造は、クロスレベルのインターリンクを偽造し、より複雑で長期的な関係を扱うようにモデルに権限を与える。
論文 参考訳(メタデータ) (2023-12-11T12:14:06Z) - PLM-GNN: A Webpage Classification Method based on Joint Pre-trained
Language Model and Graph Neural Network [19.75890828376791]
PLM-GNN という名前の事前学習言語モデルとグラフニューラルネットワークに基づく表現と分類手法を提案する。
Web ページにおけるテキストと HTML DOM ツリーの同時符号化に基づいており,KI-04 と SWDE のデータセットと,学者のホームページクローリングプロジェクトのための実用的なデータセット AHS でよく機能する。
論文 参考訳(メタデータ) (2023-05-09T12:19:10Z) - Visualization Of Class Activation Maps To Explain AI Classification Of
Network Packet Captures [0.0]
ネットワーク内のコネクションの数と新しいアプリケーションの追加は、大量のログデータを引き起こします。
ディープラーニング手法は、特徴抽出と単一システムにおけるデータからの分類の両方を提供する。
本稿では、ネットワークデータの分類と説明技法を組み合わせて、専門家、アルゴリズム、データ間のインターフェースを形成する視覚対話型ツールを提案する。
論文 参考訳(メタデータ) (2022-09-05T16:34:43Z) - Tree Structure-Aware Few-Shot Image Classification via Hierarchical
Aggregation [27.868736254566397]
我々は、プレテキストタスクを通して、数ショットの画像分類のための追加の特徴表現を学習する方法に焦点をあてる。
この追加の知識は、数発の学習のパフォーマンスをさらに向上させることができる。
本稿では,FSLとプレテキストタスクの関係を学習する階層木構造認識(HTS)手法を提案する。
論文 参考訳(メタデータ) (2022-07-14T15:17:19Z) - Active Predictive Coding Networks: A Neural Solution to the Problem of
Learning Reference Frames and Part-Whole Hierarchies [1.5990720051907859]
APCN(Active Predictive Coding Networks)を紹介する。
APCNは、人工知能と脳モデリングの分野において、Hintonらによって引き起こされた主要な問題を解決するニューラルネットワークの新しいクラスである。
APCNは(a)画像を部分全体階層に解析し、(b)構成表現を学習し、(c)未知のオブジェクトのクラスにその知識を移すことを実証する。
論文 参考訳(メタデータ) (2022-01-14T21:22:48Z) - CoVA: Context-aware Visual Attention for Webpage Information Extraction [65.11609398029783]
WIE をコンテキスト対応 Web ページオブジェクト検出タスクとして再構築することを提案する。
我々は、外観特徴とDOMツリーからの構文構造を組み合わせた、コンテキスト認識型視覚意図ベース(CoVA)検出パイプラインを開発した。
提案手法は,従来の最先端手法を改良した新しい挑戦的ベースラインであることを示す。
論文 参考訳(メタデータ) (2021-10-24T00:21:46Z) - Speaker-Conditioned Hierarchical Modeling for Automated Speech Scoring [60.55025339250815]
本研究では、話者条件付き階層型モデリングと呼ばれる非ネイティブASSのための新しいディープラーニング手法を提案する。
本手法では, 口腔熟練度テストが候補に対して複数の応答を評価できるという事実を生かして, 候補に対して複数の応答を評価できる。これらの応答からコンテキストを抽出し, ネットワークに付加的な話者固有のコンテキストとして与えて, 特定の応答をスコアする。
論文 参考訳(メタデータ) (2021-08-30T07:00:28Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z) - A Graph Representation of Semi-structured Data for Web Question
Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。
本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文 参考訳(メタデータ) (2020-10-14T04:01:54Z) - Neural Entity Linking: A Survey of Models Based on Deep Learning [82.43751915717225]
本調査では,2015年以降に開発されたニューラルエンティティリンク(EL)システムの包括的記述について報告する。
その目標は、ニューラルエンティティリンクシステムの設計機能を体系化し、それらのパフォーマンスを一般的なベンチマーク上の注目すべき古典的手法と比較することである。
この調査はエンティティリンクの応用に焦点をあて、最近出現した、深い事前訓練されたマスキング言語モデルを強化するユースケースに焦点を当てている。
論文 参考訳(メタデータ) (2020-05-31T18:02:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。