論文の概要: POTATO: exPlainable infOrmation exTrAcTion framewOrk
- arxiv url: http://arxiv.org/abs/2201.13230v1
- Date: Mon, 31 Jan 2022 13:43:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 17:25:49.571285
- Title: POTATO: exPlainable infOrmation exTrAcTion framewOrk
- Title(参考訳): POTATO: ExPlainable infOrmation exTrAcTion framewOrk
- Authors: \'Ad\'am Kov\'acs, Kinga G\'emes, Eszter Ikl\'odi, G\'abor Recski
- Abstract要約: 本稿では,Human-in-the-loop(HITL)学習のためのタスク依存および言語依存フレームワークであるPOTATOについて述べる。
合理化ベースのユーザインターフェースにより、ユーザはグラフパターンからルールシステムを構築することができ、地上の真実データに基づいたリアルタイム評価を提供し、解釈可能な機械学習モデルを使用してグラフ機能のランキング付けによるルールを提案する。
POTATOは、ドイツの法律文書やイギリスのソーシャルメディアデータに関する分類タスクを含む、ドメインや言語にわたるプロジェクトに適用されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present POTATO, a task- and languageindependent framework for
human-in-the-loop (HITL) learning of rule-based text classifiers using
graph-based features. POTATO handles any type of directed graph and supports
parsing text into Abstract Meaning Representations (AMR), Universal
Dependencies (UD), and 4lang semantic graphs. A streamlit-based user interface
allows users to build rule systems from graph patterns, provides real-time
evaluation based on ground truth data, and suggests rules by ranking graph
features using interpretable machine learning models. Users can also provide
patterns over graphs using regular expressions, and POTATO can recommend
refinements of such rules. POTATO is applied in projects across domains and
languages, including classification tasks on German legal text and English
social media data. All components of our system are written in Python, can be
installed via pip, and are released under an MIT License on GitHub.
- Abstract(参考訳): 本稿では,Human-in-the-loop(HITL)学習のためのタスク依存および言語依存フレームワークPOTATOを提案する。
POTATOは任意の種類の有向グラフを処理し、テキストを抽象的意味表現(AMR)、普遍的依存(UD)、および4言語意味グラフにパースする。
streamlitベースのユーザーインターフェイスは、ユーザーがグラフパターンからルールシステムを構築し、グランド・真実データに基づくリアルタイム評価を提供し、解釈可能な機械学習モデルを使用してグラフの特徴をランク付けすることでルールを提案できる。
ユーザーは正規表現を使ってグラフ上のパターンも提供でき、POTATOはそのようなルールの洗練を推奨できる。
POTATOは、ドイツの法律文書やイギリスのソーシャルメディアデータに関する分類タスクを含む、ドメインや言語のプロジェクトに適用されている。
システムのすべてのコンポーネントはpythonで書かれており、pip経由でインストールでき、githubでmitライセンスでリリースされています。
関連論文リスト
- UniGLM: Training One Unified Language Model for Text-Attributed Graphs [31.464021556351685]
統一グラフ言語モデル(Unified Graph Language Model、UniGLM)は、グラフ埋め込みモデルであり、ドメイン内およびドメイン間TAGの両方によく一般化する。
UniGLMには、構造的に類似したノードを特定するための適応的な正のサンプル選択技術と、トレーニングを加速するために考案された遅延コントラストモジュールが含まれている。
論文 参考訳(メタデータ) (2024-06-17T19:45:21Z) - G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding and Question Answering [61.93058781222079]
現実のテキストグラフを対象とするフレキシブルな問合せフレームワークを開発した。
一般のテキストグラフに対する最初の検索拡張生成(RAG)手法を提案する。
G-Retrieverは、このタスクをSteiner Tree最適化問題として定式化し、グラフ上でRAGを実行する。
論文 参考訳(メタデータ) (2024-02-12T13:13:04Z) - Large Language Models on Graphs: A Comprehensive Survey [77.16803297418201]
グラフ上の大規模言語モデルに関連するシナリオとテクニックを体系的にレビューする。
まず,LLMをグラフに適用する可能性シナリオを,純グラフ,テキスト分散グラフ,テキストペアグラフの3つのカテゴリにまとめる。
本稿では,そのような手法の現実的な応用について論じ,オープンソースコードとベンチマークデータセットを要約する。
論文 参考訳(メタデータ) (2023-12-05T14:14:27Z) - Learning Multiplex Representations on Text-Attributed Graphs with One Language Model Encoder [55.24276913049635]
テキスト分散グラフ上での多重表現学習のための新しいフレームワークMETAGを提案する。
既存の手法とは対照的に、MeTAGは1つのテキストエンコーダを使用して関係性間の共有知識をモデル化する。
学術分野と電子商取引分野の5つのグラフにおいて,9つの下流タスクについて実験を行った。
論文 参考訳(メタデータ) (2023-10-10T14:59:22Z) - Generating Semantic Graph Corpora with Graph Expansion Grammar [0.0]
Lovelaceはセマンティックグラフのコーパスを作成するツールである。
このシステムはグラフ拡張文法を表現言語として利用する。
中心的なユースケースは、既存のコーパスを強化するための合成データの作成と、形式言語理論を教えるための教育ツールである。
論文 参考訳(メタデータ) (2023-09-15T19:10:19Z) - ConGraT: Self-Supervised Contrastive Pretraining for Joint Graph and Text Embeddings [20.25180279903009]
テキスト分散グラフ(TAG)におけるテキストとノードの分離表現を共同学習するためのContrastive Graph-Text Pretraining(ConGraT)を提案する。
提案手法は言語モデル(LM)とグラフニューラルネットワーク(GNN)を訓練し,CLIPにインスパイアされたバッチワイドコントラスト学習目標を用いて,それらの表現を共通の潜在空間に整列させる。
実験により、ConGraTは、ノードとテキストのカテゴリ分類、リンク予測、言語モデリングなど、さまざまな下流タスクのベースラインよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-05-23T17:53:30Z) - A Case Study for Compliance as Code with Graphs and Language Models:
Public release of the Regulatory Knowledge Graph [0.0]
この論文はアブダビのグローバルマーケット規制と分類に焦点を当てている。
規制の一部を手動でタグ付けし、BERTベースのモデルをトレーニングし、残りのコーパスに適用する。
タグ付けされたエンティティ間の関係を解析するために、参照解決と構文解析が使用された。
論文 参考訳(メタデータ) (2023-02-03T16:37:08Z) - GraphQ IR: Unifying Semantic Parsing of Graph Query Language with
Intermediate Representation [91.27083732371453]
本稿では,グラフクエリ言語,すなわちGraphQ IRに対する統合中間表現(IR)を提案する。
セマンティックギャップをブリッジするIRの自然言語のような表現と、グラフ構造を維持するための正式に定義された構文によって、ニューラルネットワークによるセマンティックパーシングは、ユーザクエリをより効果的にGraphQ IRに変換することができる。
我々のアプローチは、KQA Pro、Overnight、MetaQAにおける最先端のパフォーマンスを一貫して達成できます。
論文 参考訳(メタデータ) (2022-05-24T13:59:53Z) - GraphFormers: GNN-nested Transformers for Representation Learning on
Textual Graph [53.70520466556453]
階層的にGNNコンポーネントを言語モデルのトランスフォーマーブロックと一緒にネストするGraphFormerを提案する。
提案したアーキテクチャでは、テキストエンコーディングとグラフ集約を反復的なワークフローに融合する。
さらに、プログレッシブ・ラーニング・ストラテジーを導入し、そのモデルが操作されたデータと元のデータに基づいて連続的に訓練され、グラフ上の情報を統合する能力を強化する。
論文 参考訳(メタデータ) (2021-05-06T12:20:41Z) - Coordinate Constructions in English Enhanced Universal Dependencies:
Analysis and Computational Modeling [1.9950682531209154]
拡張ユニバーサル依存(UD)における座標構成の表現に対処する。
手動で編集した構文グラフの大規模なデータセットを作成する。
元のデータにおけるいくつかの系統的誤りを識別し、結合の伝播も提案する。
論文 参考訳(メタデータ) (2021-03-16T10:24:27Z) - Automatic Extraction of Rules Governing Morphological Agreement [103.78033184221373]
原文から第一パス文法仕様を抽出する自動フレームワークを開発する。
我々は、世界の多くの言語の文法の中核にあるモルフォシンタクティックな現象である合意を記述する規則の抽出に焦点をあてる。
我々のフレームワークはUniversal Dependenciesプロジェクトに含まれるすべての言語に適用され、有望な結果が得られます。
論文 参考訳(メタデータ) (2020-10-02T18:31:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。