論文の概要: A Document-based Knowledge Discovery with Microservices Architecture
- arxiv url: http://arxiv.org/abs/2407.00053v1
- Date: Thu, 13 Jun 2024 09:28:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-07 13:43:41.756963
- Title: A Document-based Knowledge Discovery with Microservices Architecture
- Title(参考訳): マイクロサービスアーキテクチャによるドキュメントベースの知識発見
- Authors: Habtom Kahsay Gidey, Mario Kesseler, Patrick Stangl, Peter Hillmann, Andreas Karcher,
- Abstract要約: 我々は、知識発見の文脈における重要な課題を指摘し、データベースアーキテクチャを用いてこれらに対処するためのアプローチを提示した。
提案手法は,キーワード抽出,文書の計算,自然言語の類似性,抽出した情報の言語に依存しない提供に焦点をあてた概念設計へと導いた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The first step towards digitalization within organizations lies in digitization - the conversion of analog data into digitally stored data. This basic step is the prerequisite for all following activities like the digitalization of processes or the servitization of products or offerings. However, digitization itself often leads to 'data-rich' but 'knowledge-poor' material. Knowledge discovery and knowledge extraction as approaches try to increase the usefulness of digitized data. In this paper, we point out the key challenges in the context of knowledge discovery and present an approach to addressing these using a microservices architecture. Our solution led to a conceptual design focusing on keyword extraction, similarity calculation of documents, database queries in natural language, and programming language independent provision of the extracted information. In addition, the conceptual design provides referential design guidelines for integrating processes and applications for semi-automatic learning, editing, and visualization of ontologies. The concept also uses a microservices architecture to address non-functional requirements, such as scalability and resilience. The evaluation of the specified requirements is performed using a demonstrator that implements the concept. Furthermore, this modern approach is used in the German patent office in an extended version.
- Abstract(参考訳): 組織内のデジタル化への第一歩は、デジタル化 — アナログデータのデジタルストアデータへの変換 — にあります。
この基本的なステップは、プロセスのデジタル化や製品や製品のサービテーションなど、次のすべての活動の前提となる。
しかし、デジタル化自体が「データ豊か」であるが「知識貧乏」につながることが多い。
アプローチとしての知識発見と知識抽出は、デジタル化されたデータの有用性を高めようとしている。
本稿では、知識発見の文脈における重要な課題を指摘し、マイクロサービスアーキテクチャを使ってこれらに対処するためのアプローチを提示します。
提案手法は,キーワード抽出,文書の類似性計算,自然言語によるデータベースクエリ,抽出した情報の独立した提供に焦点をあてた概念設計へと導いた。
さらに、概念設計は、オントロジーの半自動学習、編集、可視化のためのプロセスとアプリケーションを統合するための参照設計ガイドラインを提供する。
マイクロサービスアーキテクチャを使用して、スケーラビリティやレジリエンスといった非機能要件にも対処する。
特定の要件の評価は、その概念を実装したデモレータを用いて行われる。
さらに、この現代的なアプローチは、ドイツの特許庁で拡張版で使用されている。
関連論文リスト
- Customized Information and Domain-centric Knowledge Graph Construction with Large Language Models [0.0]
本稿では,構造化情報へのタイムリーなアクセスを実現するための知識グラフに基づく新しいアプローチを提案する。
本フレームワークは,情報検索,キーフレーズ抽出,セマンティックネットワーク生成,トピックマップ可視化などを含むテキストマイニングプロセスを含む。
当社の方法論を自動車電気システムの領域に適用して,スケーラブルなアプローチを実証する。
論文 参考訳(メタデータ) (2024-09-30T07:08:28Z) - Procedure Model for Building Knowledge Graphs for Industry Applications [0.0]
グラフベースの未接続情報とドメイン知識の統合は、新たな洞察を提供する。
本稿では,RDF知識グラフ構築のための実践的なステップバイステッププロシージャモデルを提案する。
論文 参考訳(メタデータ) (2024-09-20T11:46:37Z) - Data Efficient Training of a U-Net Based Architecture for Structured
Documents Localization [0.0]
構造化文書のローカライズのためのエンコーダデコーダアーキテクチャのような新しいU-NetであるSDL-Netを提案する。
本手法では,SDL-Netのエンコーダを,各種文書クラスのサンプルを含む汎用データセット上で事前学習することができる。
論文 参考訳(メタデータ) (2023-10-02T07:05:19Z) - Model-Driven Engineering Method to Support the Formalization of Machine
Learning using SysML [0.0]
本研究は,モデルベース工学を活用した機械学習タスクの協調的定義を支援する手法を提案する。
この方法は、様々なデータソースの識別と統合、データ属性間のセマンティックな関係の定義、データ処理ステップの定義をサポートする。
論文 参考訳(メタデータ) (2023-07-10T11:33:46Z) - Enterprise Model Library for Business-IT-Alignment [0.0]
この作業は、再利用の関数を持つモデルのためのリポジトリの参照アーキテクチャである。
これには、ファイリング用のデータ構造の設計、管理のためのプロセス、使用可能性が含まれる。
論文 参考訳(メタデータ) (2022-11-21T11:36:54Z) - What and How of Machine Learning Transparency: Building Bespoke
Explainability Tools with Interoperable Algorithmic Components [77.87794937143511]
本稿では,データ駆動予測モデルを説明するためのハンズオントレーニング教材について紹介する。
これらのリソースは、解釈可能な表現合成、データサンプリング、説明生成の3つのコアビルディングブロックをカバーする。
論文 参考訳(メタデータ) (2022-09-08T13:33:25Z) - Layout-Aware Information Extraction for Document-Grounded Dialogue:
Dataset, Method and Demonstration [75.47708732473586]
視覚的にリッチな文書から構造的知識と意味的知識の両方を抽出するためのレイアウト対応文書レベル情報抽出データセット(LIE)を提案する。
LIEには製品および公式文書の4,061ページから3つの抽出タスクの62kアノテーションが含まれている。
実験の結果、レイアウトはVRDベースの抽出に不可欠であることが示され、システムデモでは、抽出された知識が、ユーザが関心を持っている答えを見つけるのに役立つことも確認されている。
論文 参考訳(メタデータ) (2022-07-14T07:59:45Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - CateCom: a practical data-centric approach to categorization of
computational models [77.34726150561087]
本稿では,物理モデルとデータ駆動型計算モデルのランドスケープを整理する取り組みについて述べる。
オブジェクト指向設計の概念を適用し、オープンソース協調フレームワークの基礎を概説する。
論文 参考訳(メタデータ) (2021-09-28T02:59:40Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。