論文の概要: Rastro-DM: data mining with a trail
- arxiv url: http://arxiv.org/abs/2401.03925v1
- Date: Mon, 8 Jan 2024 14:39:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 16:07:14.243756
- Title: Rastro-DM: data mining with a trail
- Title(参考訳): Rastro-DM: トレイルによるデータマイニング
- Authors: Marcus Vinicius Borela de Castro and Remis Balaniuk
- Abstract要約: 本稿では,データマイニング(DM)プロジェクトであるRastro-DM(Trail Data Mining)の文書化手法を提案する。
計画された行動、訓練の完了、得られた結果、学んだ教訓の跡(ポルトガル語のRastro)を残すために、建設の背後にあるプロセスに焦点を当てている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This paper proposes a methodology for documenting data mining (DM) projects,
Rastro-DM (Trail Data Mining), with a focus not on the model that is generated,
but on the processes behind its construction, in order to leave a trail (Rastro
in Portuguese) of planned actions, training completed, results obtained, and
lessons learned. The proposed practices are complementary to structuring
methodologies of DM, such as CRISP-DM, which establish a methodological and
paradigmatic framework for the DM process. The application of best practices
and their benefits is illustrated in a project called 'Cladop' that was created
for the classification of PDF documents associated with the investigative
process of damages to the Brazilian Federal Public Treasury. Building the
Rastro-DM kit in the context of a project is a small step that can lead to an
institutional leap to be achieved by sharing and using the trail across the
enterprise.
- Abstract(参考訳): 本稿では,データマイニング(DM)プロジェクトであるRastro-DM(Trail Data Mining)の文書化手法を提案する。
提案手法は,DMプロセスの方法論的・パラダイム的な枠組みを確立するCRISP-DMなどのDMの方法論を補完するものである。
ベストプラクティスの適用とそのメリットは、ブラジル連邦財務省への損害調査プロセスに関連するPDF文書の分類のために作成された「クラドップ」と呼ばれるプロジェクトで説明されている。
プロジェクトのコンテキストでRastro-DMキットを構築することは、企業横断の道筋を共有し、利用することによって達成される制度的な飛躍に繋がる小さなステップです。
関連論文リスト
- AlpaPICO: Extraction of PICO Frames from Clinical Trial Documents Using LLMs [8.100885311316118]
近年,臨床治験報告の発行が急増しており,体系的レビューの実施が困難になっている。
臨床試験から人口、介入、比較、アウトカム(PICO)を自動的に抽出することは、体系的レビューを手作業で精査する伝統的な時間的プロセスを軽減することができる。
本研究では, LLMの事前学習期間中に収集されたLarge Language Models (LLMs) の事前学習知識を用いてICL戦略を採用し, PICO関連用語を自動的に抽出する。
論文 参考訳(メタデータ) (2024-09-15T11:53:24Z) - Pairing Analogy-Augmented Generation with Procedural Memory for Procedural Q&A [18.509344327269776]
本稿では,LangChainチュートリアルから作成したLCStepという新しい手続き型知識データセットを提案する。
この手続き的知識を活用して新しい課題を解決するために、類推強化世代(AAG)を提案する。
AAGは、過去の経験を同化して馴染みのない問題を解決する人間の能力からインスピレーションを得ている。
論文 参考訳(メタデータ) (2024-09-02T15:58:24Z) - Re-Thinking Process Mining in the AI-Based Agents Era [39.58317527488534]
大規模言語モデル(LLM)は強力な対話インタフェースとして登場し、プロセスマイニング(PM)タスクにおけるその応用は有望な結果を示している。
本稿では,LLMにおけるPMの有効性を高めるために,AIベースのエージェント(AgWf)パラダイムを活用することを提案する。
我々はAgWfの様々な実装とAIベースのタスクの種類について検討する。
論文 参考訳(メタデータ) (2024-08-14T10:14:18Z) - Bayesian Diffusion Models for 3D Shape Reconstruction [54.69889488052155]
本稿では,トップダウン(優先)情報をボトムアップ(データ駆動)手順と密結合することにより,効果的なベイズ推定を行う予測アルゴリズムを提案する。
3次元形状復元作業におけるBDMの有効性を示す。
論文 参考訳(メタデータ) (2024-03-11T17:55:53Z) - AL-iGAN: An Active Learning Framework for Tunnel Geological
Reconstruction Based on TBM Operational Data [70.99694324397903]
地下トンネル掘削機 (TBM) では, トンネル内に分布する岩盤のタイプを正確に記述することで, 建設リスクを低減できる。
TBM操作データに基づくトンネル地質復元のためのアクティブラーニングフレームワークAL-iGANを提案する。
論文 参考訳(メタデータ) (2022-12-02T04:39:58Z) - RDU: A Region-based Approach to Form-style Document Understanding [69.29541701576858]
キー情報抽出(KIE)は,フォーム形式の文書から構造化された情報を抽出することを目的としている。
我々は、Rerea-based Understanding Document (RDU) と呼ばれる新しいKIEモデルを開発する。
RDUは文書のテキスト内容と対応する座標を入力として、バウンディングボックスのような領域をローカライズして結果を予測しようとする。
論文 参考訳(メタデータ) (2022-06-14T14:47:48Z) - Investigation of Topic Modelling Methods for Understanding the Reports
of the Mining Projects in Queensland [2.610470075814367]
鉱業では、プロジェクト管理プロセスにおいて多くの報告が生成される。
ドキュメントクラスタリングは、この問題に対処するための強力なアプローチです。
The three method, Latent Dirichlet Allocation (LDA), Non negative Matrix Factorization (NMF), Non negative Factorization (NTF) were compared。
論文 参考訳(メタデータ) (2021-11-05T15:52:03Z) - CINS: Comprehensive Instruction for Few-shot Learning in Task-oriented
Dialog Systems [56.302581679816775]
本稿では,タスク固有の命令でPLMを利用する包括的インストラクション(CINS)を提案する。
命令のスキーマ(定義、制約、プロンプト)と、ToDの3つの重要な下流タスクに対するカスタマイズされた実現を設計する。
これらのToDタスクに対して,小さな検証データを用いた現実的な数ショット学習シナリオで実験を行った。
論文 参考訳(メタデータ) (2021-09-10T03:23:06Z) - Process Discovery for Structured Program Synthesis [70.29027202357385]
プロセスマイニングにおける中核的なタスクは、イベントログデータから正確なプロセスモデルを学ぶことを目的としたプロセス発見である。
本稿では,ターゲットプロセスモデルとして(ブロック-)構造化プログラムを直接使用することを提案する。
我々は,このような構造化プログラムプロセスモデルの発見に対して,新たなボトムアップ・アグリメティブ・アプローチを開発する。
論文 参考訳(メタデータ) (2020-08-13T10:33:10Z) - Learning to Summarize Passages: Mining Passage-Summary Pairs from
Wikipedia Revision Histories [110.54963847339775]
ウィキペディアページのリビジョン履歴をマイニングすることで,パス・トゥ・サマリーデータセットを自動構築する手法を提案する。
特に、本手法では、ページに追加される本体の通路と導入文を同時にマイニングする。
構築されたデータセットは、100万以上のパス・サマー・ペアを含む。
論文 参考訳(メタデータ) (2020-04-06T12:11:50Z) - Automatic Business Process Structure Discovery using Ordered Neurons
LSTM: A Preliminary Study [6.6599132213053185]
本稿では,ニューラルネットワークの構築により,ビジネスプロセス文書に存在する潜在意味階層構造を検索する。
我々は,実践的なロボットプロセス自動化(RPA)プロジェクトから提案したプロセス記述文書(PDD)のデータセットに対するアプローチを検証した。
論文 参考訳(メタデータ) (2020-01-05T14:19:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。