論文の概要: Data Readiness for Natural Language Processing
- arxiv url: http://arxiv.org/abs/2009.02043v2
- Date: Wed, 30 Sep 2020 12:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 01:31:31.072806
- Title: Data Readiness for Natural Language Processing
- Title(参考訳): 自然言語処理のためのデータ準備
- Authors: Fredrik Olsson, Magnus Sahlgren
- Abstract要約: この文書は、機械学習と自然言語処理の文脈におけるデータの準備性に関するものである。
自動分析手法を促進するために、組織がどのようにしてデータの特定、作成、検証、準備を進めていくかを説明している。
- 参考スコア(独自算出の注目度): 3.6296396308298795
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This document concerns data readiness in the context of machine learning and
Natural Language Processing. It describes how an organization may proceed to
identify, make available, validate, and prepare data to facilitate automated
analysis methods. The contents of the document is based on the practical
challenges and frequently asked questions we have encountered in our work as an
applied research institute with helping organizations and companies, both in
the public and private sectors, to use data in their business processes.
- Abstract(参考訳): この文書は、機械学習と自然言語処理の文脈におけるデータの準備性に関するものである。
自動分析手法を促進するために、組織がどのようにしてデータの特定、作成、検証、準備を進めていくかを説明している。
ドキュメントの内容は、当社の応用研究所としての取り組みで遭遇した課題と頻繁な質問に基づいており、公的および民間の両方の組織や企業がビジネスプロセスでデータを使用するように支援しています。
関連論文リスト
- Automating the Information Extraction from Semi-Structured Interview
Transcripts [0.0]
本稿では,半構造化面接書から情報を取り出す自動システムの開発と応用について検討する。
本稿では,研究者がインタビューデータのテーマ構造を効率的に処理し,視覚化できる,ユーザフレンドリーなソフトウェアプロトタイプを提案する。
論文 参考訳(メタデータ) (2024-03-07T13:53:03Z) - Combatting Human Trafficking in the Cyberspace: A Natural Language
Processing-Based Methodology to Analyze the Language in Online Advertisements [55.2480439325792]
このプロジェクトは、高度自然言語処理(NLP)技術により、オンラインC2Cマーケットプレースにおける人身売買の急激な問題に取り組む。
我々は、最小限の監督で擬似ラベル付きデータセットを生成する新しい手法を導入し、最先端のNLPモデルをトレーニングするための豊富なリソースとして機能する。
重要な貢献は、Integrated Gradientsを使った解釈可能性フレームワークの実装であり、法執行にとって重要な説明可能な洞察を提供する。
論文 参考訳(メタデータ) (2023-11-22T02:45:01Z) - Natural language processing on customer note data [3.0828074702828623]
音符から正確な感情を自動的に抽出でき、音符は関連性によって異なる話題に分類できることを示す。
明確な分離トピックがなければ、ビジネスコンテキストとの関連性が欠如していることが分かっています。
論文 参考訳(メタデータ) (2023-05-03T10:36:56Z) - Privacy-Preserving Machine Learning for Collaborative Data Sharing via
Auto-encoder Latent Space Embeddings [57.45332961252628]
データ共有プロセスにおけるプライバシ保護機械学習は、極めて重要なタスクである。
本稿では、オートエンコーダによる表現学習を用いて、プライバシーを保護した組込みデータを生成する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-10T17:36:58Z) - Process-BERT: A Framework for Representation Learning on Educational
Process Data [68.8204255655161]
本稿では,教育プロセスデータの表現を学習するためのフレームワークを提案する。
我々のフレームワークは、BERT型の目的を用いて、シーケンシャルなプロセスデータから表現を学習する事前学習ステップで構成されています。
当社のフレームワークは,2019年国のレポートカードデータマイニングコンペティションデータセットに適用しています。
論文 参考訳(メタデータ) (2022-04-28T16:07:28Z) - PET: A new Dataset for Process Extraction from Natural Language Text [15.16406344719132]
我々は、アクティビティ、ゲートウェイ、アクター、フロー情報に注釈を付けた、ビジネスプロセス記述の最初のコーパスを開発する。
我々は、アノテーションスキーマとガイドラインの詳細な概要や、テキストからビジネスプロセスを抽出することの難しさと難しさをベンチマークするための様々なベースラインを含む、新しいリソースを提示する。
論文 参考訳(メタデータ) (2022-03-09T16:33:59Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - Extracting Semantic Process Information from the Natural Language in
Event Logs [0.1827510863075184]
本稿では、イベントデータの意味的役割ラベリングという手法を提案する。
この方法では,イベント毎に最大8つの意味的役割に関する情報を抽出する。
論文 参考訳(メタデータ) (2021-03-06T08:39:04Z) - Text Mining for Processing Interview Data in Computational Social
Science [0.6820436130599382]
我々は、市販のテキスト分析技術を用いて、計算社会科学研究からのインタビューテキストデータを処理する。
局所的クラスタリングと用語的エンリッチメントが,応答の探索と定量化に有用であることがわかった。
我々は社会科学の研究にテキスト分析を使うことを奨励し、特に探索的オープンエンドな研究に力を入れている。
論文 参考訳(メタデータ) (2020-11-28T00:44:35Z) - A Survey of Deep Learning Approaches for OCR and Document Understanding [68.65995739708525]
我々は、英語で書かれた文書の文書理解のための様々な手法をレビューする。
文献に現れる方法論を集約し,この領域を探索する研究者の跳躍点として機能させる。
論文 参考訳(メタデータ) (2020-11-27T03:05:59Z) - Knowledge-Aware Procedural Text Understanding with Multi-Stage Training [110.93934567725826]
本稿では,このような文書の理解とプロセス中のエンティティの状態や場所の追跡を目的とした手続き的テキスト理解の課題に焦点をあてる。
常識的推論の難しさとデータ不足という2つの課題はまだ未解決のままである。
我々は、複数の外部知識を効果的に活用する、KnOwledge-Aware ProceduraL text understAnding (KOALA)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-28T10:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。