論文の概要: Text Analysis Using Deep Neural Networks in Digital Humanities and
Information Science
- arxiv url: http://arxiv.org/abs/2307.16217v1
- Date: Sun, 30 Jul 2023 12:54:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 16:58:18.182289
- Title: Text Analysis Using Deep Neural Networks in Digital Humanities and
Information Science
- Title(参考訳): デジタル人文科学におけるディープニューラルネットワークを用いたテキスト解析
- Authors: Omri Suissa, Avshalom Elmalech, Maayan Zhitomirsky-Geffet
- Abstract要約: ディープニューラルネットワーク(DNN)は、自動テキスト分析と自然言語処理(NLP)の分野を支配している
DNNは、Digital Humanities (DH)研究に関連する多くのNLPタスクを解決する最先端の機械学習アルゴリズムである。
DH研究におけるテキストリソースの分析にDNNを用いることで、(未)トレーニングデータの可用性とドメイン適応の必要性の2つの大きな課題が提示される。
- 参考スコア(独自算出の注目度): 0.934612743192798
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Combining computational technologies and humanities is an ongoing effort
aimed at making resources such as texts, images, audio, video, and other
artifacts digitally available, searchable, and analyzable. In recent years,
deep neural networks (DNN) dominate the field of automatic text analysis and
natural language processing (NLP), in some cases presenting a super-human
performance. DNNs are the state-of-the-art machine learning algorithms solving
many NLP tasks that are relevant for Digital Humanities (DH) research, such as
spell checking, language detection, entity extraction, author detection,
question answering, and other tasks. These supervised algorithms learn patterns
from a large number of "right" and "wrong" examples and apply them to new
examples. However, using DNNs for analyzing the text resources in DH research
presents two main challenges: (un)availability of training data and a need for
domain adaptation. This paper explores these challenges by analyzing multiple
use-cases of DH studies in recent literature and their possible solutions and
lays out a practical decision model for DH experts for when and how to choose
the appropriate deep learning approaches for their research. Moreover, in this
paper, we aim to raise awareness of the benefits of utilizing deep learning
models in the DH community.
- Abstract(参考訳): 計算技術と人文科学を組み合わせることは、テキスト、画像、音声、ビデオ、その他のアーティファクトのデジタル化、検索、アナリザブル化を目標とする継続的な取り組みである。
近年、ディープニューラルネットワーク(DNN)は、自動テキスト分析と自然言語処理(NLP)の分野を支配しており、超人的なパフォーマンスを示す場合もある。
DNNは、スペルチェック、言語検出、エンティティ抽出、著者検出、質問応答など、DH(Digital Humanities)研究に関連する多くのNLPタスクを解決する最先端の機械学習アルゴリズムである。
これらの教師付きアルゴリズムは、多数の"right"と"wrong"の例からパターンを学び、新しい例に適用する。
しかし、DH研究におけるテキストリソースの分析にDNNを用いることで、トレーニングデータの有効性とドメイン適応の必要性の2つの主な課題が提示される。
本稿では,近年の文献におけるDH研究の活用事例とその可能性について分析し,DHの専門家がいつ,どのように適切な深層学習アプローチを選択するかの実践的決定モデルを構築した。
さらに,本稿では,DHコミュニティにおける深層学習モデルの活用によるメリットに対する意識を高めることを目的とする。
関連論文リスト
- Diagnostic Reasoning in Natural Language: Computational Model and Application [68.47402386668846]
言語基底タスク(NL-DAR)の文脈における診断誘導推論(DAR)について検討する。
パール構造因果モデルに基づくNL-DARの新しいモデリングフレームワークを提案する。
得られたデータセットを用いて,NL-DARにおける人間の意思決定過程を解析する。
論文 参考訳(メタデータ) (2024-09-09T06:55:37Z) - Artificial intelligence to automate the systematic review of scientific
literature [0.0]
我々は過去15年間に提案されたAI技術について,研究者が科学的文献の体系的な分析を行うのを助けるために調査を行った。
現在サポートされているタスク、適用されるアルゴリズムの種類、34の初等研究で提案されているツールについて説明する。
論文 参考訳(メタデータ) (2024-01-13T19:12:49Z) - Combatting Human Trafficking in the Cyberspace: A Natural Language
Processing-Based Methodology to Analyze the Language in Online Advertisements [55.2480439325792]
このプロジェクトは、高度自然言語処理(NLP)技術により、オンラインC2Cマーケットプレースにおける人身売買の急激な問題に取り組む。
我々は、最小限の監督で擬似ラベル付きデータセットを生成する新しい手法を導入し、最先端のNLPモデルをトレーニングするための豊富なリソースとして機能する。
重要な貢献は、Integrated Gradientsを使った解釈可能性フレームワークの実装であり、法執行にとって重要な説明可能な洞察を提供する。
論文 参考訳(メタデータ) (2023-11-22T02:45:01Z) - Surveying the Landscape of Text Summarization with Deep Learning: A
Comprehensive Review [2.4185510826808487]
ディープラーニングは、言語データの複雑な表現を学習できるモデルの開発を可能にすることによって、自然言語処理(NLP)に革命をもたらした。
NLPのディープラーニングモデルは、通常、大量のデータを使用してディープニューラルネットワークをトレーニングし、言語データ内のパターンと関係を学習する。
テキスト要約にディープラーニングを適用することは、テキスト要約タスクを実行するためにディープニューラルネットワークを使用することを指す。
論文 参考訳(メタデータ) (2023-10-13T21:24:37Z) - Unveiling the frontiers of deep learning: innovations shaping diverse
domains [6.951472438774211]
ディープラーニング(DL)は、学習、視覚化、最適化、精錬、予測が可能なコンピュータモデルの開発を可能にする。
DLは、オーディオ視覚データ処理、農業、交通予測、自然言語、バイオメディシン、災害管理、バイオインフォマティクス、薬物設計、ゲノム学、顔認識、生態学など、様々な分野に適用されている。
本稿では,すべての研究分野におけるディープラーニングの適用可能性と,関連するメリットと課題について検討する。
論文 参考訳(メタデータ) (2023-09-06T04:50:39Z) - Mitigating Data Scarcity for Large Language Models [7.259279261659759]
近年,事前学習型ニューラルネットワークモデル (PNLM) が嵐による自然言語処理の分野に進出している。
データ不足は、医学などの専門分野や、AI研究によって調査されていない低リソース言語でよく見られる。
この論文では、データ強化とニューラルアンサンブル学習技術を用いて、データの不足を軽減することに焦点を当てる。
論文 参考訳(メタデータ) (2023-02-03T15:17:53Z) - A Survey of Deep Learning for Mathematical Reasoning [71.88150173381153]
我々は過去10年間の数学的推論とディープラーニングの交差点における重要なタスク、データセット、方法についてレビューする。
大規模ニューラルネットワークモデルの最近の進歩は、新しいベンチマークと、数学的推論にディープラーニングを使用する機会を開放している。
論文 参考訳(メタデータ) (2022-12-20T18:46:16Z) - Human-in-the-Loop Disinformation Detection: Stance, Sentiment, or
Something Else? [93.91375268580806]
政治とパンデミックは、機械学習対応の偽ニュース検出アルゴリズムの開発に十分な動機を与えている。
既存の文献は、主に完全自動化されたケースに焦点を当てているが、その結果得られた技術は、軍事応用に必要な様々なトピック、ソース、時間スケールに関する偽情報を確実に検出することはできない。
既に利用可能なアナリストを人間のループとして活用することにより、感情分析、アスペクトベースの感情分析、姿勢検出といった標準的な機械学習技術は、部分的に自動化された偽情報検出システムに使用するためのもっとも有効な方法となる。
論文 参考訳(メタデータ) (2021-11-09T13:30:34Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - NAS-Navigator: Visual Steering for Explainable One-Shot Deep Neural
Network Synthesis [53.106414896248246]
本稿では,分析者がドメイン知識を注入することで,解のサブグラフ空間を効果的に構築し,ネットワーク探索をガイドするフレームワークを提案する。
このテクニックを反復的に適用することで、アナリストは、与えられたアプリケーションに対して最高のパフォーマンスのニューラルネットワークアーキテクチャに収束することができる。
論文 参考訳(メタデータ) (2020-09-28T01:48:45Z) - Natural Language Processing Advancements By Deep Learning: A Survey [0.755972004983746]
この調査は、ディープラーニングの恩恵を受けたNLPのさまざまな側面と応用を分類し、対処する。
コアNLPタスクとアプリケーションをカバーするもので、深層学習手法とモデルがどのようにこれらの領域を前進させるかを記述している。
論文 参考訳(メタデータ) (2020-03-02T21:32:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。