論文の概要: Toward the Automated Construction of Probabilistic Knowledge Graphs for
the Maritime Domain
- arxiv url: http://arxiv.org/abs/2305.02471v1
- Date: Thu, 4 May 2023 00:24:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 17:37:00.367261
- Title: Toward the Automated Construction of Probabilistic Knowledge Graphs for
the Maritime Domain
- Title(参考訳): 海事領域における確率的知識グラフの自動構築に向けて
- Authors: Fatemeh Shiri, Teresa Wang, Shirui Pan, Xiaojun Chang, Yuan-Fang Li,
Reza Haffari, Van Nguyen, Shuang Yu
- Abstract要約: 国際海事犯罪はますます高度化しており、より広い犯罪ネットワークと結びついていることが多い。
これは、ハードデータと他のタイプのデータを組み合わせることを目的とした研究と開発に繋がった。
本稿では,確率的知識グラフの自動構築のためのプロトタイプであるMaritime DeepDiveを提案する。
- 参考スコア(独自算出の注目度): 60.76554773885988
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: International maritime crime is becoming increasingly sophisticated, often
associated with wider criminal networks. Detecting maritime threats by means of
fusing data purely related to physical movement (i.e., those generated by
physical sensors, or hard data) is not sufficient. This has led to research and
development efforts aimed at combining hard data with other types of data
(especially human-generated or soft data). Existing work often assumes that
input soft data is available in a structured format, or is focused on
extracting certain relevant entities or concepts to accompany or annotate hard
data. Much less attention has been given to extracting the rich knowledge about
the situations of interest implicitly embedded in the large amount of soft data
existing in unstructured formats (such as intelligence reports and news
articles). In order to exploit the potentially useful and rich information from
such sources, it is necessary to extract not only the relevant entities and
concepts but also their semantic relations, together with the uncertainty
associated with the extracted knowledge (i.e., in the form of probabilistic
knowledge graphs). This will increase the accuracy of and confidence in, the
extracted knowledge and facilitate subsequent reasoning and learning. To this
end, we propose Maritime DeepDive, an initial prototype for the automated
construction of probabilistic knowledge graphs from natural language data for
the maritime domain. In this paper, we report on the current implementation of
Maritime DeepDive, together with preliminary results on extracting
probabilistic events from maritime piracy incidents. This pipeline was
evaluated on a manually crafted gold standard, yielding promising results.
- Abstract(参考訳): 国際海事犯罪はますます高度化しており、しばしばより広範な犯罪ネットワークと結びついている。
物理的な動き(物理的センサーやハードデータによって生成されたもの)と純粋に関連するデータを融合させることで海洋の脅威を検出することは十分ではない。
これにより、ハードデータと他の種類のデータ(特に人造データやソフトデータ)を組み合わせる研究や開発が進められている。
既存の作業では、入力されたソフトデータが構造化されたフォーマットで利用可能であると仮定したり、ハードデータを添付したり注釈付けしたりするための特定の関連するエンティティや概念の抽出に重点を置いている場合が多い。
非構造化形式(インテリジェンスレポートやニュース記事など)に存在する大量のソフトデータに暗黙的に埋め込まれた関心のある状況に関する豊富な知識を抽出することにはあまり注意が払われていない。
このような情報源から潜在的に有用で豊富な情報を活用するためには、関連する実体や概念だけでなく、その意味関係も抽出された知識(確率的知識グラフの形で)に関連する不確実性とともに抽出する必要がある。
これにより、抽出された知識の正確性と信頼性を高め、その後の推論と学習を促進する。
そこで本研究では,海洋領域の自然言語データから確率的知識グラフを自動構築するためのプロトタイプであるMaritime DeepDiveを提案する。
本稿では,海事海賊事件から発生した確率的事象の抽出に関する予備的な結果とともに,海事深層調査の実施状況について報告する。
このパイプラインは手作業による金の標準で評価され、有望な結果を得た。
関連論文リスト
- Epidemiology-informed Network for Robust Rumor Detection [59.89351792706995]
本稿では, 疫学知識を統合し, 性能を高めるための新しい疫学情報ネットワーク(EIN)を提案する。
疫学理論をうわさ検出に適応させるため,各利用者が情報源情報に対する姿勢を付加することが期待されている。
実験結果から,提案したEINは実世界のデータセット上で最先端の手法より優れるだけでなく,樹木の深度にまたがる堅牢性も向上することが示された。
論文 参考訳(メタデータ) (2024-11-20T00:43:32Z) - Maximizing Relation Extraction Potential: A Data-Centric Study to Unveil Challenges and Opportunities [3.8087810875611896]
本稿では,ニューラルリレーション抽出を阻害するデータ中心特性について検討する。
それは、文脈の曖昧さ、関係関係の関連、長い尾のデータ、きめ細かい関係の分布など、重要な問題を強調している。
これらの問題を緩和するための将来の方向性を示すマーカーをセットし、初心者や先進的な研究者にとって重要なリソースであることを証明している。
論文 参考訳(メタデータ) (2024-09-07T23:40:47Z) - Beyond Privacy: Navigating the Opportunities and Challenges of Synthetic
Data [91.52783572568214]
合成データは、機械学習の世界において支配的な力となり、データセットを個々のニーズに合わせて調整できる未来を約束する。
合成データのより広範な妥当性と適用のために,コミュニティが克服すべき根本的な課題について論じる。
論文 参考訳(メタデータ) (2023-04-07T16:38:40Z) - Smart Agriculture : A Novel Multilevel Approach for Agricultural Risk
Assessment over Unstructured Data [0.5735035463793008]
不確実性とは、将来何が起こるかわからない状態を指す。
本稿では、自然言語処理と機械学習技術を活用して不確実性をモデル化し、大量のテキストデータを用いて各不確実性クラスタのリスクレベルを評価することを目的とする。
論文 参考訳(メタデータ) (2022-11-22T16:47:47Z) - Neuro-Symbolic Artificial Intelligence (AI) for Intent based Semantic
Communication [85.06664206117088]
6Gネットワークはデータ転送のセマンティクスと有効性(エンドユーザ)を考慮する必要がある。
観測データの背後にある因果構造を学習するための柱としてNeSy AIが提案されている。
GFlowNetは、無線システムにおいて初めて活用され、データを生成する確率構造を学ぶ。
論文 参考訳(メタデータ) (2022-05-22T07:11:57Z) - Audacity of huge: overcoming challenges of data scarcity and data
quality for machine learning in computational materials discovery [1.0036312061637764]
機械学習(ML)に加速された発見は、予測構造とプロパティの関係を明らかにするために大量の高忠実度データを必要とする。
材料発見に関心を持つ多くの特性において、データ生成の挑戦的な性質と高いコストは、人口が少なく、疑わしい品質を持つデータランドスケープを生み出している。
手作業によるキュレーションがなければ、より洗練された自然言語処理と自動画像解析により、文献から構造-プロパティ関係を学習できるようになる。
論文 参考訳(メタデータ) (2021-11-02T21:43:58Z) - Iterative Rule Extension for Logic Analysis of Data: an MILP-based
heuristic to derive interpretable binary classification from large datasets [0.6526824510982799]
この研究は、最大10,000のサンプルとサンプル特性を持つデータからDNFのブールフレーズを抽象化するアルゴリズムIRELANDを提示する。
その結果、大規模なデータセットIRELANDは現在の最先端よりも優れており、現在のモデルがメモリを使い果たしたり、過剰なランタイムを必要とするデータセットのソリューションを見つけることができることがわかった。
論文 参考訳(メタデータ) (2021-10-25T13:31:30Z) - A Bayesian Framework for Information-Theoretic Probing [51.98576673620385]
我々は、探索は相互情報を近似するものとみなすべきであると論じる。
これは、表現が元の文とターゲットタスクに関する全く同じ情報をエンコードしているというかなり直感的な結論を導いた。
本稿では,ベイズ的相互情報(Bayesian mutual information)と呼ぶものを測定するための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-09-08T18:08:36Z) - Incorporating Causal Graphical Prior Knowledge into Predictive Modeling
via Simple Data Augmentation [92.96204497841032]
因果グラフ(CG)は、データ分散の背後にあるデータ生成プロセスの知識のコンパクトな表現である。
本研究では,条件付き独立性(CI)関係の事前知識を活用可能なモデルに依存しないデータ拡張手法を提案する。
本手法は,小データシステムにおける予測精度の向上に有効であることを実験的に示した。
論文 参考訳(メタデータ) (2021-02-27T06:13:59Z) - Occams Razor for Big Data? On Detecting Quality in Large Unstructured
Datasets [0.0]
分析複雑性への新たな傾向は、科学におけるパシモニーやオッカム・ラザーの原理にとって深刻な課題である。
データクラスタリングのための計算的ビルディングブロックアプローチは、最小の計算時間で大規模な非構造化データセットを扱うのに役立つ。
このレビューは、東西の文化的な違いがビッグデータ分析の過程にどのように影響するかを結論付けている。
論文 参考訳(メタデータ) (2020-11-12T16:06:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。