論文の概要: Towards Safer Operations: An Expert-involved Dataset of High-Pressure
Gas Incidents for Preventing Future Failures
- arxiv url: http://arxiv.org/abs/2310.12074v2
- Date: Mon, 23 Oct 2023 08:01:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 06:01:29.603994
- Title: Towards Safer Operations: An Expert-involved Dataset of High-Pressure
Gas Incidents for Preventing Future Failures
- Title(参考訳): 安全対策に向けて:高圧ガス事故の専門的データセットによる今後の失敗防止
- Authors: Shumpei Inoue, Minh-Tien Nguyen, Hiroki Mizokuchi, Tuan-Anh D. Nguyen,
Huu-Hiep Nguyen, Dung Tien Le
- Abstract要約: 本稿では,安全対策のための新しいインシデントAIデータセットを提案する。
データセットは、名前付きエンティティ認識、原因効果抽出、情報検索の3つのタスクから構成される。
安全対策のシナリオにおけるデータセットの貢献を検証した。
- 参考スコア(独自算出の注目度): 4.61913477588949
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a new IncidentAI dataset for safety prevention.
Different from prior corpora that usually contain a single task, our dataset
comprises three tasks: named entity recognition, cause-effect extraction, and
information retrieval. The dataset is annotated by domain experts who have at
least six years of practical experience as high-pressure gas conservation
managers. We validate the contribution of the dataset in the scenario of safety
prevention. Preliminary results on the three tasks show that NLP techniques are
beneficial for analyzing incident reports to prevent future failures. The
dataset facilitates future research in NLP and incident management communities.
The access to the dataset is also provided (the IncidentAI dataset is available
at: https://github.com/Cinnamon/incident-ai-dataset).
- Abstract(参考訳): 本稿では,安全対策のための新しいインシデントAIデータセットを提案する。
通常、1つのタスクを含む以前のコーパスとは異なり、データセットは名前付きエンティティ認識、原因効果抽出、情報検索の3つのタスクで構成される。
このデータセットは、高圧ガス保存マネージャとして少なくとも6年間の実践経験を持つドメインの専門家によってアノテートされている。
安全対策のシナリオにおけるデータセットの貢献を検証した。
3つのタスクの予備的な結果から、NLP技術はインシデントレポートの分析に有用であり、将来の障害を防ぐことができる。
このデータセットは、NLPとインシデント管理コミュニティにおける将来の研究を促進する。
データセットへのアクセスも提供されている(incidentaiデータセットはhttps://github.com/cinnamon/incident-ai-dataset)。
関連論文リスト
- Beyond the Safety Bundle: Auditing the Helpful and Harmless Dataset [4.522849055040843]
この研究は、Helpful and Harmless データセットを Anthropic で監査した。
本研究は,大規模言語モデルにおける安全性軽減のための,よりニュアンスで文脈に敏感なアプローチの必要性を浮き彫りにした。
論文 参考訳(メタデータ) (2024-11-12T23:43:20Z) - Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models [79.65071553905021]
所望のデータセットの特徴を考慮したデータ生成手法であるデータアドバイザを提案する。
Data Advisorは生成されたデータの状態を監視し、現在のデータセットの弱点を特定し、データ生成の次のイテレーションをアドバイスする。
論文 参考訳(メタデータ) (2024-10-07T17:59:58Z) - Overcoming Imbalanced Safety Data Using Extended Accident Triangle [1.1249583407496222]
既存の安全分析研究は目覚ましい進歩を遂げているが、不均衡なデータセットに悩まされている。
我々は,事故の重大度,事故頻度,事故タイプといった特徴に基づいて,データサンプルの重要性を主張するために,事故三角形の理論を拡張した。
さまざまな機械学習アルゴリズムの間で、堅牢な改善が見られます。
論文 参考訳(メタデータ) (2024-08-12T00:36:17Z) - Large Language Models for Next Point-of-Interest Recommendation [53.93503291553005]
位置情報ベースのソーシャルネットワーク(LBSN)データは、しばしば次のPoint of Interest(POI)レコメンデーションタスクに使用される。
しばしば無視される課題の1つは、LBSNデータに存在する豊富なコンテキスト情報を効果的に利用する方法である。
本稿では,この課題に対処するために,LLM(Large Language Models)を用いたフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-19T13:28:36Z) - A Forecasting-Based DLP Approach for Data Security [0.0]
本稿では,将来ユーザのデータアクセス可能性を予測するために,データ統計解析を用いる。
提案手法は, モデルへの学習・学習において, 名高い単項線形関数を用いる。
論文 参考訳(メタデータ) (2023-12-21T10:14:27Z) - LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。
しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。
カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文 参考訳(メタデータ) (2023-06-14T05:48:36Z) - Towards Generalizable Data Protection With Transferable Unlearnable
Examples [50.628011208660645]
本稿では、転送不可能な例を生成することによって、新しい一般化可能なデータ保護手法を提案する。
私たちの知る限りでは、これはデータ分散の観点からデータのプライバシを調べる最初のソリューションです。
論文 参考訳(メタデータ) (2023-05-18T04:17:01Z) - IPProtect: protecting the intellectual property of visual datasets
during data valuation [8.092563412918128]
データバリュエーション中に共有する必要があるデータセットのIPをプリエンプティブに保護する新しいタスクに取り組む。
まず、視覚データセットにおける2種類の新しいIPリスク、すなわち、データイテム(画像)IPと統計(データセット)IPを特定し、形式化する。
論文 参考訳(メタデータ) (2022-12-22T03:36:19Z) - PeSOTIF: a Challenging Visual Dataset for Perception SOTIF Problems in
Long-tail Traffic Scenarios [12.17821905210185]
本稿では,複数の資源から収集した長距離交通シナリオの高品質なデータセットを提供する。
確率的オブジェクト検出(POD)の開発を考えると、このデータセットは、シナリオ内のSOTIF問題をキーオブジェクトとして認識する原因となるかもしれないトリガー源を示す。
本稿では、このデータセットをSOTIF研究に活用する方法を示すために、SOTIFエントロピーの知覚を定量化し、シナリオが未知であり、認識システムに安全でないかどうかを確認する。
論文 参考訳(メタデータ) (2022-11-07T10:07:30Z) - Predicting Seriousness of Injury in a Traffic Accident: A New Imbalanced
Dataset and Benchmark [62.997667081978825]
本稿では,交通事故における傷害の重大性を予測するために,機械学習アルゴリズムの性能を評価する新しいデータセットを提案する。
データセットは、英国運輸省から公開されているデータセットを集約することで作成される。
論文 参考訳(メタデータ) (2022-05-20T21:15:26Z) - MAVEN: A Massive General Domain Event Detection Dataset [56.00401399384715]
イベント検出(ED)は、プレーンテキストからイベント知識を抽出する最初の、最も基本的なステップである。
既存のデータセットは、EDのさらなる開発を制限する問題を示す。
我々は,4,480のウィキペディア文書,118,732のイベント参照インスタンス,168のイベントタイプを含むMAVEN(Massive eVENt detection dataset)を提案する。
論文 参考訳(メタデータ) (2020-04-28T15:25:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。