論文の概要: A Legal Framework for Natural Language Processing Model Training in Portugal
- arxiv url: http://arxiv.org/abs/2405.00536v1
- Date: Wed, 1 May 2024 14:18:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-02 15:27:48.915220
- Title: A Legal Framework for Natural Language Processing Model Training in Portugal
- Title(参考訳): ポルトガルにおける自然言語処理モデルトレーニングのための法的枠組み
- Authors: Rúben Almeida, Evelin Amorim,
- Abstract要約: 本報告では,NLPの日常的使用事例を概説するとともに,その発展にともなうポルトガルの法律について述べる。
本稿では,このコミュニケーションギャップを埋め,よりコンプライアンスの高いポルトガルのNLP研究を促進することを目的としている。
- 参考スコア(独自算出の注目度): 0.2455468619225742
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advances in deep learning have promoted the advent of many computational systems capable of performing intelligent actions that, until then, were restricted to the human intellect. In the particular case of human languages, these advances allowed the introduction of applications like ChatGPT that are capable of generating coherent text without being explicitly programmed to do so. Instead, these models use large volumes of textual data to learn meaningful representations of human languages. Associated with these advances, concerns about copyright and data privacy infringements caused by these applications have emerged. Despite these concerns, the pace at which new natural language processing applications continued to be developed largely outperformed the introduction of new regulations. Today, communication barriers between legal experts and computer scientists motivate many unintentional legal infringements during the development of such applications. In this paper, a multidisciplinary team intends to bridge this communication gap and promote more compliant Portuguese NLP research by presenting a series of everyday NLP use cases, while highlighting the Portuguese legislation that may arise during its development.
- Abstract(参考訳): 近年のディープラーニングの進歩は、人間の知性に制限された知的行動を実行することのできる多くの計算システムの出現を促進している。
人間の言語の場合、これらの進歩により、明示的にプログラムされることなくコヒーレントなテキストを生成することができるChatGPTのようなアプリケーションの導入が可能になった。
代わりに、これらのモデルは、人間の言語の意味のある表現を学ぶために大量のテキストデータを使用する。
これらの進歩に関連して、これらのアプリケーションによって引き起こされる著作権やデータのプライバシー侵害に関する懸念が浮上している。
これらの懸念にもかかわらず、新しい自然言語処理アプリケーションの開発が続けられるペースは、新しい規則の導入よりも大きく向上した。
今日では、法律の専門家とコンピュータ科学者の間のコミュニケーション障壁は、そのようなアプリケーションの開発において意図しない法的侵害の多くを動機付けている。
本稿では、このコミュニケーションギャップを埋め、日々のNLP使用事例を提示し、ポルトガルのNLP研究をより順応させることを目的としている。
関連論文リスト
- Bridging the Language Gaps in Large Language Models with Inference-Time Cross-Lingual Intervention [71.12193680015622]
大規模言語モデル(LLM)は自然言語処理において顕著な能力を示している。
LLMは異なる言語間で大きな性能差を示す。
Inference-Time Cross-Lingual Intervention (INCLINE) を提案する。
論文 参考訳(メタデータ) (2024-10-16T11:23:03Z) - InstructionCP: A fast approach to transfer Large Language Models into target language [55.2480439325792]
InsCPは命令タグをCPプロセスに統合し、新しい言語を習得する際の会話能力の喪失を防ぐ。
実験の結果,InsCPは人間のフィードバック能力から会話と強化学習を維持していることがわかった。
このアプローチでは、高品質な命令追従データを0.1億トークンしか必要とせず、それによってリソース消費が減少する。
論文 参考訳(メタデータ) (2024-05-30T15:45:13Z) - The Call for Socially Aware Language Technologies [94.6762219597438]
NLPが機能する社会環境の要因、文脈、意味の認識の欠如である。
我々は、NLPが社会意識を発達させる上で大きな課題が残っており、この分野の新しい時代の始まりであると主張している。
論文 参考訳(メタデータ) (2024-05-03T18:12:39Z) - Prompting Towards Alleviating Code-Switched Data Scarcity in Under-Resourced Languages with GPT as a Pivot [1.3741556944830366]
本研究により, GPT 3.5は, 英語, よるば, 英語のコード変更文を生成することができた。
ヨルバのような非ラテン文字を用いた言語の文の質は、アフリカーンス英語の成功率と比較してかなり低い。
本稿では,GPTを用いた合成コードスイッチングデータの多様性向上のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-26T07:44:44Z) - Conversations in Galician: a Large Language Model for an
Underrepresented Language [2.433983268807517]
本稿では,ガリシア語に対する自然言語処理(NLP)を強化するために設計された2つの新しい資源を紹介する。
52,000の指示と実演を含むアルパカデータセットのガリシア適応について述べる。
データセットユーティリティのデモとして、元々モデルでサポートされていない言語であるGalicianで、LLaMA-7Bの理解と応答を微調整した。
論文 参考訳(メタデータ) (2023-11-07T08:52:28Z) - Unlocking the Potential of ChatGPT: A Comprehensive Exploration of its Applications, Advantages, Limitations, and Future Directions in Natural Language Processing [4.13365552362244]
ChatGPTはチャットボット、コンテンツ生成、言語翻訳、パーソナライズされたレコメンデーション、医療診断や治療など、多くの分野でうまく適用されてきた。
これらの応用におけるその成功は、人間のような応答を生成し、自然言語を理解し、異なる文脈に適応する能力に起因している。
この記事では、ChatGPTとその応用、利点、限界について概観する。
論文 参考訳(メタデータ) (2023-03-27T21:27:58Z) - MCoNaLa: A Benchmark for Code Generation from Multiple Natural Languages [76.93265104421559]
英語以外の自然言語コマンドからコード生成をベンチマークします。
スペイン語,日本語,ロシア語の3言語で896個のNLコードペアを注釈した。
難易度はこれらの3つの言語によって異なるが、全てのシステムは英語にかなり遅れている。
論文 参考訳(メタデータ) (2022-03-16T04:21:50Z) - Including Signed Languages in Natural Language Processing [48.62744923724317]
署名された言語は、聴覚障害者や難聴者のコミュニケーションの主な手段です。
このポジショニングペーパーは、NLPコミュニティに対して、社会的および科学的影響の高い研究領域として署名された言語を含めるよう求めている。
論文 参考訳(メタデータ) (2021-05-11T17:37:55Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z) - A Short Survey of Pre-trained Language Models for Conversational AI-A
NewAge in NLP [17.10418053437171]
最近導入された事前学習言語モデルは、データ不足の問題に対処する可能性がある。
これらのモデルは、階層的関係、長期依存、感情など、異なる言語の側面を捉えることを実証している。
本論文では,これらの事前学習モデルが対話システムに関連する課題を克服できるかどうかを明らかにする。
論文 参考訳(メタデータ) (2021-04-22T01:00:56Z) - Multi-Agent Reinforcement Learning as a Computational Tool for Language
Evolution Research: Historical Context and Future Challenges [21.021451344428716]
エージェント集団における創発的コミュニケーションの計算モデルは、近年MARL(Multi-Agent Reinforcement Learning)の進歩により、機械学習コミュニティへの関心が高まっている。
本研究の目的は、言語進化研究の歴史的文脈における最近のMARL貢献の位置づけと、この理論と計算の背景から、今後の研究におけるいくつかの課題を抽出することである。
論文 参考訳(メタデータ) (2020-02-20T17:26:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。