論文の概要: Similarity between Units of Natural Language: The Transition from Coarse
to Fine Estimation
- arxiv url: http://arxiv.org/abs/2210.14275v1
- Date: Tue, 25 Oct 2022 18:54:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 14:03:40.441531
- Title: Similarity between Units of Natural Language: The Transition from Coarse
to Fine Estimation
- Title(参考訳): 自然言語の単位間の類似性:粗いものから細かいものへの遷移
- Authors: Wenchuan Mu
- Abstract要約: 人間の言語ユニット間の類似性を捉えることは、人間がどう異なる物体を関連づけるかを説明するのに不可欠です。
この論文における私の研究目標は、より洗練された方法で言語単位間の類似性を考慮した回帰モデルを開発することです。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Capturing the similarities between human language units is crucial for
explaining how humans associate different objects, and therefore its
computation has received extensive attention, research, and applications. With
the ever-increasing amount of information around us, calculating similarity
becomes increasingly complex, especially in many cases, such as legal or
medical affairs, measuring similarity requires extra care and precision, as
small acts within a language unit can have significant real-world effects. My
research goal in this thesis is to develop regression models that account for
similarities between language units in a more refined way.
Computation of similarity has come a long way, but approaches to debugging
the measures are often based on continually fitting human judgment values. To
this end, my goal is to develop an algorithm that precisely catches loopholes
in a similarity calculation. Furthermore, most methods have vague definitions
of the similarities they compute and are often difficult to interpret. The
proposed framework addresses both shortcomings. It constantly improves the
model through catching different loopholes. In addition, every refinement of
the model provides a reasonable explanation. The regression model introduced in
this thesis is called progressively refined similarity computation, which
combines attack testing with adversarial training. The similarity regression
model of this thesis achieves state-of-the-art performance in handling edge
cases.
- Abstract(参考訳): 人間の言語単位間の類似性を捉えることは、人間がどのように異なるオブジェクトを関連付けるかを説明する上で非常に重要である。
われわれを取り巻く情報が増え続けるにつれ、類似性を計算することはますます複雑になり、特に法律や医療などのケースでは、言語ユニット内の小さな行為が現実世界に重大な影響を及ぼす可能性があるため、類似性を測定するのに余計な注意と精度が必要である。
この論文における私の研究目標は、より洗練された方法で言語単位間の類似性を考慮した回帰モデルを開発することです。
類似性の計算は長い道のりを経てきたが、その方法のデバッグへのアプローチは、しばしば人間の判断値に継続的に適合することに基づいている。
この目的のために、私の目標は、類似性計算で正確に抜け穴をキャッチするアルゴリズムを開発することです。
さらに、ほとんどのメソッドは計算する類似性の曖昧な定義を持ち、解釈が難しいことが多い。
提案されたフレームワークは、両方の欠点に対処する。
異なる抜け穴をキャッチすることで、常にモデルを改善します。
さらに、モデルの改良はすべて合理的な説明を提供する。
この論文で導入された回帰モデルは漸進的に洗練された類似性計算と呼ばれ、攻撃テストと敵の訓練を組み合わせる。
この論文の類似性回帰モデルは、エッジケースを扱う際に最先端のパフォーマンスを実現する。
関連論文リスト
- Accelerated Stochastic ExtraGradient: Mixing Hessian and Gradient Similarity to Reduce Communication in Distributed and Federated Learning [50.382793324572845]
分散コンピューティングはデバイス間の通信を伴うため、効率性とプライバシという2つの重要な問題を解決する必要がある。
本稿では,データ類似性とクライアントサンプリングのアイデアを取り入れた新しい手法について分析する。
プライバシー問題に対処するために,付加雑音の手法を適用し,提案手法の収束への影響を解析する。
論文 参考訳(メタデータ) (2024-09-22T00:49:10Z) - Causal Estimation of Memorisation Profiles [58.20086589761273]
言語モデルにおける記憶の理解は、実践的および社会的意味を持つ。
覚書化(英: Memorisation)とは、モデルがそのインスタンスを予測できる能力に対して、あるインスタンスでトレーニングを行うことによる因果的影響である。
本稿では,計量学の差分差分設計に基づく,新しい,原理的,効率的な記憶推定法を提案する。
論文 参考訳(メタデータ) (2024-06-06T17:59:09Z) - Counting Like Human: Anthropoid Crowd Counting on Modeling the
Similarity of Objects [92.80955339180119]
メインストリームの群衆計数法は 密度マップを補強して 計数結果を得るために統合する。
これに触発された我々は,合理的かつ人為的な集団カウントフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-02T07:00:53Z) - Evaluation of taxonomic and neural embedding methods for calculating
semantic similarity [0.0]
分類学的類似度尺度と分布的類似度尺度のメカニズムについて検討する。
分類学的類似度尺度は、意味的類似度を予測するための素因として、最短経路長に依存する可能性がある。
類似性予測における概念関係と神経埋め込みの相乗効果は、伝達学習における知識ベースを活用する新しい傾向を示す可能性がある。
論文 参考訳(メタデータ) (2022-09-30T02:54:21Z) - A Correlation-Ratio Transfer Learning and Variational Stein's Paradox [7.652701739127332]
本稿では,モデル間の正確な関係を構築するために,線形相関比という新たな戦略を提案する。
実用面では、新しいフレームワークはいくつかのアプリケーションシナリオ、特にデータストリームと医学研究の分野に適用されます。
論文 参考訳(メタデータ) (2022-06-10T01:59:16Z) - Predicting Human Similarity Judgments Using Large Language Models [13.33450619901885]
本稿では,テキスト記述に基づく類似性判断の効率的な予測手法を提案する。
要求される説明の数は刺激の数とともに直線的にしか増加せず、必要なデータ量が劇的に減少する。
本手法は, 自然画像の6つのデータセットを用いて検証し, 視覚情報に基づく従来の手法より優れていることを示す。
論文 参考訳(メタデータ) (2022-02-09T21:09:25Z) - Few-shot Visual Reasoning with Meta-analogical Contrastive Learning [141.2562447971]
本稿では,類似推論に頼って,数ショット(または低ショット)の視覚推論問題を解くことを提案する。
両領域の要素間の構造的関係を抽出し、類似学習と可能な限り類似するように強制する。
RAVENデータセット上での本手法の有効性を検証し, トレーニングデータが少ない場合, 最先端の手法より優れることを示す。
論文 参考訳(メタデータ) (2020-07-23T14:00:34Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z) - Pairwise Supervision Can Provably Elicit a Decision Boundary [84.58020117487898]
類似性学習は、パターンのペア間の関係を予測することによって有用な表現を引き出す問題である。
類似性学習は、決定境界を直接引き出すことによって二項分類を解くことができることを示す。
論文 参考訳(メタデータ) (2020-06-11T05:35:16Z) - Building and Interpreting Deep Similarity Models [0.0]
そこで本稿では,入力機能の観点から説明することで類似性を解釈する手法を提案する。
我々は,2組の入力特徴に対して類似度スコアを系統的に分解する,スケーラブルで理論的に確立された手法であるBiLRPを開発した。
論文 参考訳(メタデータ) (2020-03-11T17:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。