論文の概要: The Distribution of Dependency Distance and Hierarchical Distance in Contemporary Written Japanese and Its Influencing Factors
- arxiv url: http://arxiv.org/abs/2504.21421v1
- Date: Wed, 30 Apr 2025 08:27:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 19:45:08.869773
- Title: The Distribution of Dependency Distance and Hierarchical Distance in Contemporary Written Japanese and Its Influencing Factors
- Title(参考訳): 現代日本人における従属距離と階層距離の分布とその影響要因
- Authors: Linxuan Wang, Shuiyuan Yu,
- Abstract要約: 文長の増加に伴う平均依存距離(MDD)と平均階層距離(MHD)の変化を分析した。
その結果, 日本語におけるMDDとMHDのトレードオフ関係の背景にある要因は, 述語の正当性であることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To explore the relationship between dependency distance (DD) and hierarchical distance (HD) in Japanese, we compared the probability distributions of DD and HD with and without sentence length fixed, and analyzed the changes in mean dependency distance (MDD) and mean hierarchical distance (MHD) as sentence length increases, along with their correlation coefficient based on the Balanced Corpus of Contemporary Written Japanese. It was found that the valency of the predicates is the underlying factor behind the trade-off relation between MDD and MHD in Japanese. Native speakers of Japanese regulate the linear complexity and hierarchical complexity through the valency of the predicates, and the relative sizes of MDD and MHD depend on whether the threshold of valency has been reached. Apart from the cognitive load, the valency of the predicates also affects the probability distributions of DD and HD. The effect of the valency of the predicates on the distribution of HD is greater than on that of DD, which leads to differences in their probability distributions and causes the mean of MDD to be lower than that of MHD.
- Abstract(参考訳): 日本語における係り受け距離 (DD) と階層距離 (HD) の関係を検討するため, DD と HD の確率分布を文長の固定の有無で比較し, 文長の増大に伴う平均係り受け距離 (MDD) と平均階層距離 (MHD) の変化と, 現代日本語のバランスコーパスに基づく相関係数について検討した。
その結果, 日本語におけるMDDとMHDのトレードオフ関係の背景にある要因は, 述語の正当性であることがわかった。
日本語の母語話者は述語の値によって線形複雑性と階層的複雑性を規制し、MDDとMHDの相対的な大きさは、値のしきい値に達したかどうかに依存する。
認知的負荷とは別に、述語の原子価はDDとHDの確率分布にも影響を及ぼす。
述語がHDの分布に与える影響はDDの分布よりも大きく,MDDの平均値がMHDよりも低くなる。
関連論文リスト
- Mutual Regression Distance [23.137310779463277]
制約付き相互回帰問題によって誘導されるMRD(Multual Regression Distance)と呼ばれる新しい距離を提案する。
我々は、MDDが計量の公理のほとんどを満足する擬計量であることを証明する。
我々のMDD、特に単純化されたMDDは、ワッサーシュタイン距離よりも計算の複雑さがはるかに低い。
論文 参考訳(メタデータ) (2025-01-18T00:43:11Z) - A Geometric View of Data Complexity: Efficient Local Intrinsic Dimension Estimation with Diffusion Models [12.636148533844882]
低次元部分多様体の局所次元内在(LID)を推定することは長年の問題である。
本研究では,拡散モデルに付随するFokker-Planck方程式がLID推定器となることを示す。
FLIPDを合成LID推定ベンチマークに適用すると、完全に接続されたネットワークとして実装されたDMは、非常に効果的なLID推定器であることが分かる。
論文 参考訳(メタデータ) (2024-06-05T18:00:02Z) - Correlation and Unintended Biases on Univariate and Multivariate
Decision Trees [11.03214643036954]
決定木はアクセス可能で、解釈可能で、優れた分類モデルである。
我々は、軸パラレル超平面を介して分割関数を分割する単変数DTと、代わりに超平面を介して分割する多変数DTの2つのファミリを対比する。
論文 参考訳(メタデータ) (2023-12-04T13:33:51Z) - The Representation Jensen-Shannon Divergence [0.0]
確率分布の違いの定量化は機械学習において重要である。
本研究は,従来のジェンセン・シャノン発散に触発された新しい尺度であるジェンセン・シャノン発散(RJSD)の表現を提案する。
本研究は, RJSDが2サンプル試験, 分散シフト検出, 教師なし領域適応において優れていることを示すものである。
論文 参考訳(メタデータ) (2023-05-25T19:44:36Z) - Cross-Modal Causal Intervention for Medical Report Generation [109.83549148448469]
医療報告生成(MRG)は、コンピュータ支援診断と治療指導に不可欠である。
視覚的および言語的バイアスによって引き起こされる画像テキストデータ内の素早い相関のため、病変領域を確実に記述した正確なレポートを生成することは困難である。
本稿では,視覚分解モジュール (VDM) と言語分解モジュール (LDM) からなるMRGのための新しい視覚言語因果干渉 (VLCI) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - Interpreting diffusion score matching using normalizing flow [22.667661526643265]
拡散スコアマッチング (DSM) は, 正規化フローで評価された元のスコアマッチング (Stein discrepancy) と等価であることを示す。
具体的には、DSM(またはDSD)が正規化フローによって定義される変換空間で評価された元のスコアマッチング(またはスタイン差分)と等価であることを示す。
論文 参考訳(メタデータ) (2021-07-21T13:27:32Z) - Accuracy on the Line: On the Strong Correlation Between
Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。
具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。
また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文 参考訳(メタデータ) (2021-07-09T19:48:23Z) - Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty
Estimation for Facial Expression Recognition [59.52434325897716]
DMUE(DMUE)という,アノテーションのあいまいさを2つの視点から解決するソリューションを提案する。
前者に対しては,ラベル空間における潜伏分布をよりよく記述するために,補助的マルチブランチ学習フレームワークを導入する。
後者の場合、インスタンス間の意味的特徴のペアワイズ関係を完全に活用して、インスタンス空間のあいまいさの程度を推定する。
論文 参考訳(メタデータ) (2021-04-01T03:21:57Z) - A Unified Joint Maximum Mean Discrepancy for Domain Adaptation [73.44809425486767]
本論文は,最適化が容易なjmmdの統一形式を理論的に導出する。
統合JMMDから、JMMDは分類に有利な特徴ラベル依存を低下させることを示す。
本稿では,その依存を促進する新たなmmd行列を提案し,ラベル分布シフトにロバストな新しいラベルカーネルを考案する。
論文 参考訳(メタデータ) (2021-01-25T09:46:14Z) - Rethink Maximum Mean Discrepancy for Domain Adaptation [77.2560592127872]
本論文は,(1)最大平均距離の最小化は,それぞれソースとクラス内距離の最大化に等しいが,その差を暗黙の重みと共同で最小化し,特徴判別性は低下する,という2つの本質的な事実を理論的に証明する。
いくつかのベンチマークデータセットの実験は、理論的な結果の有効性を証明しただけでなく、我々のアプローチが比較した最先端手法よりも大幅に向上できることを実証した。
論文 参考訳(メタデータ) (2020-07-01T18:25:10Z) - Neural Methods for Point-wise Dependency Estimation [129.93860669802046]
我々は,2つの結果が共起する確率を定量的に測定する点依存度(PD)の推定に焦点をあてる。
提案手法の有効性を,1)MI推定,2)自己教師付き表現学習,3)クロスモーダル検索タスクで示す。
論文 参考訳(メタデータ) (2020-06-09T23:26:15Z) - Discrete Variational Attention Models for Language Generation [51.88612022940496]
本稿では,言語における離散性に起因する注意機構のカテゴリー分布を考慮した離散的変動注意モデルを提案する。
離散性の特質により,提案手法の訓練は後部崩壊に支障を来さない。
論文 参考訳(メタデータ) (2020-04-21T05:49:04Z) - Robust Density Estimation under Besov IPM Losses [10.079698681921672]
ハマー汚染モデルにおける非パラメトリック密度推定の最小収束率について検討した。
再スケールされた閾値ウェーブレット級数推定器は,多種多様な損失の下で最小収束率を達成することを示す。
論文 参考訳(メタデータ) (2020-04-18T11:30:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。