提出一种中文因果关系分析方法,以便更加细腻地表达因果关系.该方法由因果关系提取和权重计算组成.首先,构建了中文因果关系四元组数据集,将因果划分为核心名词和谓语状态,即原因中的核心名词、原因中的谓语或状态、结果中的核心名词、结果中的谓语和状态;然后,构建了中文因果关系抽取(CCE)模型,该模型由中文预训练的基于全词掩码训练的双向编码表示模型(BERT-wwm)和条件随机场(CRF)组成,在所构建的数据集上,四元组抽取F1分数为0.3;最后,提出基于因果强度的近似原因权重算法,用于计算同一结果不同原因的权重,减小对语料库数据量的依赖性,具有更好的鲁棒性和泛化性,能更加真实地反映不同原因对结...