问答对相关数据集

Date: 2019/05/07 Categories: 工作 Tags: pair dataset



知乎问题多分类数据集

NLPCC2018的任务, 为每个知乎问题标记最多五个标签

LCQMC:A Large-scale Chinese Question Matching Corpus

问题-答案对

我们从百度知道和新浪爱问上收集的问题/答案对, 未标注, 经过简单清洗.

问题相似度数据集

百度知道数据聚类后标注,2w条训练集,2k条验证集