问答对相关数据集
Date: 2019/05/07 Categories: 工作 Tags: pair dataset
知乎问题多分类数据集
NLPCC2018的任务, 为每个知乎问题标记最多五个标签
LCQMC:A Large-scale Chinese Question Matching Corpus
问题-答案对
我们从百度知道和新浪爱问上收集的问题/答案对, 未标注, 经过简单清洗.
问题相似度数据集
百度知道数据聚类后标注,2w条训练集,2k条验证集
Date: 2019/05/07 Categories: 工作 Tags: pair dataset
NLPCC2018的任务, 为每个知乎问题标记最多五个标签
我们从百度知道和新浪爱问上收集的问题/答案对, 未标注, 经过简单清洗.
百度知道数据聚类后标注,2w条训练集,2k条验证集