本研究针对当前实体链接(EL)领域数据集单一、标注不一致等问题,开发了Elgold数据集。该数据集涵盖新闻、招聘、影评等7大领域文本,采用改进的OntoNotes 5.0标注体系定义14类命名实体,通过四阶段验证确保数据质量。研究证实Elgold在文本多样性(Gini指数0.5248)和 ...