TUMCC

TUMCC Telegram地下市场中文语料库一个专业术语识别领域的中文语料库,共收集了来自12 个Telegram 群组19821 位Telegram 用户的28749 个句子,包括804,971 个字符,发布前也完成了数据筛选和分词工作,所以使用起来比较方便,而且还有整理后的版本,有需要的可以到GitHub上面学习。

Telegram地下市场中文语料库-TUMCC

Telegram地下市场中文语料库

地址:https://github.com/m1-llie/TUMCC

本站内容版权声明