火车采集器/自动中文分词
来自站长百科
在新建标签里边选“使用自定义固定格式的数据”,然后选"自动分词处理”。
注意,可以对多个标签进行联合分词.
最下边的自动分词,可以按词频对标签内的内容进行关键字提取。 打开辅助工具里的‘中文分词效果’测试“,看下具体的过程。
可以点击上边的编辑用户词库和编辑禁用词库来实现更多的分词效果。如果需要设置关键词的词性,请打开选项->自动分词设置,即可以有选择性的获取某些词性的关键字。
在新建标签里边选“使用自定义固定格式的数据”,然后选"自动分词处理”。
注意,可以对多个标签进行联合分词.
最下边的自动分词,可以按词频对标签内的内容进行关键字提取。 打开辅助工具里的‘中文分词效果’测试“,看下具体的过程。
可以点击上边的编辑用户词库和编辑禁用词库来实现更多的分词效果。如果需要设置关键词的词性,请打开选项->自动分词设置,即可以有选择性的获取某些词性的关键字。