一、 功能介绍
文本分词是自然语言处理的基础功能,核心是将连续文本按语义、语法规则拆分为有意义的词语或子词单元,常用基于词典、统计或深度学习的实现方法。
常见问题场景:
(一)文本分词
功能界面:
二、示例
(一)文本分词
操作步骤:
1. 点击方方格子> 高级文本处理>更多>分割更多>文本分词…
2.区域选择A2:A5,分隔符输入:/,词库选择默认词库,然后点击确定按钮
提示:支持自定义分隔符;词库可选默认词库、自定义词库、默认+自定义词库
3.存放位置选择首个单元格C2,得到结果
三、注意事项
(一)支持的场景
1.本功能支持撤销
2.支持对多个不连续的区域进行处理
3.支持隐藏区域及筛选状态下的处理
(二)不支持的场景
1.不支持多簿多表处理
(三)进度与报告
1.本功能运行完成后暂不提供完成报告。
2.当处理数据量较大时,请耐心等待程序运行结果。
(四)其他
切换词库需要等待30s左右时间