题目内容
(请给出正确答案)
[多选题]
假定你已经搜集了10000行推特文本的数据,不过没有任何信息。现在你想要创建一个推特分类模型,好把每条推特分为三类:积极、消极、中性。通过把每个推特视为一个文档,我们创建一个数据化的文档词矩阵。关于文档矩阵,以下哪项是正确的?()
A.从数据中移除停用词(stopwords)将会影响数据的维度
B.数据中词的归一化将会减少数据的维度
C.转化所有的小写单词将不会影响数据的维度
查看答案
如果结果不匹配,请 联系老师 获取答案