问题是你失去了 name 专栏后 count 。假设每个公司都有不同的标记,我们可以使用
name
count
words_sparse <- words_final %>% as_tibble() %>% count(word, markups, CompanyNames = name) %>% spread(word, n, fill = 0) %>% column_to_rownames("CompanyNames") %>% as.matrix() %>% Matrix(., sparse = TRUE)
在计数时,我重命名了 name 列到 CompanyNames 因为“名字”本身就是其中的一个要素 words 柱。
CompanyNames
words