基于新闻评论的短文本聚类?
首先回答短文本聚类用到哪些技术,中分分词(好的分词器会减少分词碎片),过滤停用词一些对于聚类影响不大的词语比如的,了,代词,助词等,语义扩展如本文的word2vec,特征选择,卡方,互信息,本文中用到的tfidf等,提问中说的内存,可以通过调整参数处理
Copyright © 广州京杭网络科技有限公司 2005-2025 版权所有 粤ICP备16019765号