说明:

词云以词语为基本单元,根据其在文本中出现的 频率设计不同大小以形成视觉上不同效果,形成 “关键词云层”或“关键词渲染” ,从而使读者 只要“一瞥”即可领略文本的主旨。

wordcloud库是专门用于根据文本生成词云的 Python第三方库 。

安装

pip install wordcloud

基本使用

wordcloud库的使用十分简单,以一个字符串为 例。其中,产生词云只需要一行语句,在第三行, 并可以将词云保存为图片。

In [1]: from wordcloud import WordCloud 
In [2]: txt = 'I like Python. I am learning Python'                              
In [6]: wordcloud = WordCloud().generate(txt)                                    

In [7]: wordcloud.to_file('textcloud.png')                                       
Out[7]: <wordcloud.wordcloud.WordCloud at 0x7fbc8932fbe0>
程序运行结果

在生成词云时,wordcloud默认会以空格或标点 为分隔符对目标文本进行分词处理。对于中文文 本,分词处理需要由用户来完成。 一般步骤是先 将文本分词处理,然后以空格拼接,再调用 wordcloud库函数。

发表回复