热搜:
下载python词云图生成源码

python词云图生成源码

更多
  • 软件大小:1.00KB (1,024 字节)
  • 软件类别:编程书集 -> 源码相关
  • 软件授权:免费软件      软件语言:简体中文
  • 更新时间:2020/08/28
  • 软件厂商:
  • 软件官网:
  • 应用平台:
标签
软件介绍
热度:0

python词云图生成源码,用python来实现的一个词云图生成代码,可以生成某个论坛版块的词云图数据,使用python编译环境即可编译该程序,让你轻松获得想要的词云图数据。本次放出python词云图生成源码资源下载,感兴趣的朋友们不妨试试吧!

python词云图生成源码

python词云生成代码说明:

由吾爱论坛大神制作

输入序号即可生成相关板块的词云信息

python词云图代码演示:

import requests

from lxml import etree

import jieba

import numpy as np

import matplotlib.pyplot as plt

import time

from PIL import Image

from wordcloud import WordCloud

def GetData(forumdata):

for j in forumdata:

url = 'https://www.52pojie.cn/forum-x-1'

url = url.split('-')

nurl = url[0] + '-' + j + '-' + url[2]+'.html'

html = requests.get(nurl)

ehtml = etree.HTML(html.text)

forumname=''.join(ehtml.xpath('//*[@id="ct"]/div/div[1]/div[1]/h1/a/text()')).replace('『','').replace('』','')

print(forumname)

pagenum = ehtml.xpath('//*[@id="fd_page_top"]/div/label/span/text()')

pagenum = pagenum[0].replace(' / ', '').replace(' 页','')

txt=''

for i in range(1,int(pagenum)+1):

nurl = url[0] + '-' + j + '-' + str(i) + '.html'

html = requests.get(nurl)

ehtml = etree.HTML(html.text)

#pltxt = ' '.join(ehtml.xpath('//*[@id="threadlisttableid"]/tbody/tr/td[2]/cite/a/text()'))#获取帖子作者

pltxt = ' '.join(ehtml.xpath('//*[@class="s xst"]/text()')) #帖子标题

txt = txt + pltxt

time.sleep(1) # 给服务器留些喘气的时间

cut_text =txt

wordcloud = WordCloud(

font_path='simhei.ttf',

background_color='white',

width=800,

height=500

).generate(cut_text)

wordcloud.to_file('c:\\'+forumname+'.png')

plt.imshow(wordcloud, interpolation="bilinear")

plt.axis("off")

plt.show()

if __name__ == '__main__':

forumdata=[

"2", # 原创发布区 0

"5", # 脱壳破解区 1

"65", # 移动安全区 2

"59", # 软件调试区 3

"24", # 编程语言区 4

"6", # 动画发布区 5

"4", # 逆向资源区 6

"16", # 精品软件区 7

"8", # 悬赏问答区 8

"32", # 病毒分析区 9

"50", # 病毒救援区 10

"41"#安全工具区 11

]

print('开始获取,请稍候...')

GetData(forumdata)

python词云图相关视频:

软件截图

  • python词云图生成源码第1张

下载地址

python词云图生成源码