Python获取百度热搜的完整代码

好久没写了,就把上课做的一个小东西拿出来分享一下吧。百度网页截图如下 ↓↓↓程序运行输出结果截图 ↓↓↓上代码 ↓↓↓from lxml import etreefrom lxml import ht

好久没写了,就把上课做的一个小东西拿出来分享一下吧。
百度网页截图如下 ↓↓↓

Python获取百度热搜的完整代码

程序运行输出结果截图 ↓↓↓

Python获取百度热搜的完整代码

上代码 ↓↓↓

  from lxml import etree  from lxml import html  import requests    headers={'user-agent':'mozilla/5.0 (windows nt 6.1) applewebkit/537.36 (khtml, like gecko) chrome/51.0.2704.63 safari/537.36'}  page = requests.get("https://www.baidu.com",headers=headers)  html = page.text  #print(source1)  # 从字符串解析  element = etree.html(html)    # 元素列表,获取的方式列出了如下两种  # ps = element.xpath('//*[@id="hotsearch-content-wrapper"]/li/a/span[2]')  ps = element.xpath('//*[@class="title-content-title"]')    #热搜文本内容  text = []  if len(ps) > 0:    for p in ps:      #输出节点的文本      text1 = p.text      text.append(text1)  else:    print("空")      x = element.xpath('//*[@class="s-hotsearch-content"]/li')    #热搜文本对应的排名  index = []  for x1 in x:    #获取节点的属性    index1 = x1.get("data-index")    index.append(index1)    print(text)    print(index)    #定义一个对文本和排名进行匹配的函数,返回一个字典型数据  def pp(index_array,text_array):    x = {}    i = 0    for index_a in index_array:      #index_a = int(index_a)            x[index_a] = text_array[i]      i = i + 1    return x    re_text = pp(index,text)  #对字典性数据按key进行排序,即key=lambda re:re[0],排序完成后再转换为字典型数据  last_text = dict(sorted(re_text.items(),key=lambda re:re[0]))

到此这篇关于python获取百度热搜的完整代码的文章就介绍到这了,更多相关python 百度热搜内容请搜索<计算机技术网(www.ctvol.com)!!>以前的文章或继续浏览下面的相关文章希望大家以后多多支持<计算机技术网(www.ctvol.com)!!>!

需要了解更多excel技术学习文档:Python获取百度热搜的完整代码,都可以关注excel表格制作技术学习分享栏目—计算机技术网(www.ctvol.com)!

本文来自网络收集,不代表计算机技术网立场,如涉及侵权请联系管理员删除。

ctvol管理联系方式QQ:251552304

本文章地址:https://www.ctvol.com/pythontutorial/1239136.html

(0)
上一篇 2022年9月15日
下一篇 2022年9月15日

精彩推荐