技术栈

主页 > 后端开发 >

Baidu查看自己的历史搜索记录

技术栈 - 中国领先的IT技术门户

这个就很有意思了!
是这样的,我本来在研究爬虫技术。也就是在研究之前的那篇研究Chrome做爬虫的文章,点这个可以看

然后,在我刷新了一下百度的官网的页面的时候,我意外点开了这个包

就在之前介绍那个关于Chrome进行网络爬取的文章中讲了讲如何到这个部分。 就在之前所说的network这个部分。

然后各位只需要跟我一样点差不多开头的包,那个就是了
如果发现了那个network部分是空的,就 不要关掉这个network部分,直接刷新一下原来的网页,就可以检测到了。

  • 点击这包,就可以看到这样的部分


看到那些被转义过的url(%...这些基本就是被转移过后的中文)

想获取具体的信息,有两个方法。

  1. 直接把这个东西拖到最下面部分


哈哈哈, 一个月前,我确实用这个查了如何设置qrc。(有段时间没有用百度了hhh) 不过这确实是我之前用百度的时候查的东西。

  1. 用Python的 urllib库来解析之前那个被我用蓝色的光效选中的部分url
    无论是python2 还是python3 都是可以urllib这个库。 不过有点区别,就是 python2直接用 urllib.unquote(URL)。而python3用的是urllib.parse.unquote(URL)
    但是Python3可能会有点问题,就是可能会报下面这样的错误。
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: module 'urllib' has no attribute 'parse'

其实解决方法也简单,就直接
from urllib import parse就好了~

后记

嘿嘿,专门写个小tip给大家看。以后女票要是发现自己看了什么电影,后果自负呀~ 反正我单身狗,无压力~
祝大家狗年快乐啦~

责任编辑:admin  二维码分享:
本文标签: urllibnetworkparse这个部分百度