2020-08-21
MongoDB3.6 以后,默认使用的储存引擎是 WiredTiger。这个引擎有一个特点,就是删除数据不释放空间。例如现在你的一个集合里面有 10000000 条数据,占用 10GB 的硬盘空间。你把其中的 9999999 条数据都删了,占用空间仍然是 10GB。 如
2020-08-21
最近好像突然流行起来了在博客里面设置阅读全文需要关注公众号获取验证码的垃圾操作,甚至一些托管在 github pages 上的静态博客也搞了,实在是一种脱裤子放屁的行为。 需要获取验证码的案例如下图 可以看到这个功能其实是由 openwrite.cn 提
2020-07-10
新增了代理功能,不能用的话自行修改代理即可,代码如下浅显易懂 import re import requests from requests import RequestException import time import random from bs4 import BeautifulSoup ## 获取网页的response文件 def get_response(url): try: headers = { 'Referer': 'https://blog.csdn.net', ## 伪装成从CSDN博客搜索到的文章 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.75 Safari/537.36'
2020-07-09
最近总有小伙伴问百度网盘还有没有可以高速下载方法? 如此刚需怎么会没有呢?这不,吾爱破解论坛上这两天刚有人分享了一个免登录实现百度网盘高速下载的方法,而且超级简单。 就是只需要在别人分享的百度网盘链接前面
2020-07-07
正则匹配工具 珍藏版 作者CN911 说明:这是我一直在自产自用的,又一款短小精悍,出行必备的神器。因为爬信息必须要用到正则。如果用过某易论坛的某某助手,一定非常熟悉这个界面,没错就是看着画的,提炼了精华。
2020-07-01
网页加载速度是衡量一个网页好坏的重要标准,网页遗弃率随网页加载时间的增加而增加。据说近一半的用户希望网页加载时间不超过 2s,超过 3s 一般就放弃该网页。时间就是生命,干等着,谁愿意平白无故地 +1s 呀,所以今天