2020-11-26
什么是正则表达式 正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为 regex、regexp 或 RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某
2020-11-18
背景 最近有个需求,有多个库,每个库中有一张相同表名的表需要实时同步到另一个服务器上的 Mysql,本想自己 python 写一个脚本去处理,就这么巧,正好看到了阿里巴巴开源的 Canal,刚刚好他又满足需求,那就勉为其
2020-11-18
这是个啥? 在 Python 中,一般情况下我们可能直接用自带的 logging 模块来记录日志,包括我之前的时候也是一样。在使用时我们需要配置一些 Handler、Formatter 来进行一些处理,比如把日志输出到不同的位置,或者设
2020-11-12
在视频网站上观看视频的时候,有时候需要把一个视频下载下载却不知道怎么弄,因为目前 99% 的网站,都没有现成的下载方法,今天我就来安利一个特别特别香的开源神器 annie , 目前已经收获 star 13k+ 最近国内一位开发者在 GitHub 上开源了
2020-11-06
本文主要简单介绍下大数据、Hadoop 起源以及 Google 三篇论文 一、什么是大数据? 1PB 够大吗? 如果你没有直观印象,可以联想一下你的电脑硬盘容量,标配是 500G-1TB,大部分人用了一两年,可能这部分容量都没用完
2020-10-29
pandas 是干啥的? 十年前,一个还在做量化交易研究的美国人 Wes McKinney 开始写下了第一行 pandas 代码。慢慢地,pandas 成为了众多 python 程序员做数据分析的首选工具:它足够快,支持读写各种常用数据格式,语法灵活,又有丰富的生态。