一江溪水
用正则表达式提取信息 用正则表达式提取信息
正则表达式,说白了就是用来匹配字符的,正则表达式是用来简洁表达一组字符串的表达式.正则表通常被用来检索、替换那些符合某个模式(规则)的文本。很多编程语言都支持正则表达式进行字符串操作。在代码中常简写为regex、regexp或RE。比如P
2017-09-14
用Python写网络爬虫 用Python写网络爬虫
网络爬虫(又被称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 前言 在讲爬虫之前,我们需要知道我们是如何从网络上获取信息的,有人说,百度啊,谷歌啊!!!!!没错,大多时候,我们都是利用他们从网络上面获
2017-09-10
如何做中文词云 如何做中文词云
前言 在上一篇文章中,我们讲解了在Ubuntu环境下安装Anaconda,并且做出了英文的简易词云。 可能会有的同学尝试把文章换成中文的,做出中文词云。我想大家得到的结果肯定是这样的 中文与英文在编码上是存在很多区别的,而且我们做英文词
2017-09-04
如何用Python做词云 如何用Python做词云
1.词云是什么?想必大家都见过这种图片,这就是词云啦 “词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于近日提出。戈登做过编辑、记者,曾担任迈阿密先驱报(Miami Herald)新媒体版的主
2017-09-03