我从腾讯那“偷了”3000万QQ用户数据,出了份很有趣的独家报告!

冰芒 资讯 2018-02-01 75 次浏览

这是我近期使用C#写的一个QQ空间蜘蛛网爬虫程序。程序截止2015年10月运行2月,总共爬了1.5亿腾讯QQ用户数据,其中有4000万包含用户(QQ号,昵称,空间名称,头像,最新一条说说内容,最新说说的发表时间,空间简介,性别,生日,所在省份,城市)的详细数据。

我用爬虫一天时间“偷了”知乎一百万用户,只为证明PHP是世界上最好的语言

冰芒 资讯 2018-02-01 73 次浏览

前几天比较火的是一个人用C#写了一个多线程爬虫程序,抓取了QQ空间3000万QQ用户,其中有300万用户是有QQ号、昵称、空间名称等信息的,也就是说,有详情也就300万,跑了两周,这没什么,为了证明PHP是全世界最好的语言,虽然大家都懂的^_^,我用PHP写了一个多进程爬虫程序,只用了一天时间,就抓了知乎100万用户,目前跑到第8圈(depth=8)互相有关联(关注了和关注者)的用户。

Adobe 蜕变为市值近千亿的 SaaS 公司 3 个关键经验值得学习

冰芒 资讯 2018-01-30 77 次浏览

没有多少科技公司能像Adobe那样:已经存在了很长的时间,仍然在不断地创新和发展。

回顶部