写完对newsmth的代码了,该想想下一步又该写什么代码了。最近在看Python的经典书籍《Dive Into Python》、《Python Tutorial》,昨晚在线看着看着,感觉越来越有滋味。学而时习之,不亦跃乎。Python让我找到了热爱程序的感觉,让我远离了游戏,甚至有时顾不上股票了。
人总是要朝前看的,在我心目中,水木社区取代了雁塔,我基本上能几个月不登陆雁塔了。很多时侯,只有找到新的,才会渐渐忘却取代旧的。记忆、爱好、爱情,大都如此。
列举一下我workshop目录下的Pyhon主要习作,看看自己都做了什么:
1、对大众点评网采集信息的脚本。——俺的第一个习作,第一天学习python就写出来了,不过大众点评网的网页比较简单。
2、加密解密算法。网络发email有时很不安全,容易被人拦截或监测,如果双方都有加密解密程序就好了,就在网上找了些资料写了这个。不过一直没有应用。
3、python-chinese。下载python-chinese的所有邮件列表,网页结构比较简单,可惜没有加多线程下载,否则就很快了。
4、抓取某公交网站的公交路线数据——那时想做一个网站,我将几百个城市的公交数据都抓下来了,按照一定格式整理好,最后倒入的access了,只不过后来放弃了做网站。该网站的网页有点复杂,有时页面不是按规律来的,中间加了几条判断语句。
5、blogchina——下载备份所有博客。我失误的是,将下载下来的html文件的名字改为了博客的标题文字,没有保留原先的文件名。博客中国的博客里面签有脚本(例如google搜索),如果想做成电子书,必须把这些脚本去掉,否则会出问题。本程序清理了那些冗余的垃圾。
6、msn_robot——本来想做网站时,做一个简单的msn_robot的,发现也做到了有问有答了,后来没有继续伸入下去。不过感觉msn机器人有时有点慢,也许是网络的缘故。
7、水木社区myphoto照片。——水木社区的网页与前面所有的网页都有所不同,帖子的url不是按照顺序的,需要算出帖子的url,照片的地址和格式,也需要自己算出来。第一次没有使用htmlparser,我就当解析文本一样自己写代码去解析的。
8、水木社区的全站搜索——就是将水木社区自带的版内搜索功能整合在一起而已,比较简单。
9、水木社区帖子内含有某关键字的搜索——主要是采用了多线程,线程开多了也不好,因为线程的创建和销毁也是需要时间的。
下一步Python脚本该做啥?也许要开始尝试新的领域了,每写一次脚本,应该有一些新的提高。
下一步Python脚本该做啥?
下一步Python脚本该做啥?
...