股市收市后写了一篇blog,然后写了一篇专利,5点多开始写搜索newsmth某ID全站发表文章的脚本。发现我除了正则表达式不太会写之外,其他的思路还是挺对的。不贴代码了,说个思路吧:

1、先枚举所有的分区,即group
2、根据分区(group),枚举得到newsmth所有的版面(board)
3、逐个版面搜索某id的发文,将搜索结果写到文件里。

       如果没有加打印语句,搜索的速度还是挺快的,不过,我想能用telnet调用的脚本的速度会快几倍。

      以搜索Fengxiaogang这个ID为例,http://www.qi-so.com做了一下对比,我搜出来1880多,它竟然有3800多条数据。可见,那个网站是对newsmth做了镜像或者有历史缓存的(不要怀疑我的脚本)。

        我为Python狂,这几天也不怎么关注股市了,夜里睡觉也想着下一个该用Python干些啥有意思的事。要做有意义的事,有意义的事就是好好活着。