输入:
1、MTK6223平台的文本资源文件ref_list.txt,6633行,每行有39种语言的文本翻译。
2、MTK6225平台的文本资源文件ref_list.txt,9325行,每行有33种语言的文本翻译。

期望输出:
1、如果6223平台的翻译没有或者只是用英文替代,则寻觅6225平台上的翻译,有则覆盖,没有则跳过。
2、整理出需要翻译的文本,每种语言整理出一份单独的文件,以供给翻译人员翻译。

使用C语言:
同事(业务水平上比我高一个等级)使用了大数组(防溢出),可惜使用了多重循环,还要先寻找没有翻译的,然后导出来,最后导进去。一开始花了2天2夜让计算机工作都没有把一种语言给弄好,后来改进了效率,还是一天能弄完一种语言就不错了。

使用Python:
我先读6225的文件生成了个两个大字典(其实就是散列表,C语言没有现成可用的),前后不到1分钟。Python字典的大小似乎只与所用计算机的内存有关,一般来说是用不完的。
然后去读6223的文件,逐行边解析边比较边记录。
临时结果存在一个大字符串里,最后统一将大字符串写进结果文件里,这样可以减少I/O读写损耗。
程序所用时间也不过4分多种,所有想要的都实现了。

Python太神奇了,至少在处理文本的上,比C方便多了。