2016年9月10日 星期日 晴

问题的提出:在之前博客上可以看到有乱码,如图: 乱码图片

原因分析: 我在数据库里保存的中文是utf-8编码,而utf-8的字符串的长度是1-6个字符,我显示评论或者博客摘要都是要截断的,而截断长度是固定的,所以有时会从中截断,出现乱码。

问题的解决: 先转换成unicode,再取子串,然后转换成utf-8

修改示例: 原来代码: [code]obj[‘content’][:DESCRIPTION_CUT_WORDS][/code]

修改后的代码: [code]obj[‘content’].decode(‘utf-8’)[:DESCRIPTION_CUT_WORDS].encode(‘utf-8’))[/code]