python截取中文字符串乱码问题的解决

2016年9月10日星期日晴

问题的提出：在之前博客上可以看到有乱码，如图：乱码图片

原因分析：我在数据库里保存的中文是utf-8编码，而utf-8的字符串的长度是1-6个字符，我显示评论或者博客摘要都是要截断的，而截断长度是固定的，所以有时会从中截断，出现乱码。

问题的解决： 先转换成unicode，再取子串，然后转换成utf-8

修改示例：原来代码： [code]obj[‘content’][:DESCRIPTION_CUT_WORDS][/code]

修改后的代码： [code]obj[‘content’].decode(‘utf-8’)[:DESCRIPTION_CUT_WORDS].encode(‘utf-8’))[/code]