python编码解码(python编码格式转换)

上一篇说到python的设置默认编码格式,然后站长发现居然没有写编码转换!在这里站长决定补回来。

编码转换是什么意思?意思也就是原先是utf-8编码的文件用代码转换成GBK。

就好像我们设定了一个采集是吧,然后采集回来发现是乱码,我们可以用笨办法,先去被采集的网站看看他的编码格式,然后再看我们默认的编码格式,对的话就看看是不是别的问题,如果不对应,那肯定是编码问题,那么我们就要增加一个转换机制,如下图:

python编码解码(python编码格式转换)(1)

在这个图里面站长是把原先是正常文字的字符串转换成了GBK所以才会这样,如果你原先是以GBK格式采集到的字符串,你的文件编码格式偏偏是UTF8,那么就会出错,变成一堆Unicode编码,这时候你只需要换个编码格式转换一下,输出之后就是正常的。

对了,注意看图里那个方法了没?encode方法就是专门用来转换格式用的,接下来还有一个统计某一个字符的出现次数的方法。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页