python基础整理——中文编码初探

2018-02-27 11:32:11来源:oschina作者:十年磨一剑3344人点击

分享

在编写英文以及拼音时,python的程序能够正常的运行,但是在 编写汉字时,如果使用的编辑器没有经过编码处理,可能会报错。为了更好的解决这个问题,我参考菜鸟教程进行了总结:


在window环境下:


Python 文件中如果未指定编码,在执行过程会出现报错:


#!/usr/bin/python

(本语言的第一行,目的就是指出,你想要你的这个文件中的代码用什么可执行程序去运行它)


#!/usr/bin/python是告诉操作系统执行这个脚本的时候,调用/usr/bin下的python解释器。 #!/usr/bin/env python这种用法是为了防止操作系统用户没有将python装在默认的/usr/bin路径里。当系统看到这一行的时候,首先会到env设置里查找python的安装路径,再调用对应路径下的解释器程序完成操作。这种写法会去环境设置寻找python目录,推荐这种写法)


print "你好,世界";

以上程序执行输出结果为:


File "test.py", line 2 SyntaxError: Non-ASCII character '/xe4' in file test.py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字,所以在读取中文时会报错。


解决方法为只要在文件开头加入

# -*- coding: UTF-8 -*-
或者 #coding=utf-8 就行了

如果没有此文件编码类型的声明,则 python 默认以ASCII编码去处理;如果你没声明编码,但是文件中又包含非ASCII编码的字符的话,python解析器去解析的 python 文件,自然就会报错了。


在Linux环境下:


在Linux环境中唯一的区别是“/”的区别,需要把windows中的“/”换成“/”字符。


最新文章

123

最新摄影

微信扫一扫

第七城市微信公众平台