前面
之前有看一些英文规范,大概明白一些东西。现在的思路是,由于英文水平较差,首先看中文规范对此规范有了大概的了解之后然后详细研读英文规范,在看中文规范的时候也以英文规范辅助,英文规范是一手资料,中文版难免有所偏差。
每个字都认识,全部连起来就不知道什么意思了。
11.5
先看中文规范,通读一下,明白这个规范主要在讲什么,有哪些内容。
规范中涉及的东西太多,在不了解周边的情况下只看规范太过抽象
参考:
之前有看一些英文规范,大概明白一些东西。现在的思路是,由于英文水平较差,首先看中文规范对此规范有了大概的了解之后然后详细研读英文规范,在看中文规范的时候也以英文规范辅助,英文规范是一手资料,中文版难免有所偏差。
每个字都认识,全部连起来就不知道什么意思了。
11.5
先看中文规范,通读一下,明白这个规范主要在讲什么,有哪些内容。
规范中涉及的东西太多,在不了解周边的情况下只看规范太过抽象
参考:
File "test.py", line 10
SyntaxError: Non-ASCII character '\xe5' in file test.py on line 10, but no encoding declared;
# -*- coding: utf-8 -*-
print '刘'
result:
鍒
将中文字符显示声明为unicode,unicode转gbk是可以的,因为unicode相当于一个所有字符的超集
print u'刘'
result:
刘
encode,decode,这两个函数都是相对于Unicode来解释的
编码(encode):将Unicode字符串(中的代码点)转换为特定字符编码(utf-8等)对应的字节串的过程和规则
解码(decode):将特定字符编码的字节串(utf-8等)转换为对应的Unicode字符串(中的代码点)的过程和规则
str_utf_8 = '刘'
print str_utf_8
print str_utf_8.decode('utf-8') #decode参数是字符串的现有编码方式,此处将utf-8转换为unicode
print str_utf_8.decode('utf-8').encode('gbk') #encode参数是需要转换的编码,此处将utf-8转换为unicode然后又以gbk编码
result:
鍒
刘
刘
responseHtml = response.xpath('//*[@id="content"]').extract()
nextChapterUrl = re.search(u'<a href="(./|([0-9]+_[0-9]+|[0-9]+).html)">(第二页|下一页|返回列表)</a>', ''.join(responseHtml)).group(1)
-s FEED_EXPORT_ENCODING=utf-8
刘大神,坚持啊 我的博客都好久没更了
我也是刚想起来...