python 在处理网页的时候通常需要自己构造url,如在浏览器中显示为
实际浏览器载入的url是:
这里涉及到url编码中文的问题
需要把中文转换为url编码,具体用到python urllib或者urllib2库,一下用urllib2实例
isn=raw_input('请输入关键字')
isn1=urllib2.quote(isn.decode(sys.stdin.encoding).encode('utf8'))
url='http://search.jd.com/Search?keyword='+isn1+'&enc=utf-8&suggest=0&book=y'
具体红色部分用什么编码方式的具体分析,像京东的是utf8方式从url中也可以体现出来。百度的是gbk,其他的一般网站比如google就是utf8的。