资源简介
python post方式提交数据
代码片段和文件信息
# r.encoding #获取当前的编码
# r.encoding = ‘utf-8‘ #设置编码
# r.text #以encoding解析返回内容。字符串方式的响应体,会自动根据响应头部的字符编码进行解码。
# r.content #以字节形式(二进制)返回。字节方式的响应体,会自动为你解码 gzip 和 deflate 压缩。
# r.headers #以字典对象存储服务器响应头,但是这个字典比较特殊,字典键不区分大小写,若键不存在则返回None
# r.status_code #响应状态码
# r.raw #返回原始响应体,也就是 urllib 的 response 对象,使用 r.raw.read()
# r.ok # 查看r.ok的布尔值便可以知道是否登陆成功
# #*特殊方法*#
# r.json() #Requests中内置的JSON解码器,以json形式返回前提返回的内容确保是json格式的,不然解析出错会抛异常
# r.raise_for_status() #失败请求(非200响应)抛出异常
# url=‘https://tieba.baidu.com/p/7161363204‘
# htmls=requests.get(url)
# print (htmls.text) #显示返回的数据
# print (htmls.encoding htmls.headershtmls.status_code)
# htmls.encoding = ‘utf8‘ #改为utf-8编码
# print (htmls.text) #显示返回的数据
# print(htmls.content) #显示byte类型二进制数据 存储尽量用这种byte类型存数据
# print(htmls.content.decode()) #对二进制进行解码操作 默认是用utf8解码 可以用gbk gb2312 等htmls.content.decode(‘gbk‘)
# #常见的响应对象参数
# print(htmls.url) #真实的返回数据的网站url地址
# # htmls.request.headers #发送的请求头
# # htmls.headers #网站返回的响应头
# print(htmls.headers) #‘Set-Cookie‘: ‘TIEBA_USERTYPE=280cd18f64ed884f9fef99b2;这个最重要
# print (htmls.cookies)
import requests
import json
#要将在审查元素中获得的url中translate后面的_o去掉,错误50就消失了,可以正常爬取。不知道为什么
#http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule去掉_o
class fanyi(object):
def __init__(selfword): #初始化函数
self.url=‘http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule‘ #_o去掉
self.proxies={‘http‘: ‘http//121.232.148.49:9000‘} #代理ip和端口 用代理无法post? get可以
self.headers={‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/78.0.3904.108 Safari/537.36‘} #不用cookies
self.data = {
‘i‘: word
‘from‘: ‘AUTO‘
‘to‘: ‘AUTO‘
‘smartresult‘: ‘dict‘
‘cli
评论
共有 条评论