资源简介
爬取下载网易云音乐.py
代码片段和文件信息
from urllib import request
import requests
import re #Re库是Python的标准库,主要用于字符串匹配
from bs4 import BeautifulSoup #BeautifulSoup库通过解析文档为用户提供需要抓取的数据
#Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码
from pprint import pprint
import urllib time
def get_content(url):
headers = {
‘Host‘: ‘music.163.com‘
‘Referer‘: ‘https://music.163.com/‘
‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/64.0.3282.140 Safari/537.36‘
}
r = requests.session()
r = BeautifulSoup(r.get(url headers=headers).content “html.parser“)#返回的网页部分会存在.content对象中,content中间存的是字节码
return r
def save(r):
music_dict = {}
result = r.find(‘ul‘ {‘class‘: ‘f-hide‘}).find_all(‘a‘) #re.findall()搜索字符串,以列表类型返回全部能匹配的子串
# print(result)
for music in result:
music_dict[music[‘href‘].strip(“/song?id=“)] = music.text
# for k v in src_dict.items():
# print(k v)
return music_dict
def download_song(song_id music_dict):
try:
song_url = ‘http://music.163.com/song/media/outer/url?id=%s.mp3‘ % song_id # 该链接为浏览器在网页版缓存歌曲的下载链接
- 上一篇:python 100个练手小程序
- 下一篇:Python调用谷歌浏览器打开百度
相关资源
- CpuMemSets在Linux操作系统中的实现
- Python学习全系列教程永久可用
- 蓝奏云批量上传工具.zip
- python书籍 PDF
- 老男孩python项目实战
- Python.rar99111
- decision_tree_v2.py
- Python绝技运用Python成为顶级黑客.pdf
- python小波包文档及论文.zip
- Python黑帽子(黑客与渗透测试编程之
- FlaskWeb开发:基于Python的Web应用开发实
- Python基础教程第3版中英文源码.rar
- python数据结构与算法中文版.zip
- Python-冲顶大会芝士超人西瓜视频头脑
- time_series_forecasting_with_python.zip
- Python基础教程第三版PDF高清可复制.
- python编程从入门到实践.zip237878
- FlaskWeb开发:Python基于Web应用开发实战
- pythonBCRMDSJ.mobi
- 量化交易之路用Python做股票量化分析
- PYTHON自然语言处理中文版.pdf
- Python基础教程(第3版).rar
- GRAYHATPYTHON高清.英文.书签版.pdf
- Python简明教程第四版.rar
- Python编程:从入门到实践带书签完整
- Python基础教程(第3版).pdf109608
- vamei-从Python开始学编程.pdf
- 利用Python进行数据分析.pdf
- 小甲鱼零基础学python课后习题和答案
- Python编程:从入门到实践-PythonCrashC
评论
共有 条评论