• 大小: 0M
    文件类型: .py
    金币: 2
    下载: 1 次
    发布日期: 2021-07-31
  • 语言: Python
  • 标签: 其他  

资源简介

爬取下载网易云音乐.py

资源截图

代码片段和文件信息

from urllib import request
import requests
import re          #Re库是Python的标准库,主要用于字符串匹配
from bs4 import BeautifulSoup  #BeautifulSoup库通过解析文档为用户提供需要抓取的数据
                               #Beautiful Soup自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码
from pprint import pprint
import urllib time

def get_content(url):
    headers = {
        ‘Host‘: ‘music.163.com‘
        ‘Referer‘: ‘https://music.163.com/‘
        ‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML like Gecko) Chrome/64.0.3282.140 Safari/537.36‘
    }
    r = requests.session()
    r = BeautifulSoup(r.get(url headers=headers).content “html.parser“)#返回的网页部分会存在.content对象中,content中间存的是字节码
    return r

def save(r):
    music_dict = {}
    result = r.find(‘ul‘ {‘class‘: ‘f-hide‘}).find_all(‘a‘) #re.findall()搜索字符串,以列表类型返回全部能匹配的子串
    # print(result)
    for music in result:
        music_dict[music[‘href‘].strip(“/song?id=“)] = music.text
    # for k v in src_dict.items():
    # print(k v)
    return music_dict


def download_song(song_id music_dict):
    try:
        song_url = ‘http://music.163.com/song/media/outer/url?id=%s.mp3‘ % song_id  # 该链接为浏览器在网页版缓存歌曲的下载链接
        

评论

共有 条评论