Python爬取豆瓣网上电影信息

大小: 1KB

文件类型: .py

金币: 1

下载: 0 次

发布日期: 2021-01-09
语言: Python
标签: 爬取豆瓣

高速下载

资源简介

用Python爬虫从豆瓣电影的首页那一页中，爬取那页的电影名称，上映时间，国家，豆瓣评分，主演，然后再讲结果写到*.txt文件中

资源截图

小图大图

代码片段和文件信息

# _*_ encoding:utf-8 _*_

import requests
from bs4 import BeautifulSoup
import json
import time
import random

def get_movie_id（types）:
    ids = []
    contents = requests.get（
        ‘https://movie.douban.com/j/search_subjects?type=movie&tag={0}&sort=recommend&page_limit=50&page_start=0‘.format（
            types））
    subjiects = json.loads（contents.content.decode（“utf-8“））[“subjects“]
    for subject in subjiects:
        ids.append（subject[‘id‘]）
    print（ids）
    return ids


def detail（_id）:
    content = requests.get（‘https://movie.douban.com/j/subject_abstract?subject_id={0}‘.format（_id））
    subject = json.loads（content.content.decode（“u

上一篇：python正向最大匹配分词和逆向最大匹配分词
下一篇：基于前推回代法的潮流计算python实现

共有条评论

Python爬取豆瓣网上电影信息

资源简介

资源截图

代码片段和文件信息

评论

相关资源