资源简介
代码片段和文件信息
# -*- coding: utf-8 -*-
from pdfminer.pdfparser import PDFParser
from pdfminer.pdfdocument import PDFDocument
from pdfminer.pdfpage import PDFPage
from pdfminer.pdfpage import PDFTextExtractionNotAllowed
from pdfminer.pdfinterp import PDFResourceManager
from pdfminer.pdfinterp import PDFPageInterpreter
from pdfminer.pdfdevice import PDFDevice
from pdfminer.layout import *
from pdfminer.converter import PDFPageAggregator
import os
# os.chdir(r‘F:\test‘)
fp=open(r‘笨方法学Python.PDF‘‘rb‘)
#来创建一个pdf文档分析器
parser = PDFParser(fp)
#创建一个PDF文档对象存储文档结构
document = PDFDocument(parser)
# 检查文件是否允许文本提取
if not document.is_extractable:
raise PDFTextExtractionNotAllowed
else:
# 创建一个PDF资源管理器对象来存储共赏资源
rsrcmgr=PDFResourceManager()
# 设定参数进行分析
laparams=LAParams()
# 创
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 1017966 2019-12-02 17:51 笨方法学Python.PDF
文件 1705 2019-12-03 09:24 pdf2txt.py
相关资源
- Django2 文件上传及功能支持中文名文件
- 深度学习入门:基于Python的理论与实
- 《Python3爬虫、数据清洗与可视化》
- IDA.Pro.v7.2_Hgl-Green(Python)+7.0(x86ar
- python项目开发案例集锦
- 《Python开发实战》(PDF版高清扫描版
- opencv_python官方中文教程源码修改版
- Python学习手册(第3版)-带目录完整版
- python2.7:scipy-0.19.0-win64
- Python Cookbook 第3版 中文版.pdf
-
ba
semap-1.2.1-cp37-cp37m-win_amd64.whl - 《Python源码剖析-深度探索动态语言核
- MDNETpython实现
- Python + PyQt5 + MySQL模拟QQ的聊天与娱乐
- 《Python深度学习》2018中文
- opencv3计算机视觉 python实现
- python项目web
- 目标跟踪CSK算法python实现
- Pycharm+Django+Python+MySQL开发
- Python自动化运维技术与最佳实践
- Python学习手册.mobi kindle电子书 带源码
- OpenCV 3-python语言
- Python基础教程 Beginning Python From Novic
- Selenium2 Python自动化测试实战第二版高
- 《selenium2 python 自动化测试实战第二版
- opencv_python-3.4.0+contrib-cp36-cp36m-win_amd
- 机电控制python
- scipy-1.0.0-cp36-none-win_amd64.whl
- python2.7、numpy、matplotlib在windows 64位平
- 《Python深度学习》中文版pdf+英文版
评论
共有 条评论