pdf2word/README.md

45 lines
1.5 KiB
Markdown
Raw Normal View History

# PDF工具箱
一个简单易用的PDF处理工具支持多种格式转换和PDF文件处理功能。
## 功能特性
- PDF转Word将PDF文件转换为Word文档
- PDF转图片将PDF文件转换为图片文件
- PDF转Markdown提取PDF文本内容并转换为Markdown格式
- PDF转Excel将PDF中的表格数据提取为Excel文件
- PDF合并将多个PDF文件合并为一个文件
- PDF拆分将PDF文件拆分为多个单页文件
- PDF压缩压缩PDF文件大小
## 环境要求
- Python 3.11 或更高版本
- 所需Python包已在 requirements.txt 中列出
- 对于PDF转Excel功能需要安装Java环境
- 安装Java JDK推荐Java 8或更高版本
- 配置JAVA_HOME环境变量
- 将Java添加到系统PATH中
### Java环境配置步骤仅PDF转Excel功能需要
1. 下载并安装Java JDK
- 访问 [Oracle Java下载页面](https://www.oracle.com/java/technologies/downloads/) 或使用OpenJDK
- 选择适合您系统的Java版本进行下载和安装
2. 配置环境变量
- 右键"此电脑" -> "属性" -> "高级系统设置" -> "环境变量"
- 在系统变量中新建 JAVA_HOME值为Java安装目录C:\Program Files\Java\jdk-x.x.x
- 在系统变量Path中添加 %JAVA_HOME%\bin
3. 验证安装
- 打开命令提示符
- 输入 `java -version`
- 如果显示版本信息,说明配置成功
## 安装步骤
1. 克隆或下载本项目
2. 安装依赖包:
```bash
pip install -r requirements.txt