pdf2word/README.md

74 lines
2.4 KiB
Markdown
Raw Permalink Normal View History

2025-04-26 14:32:43 +08:00
# PDF工具箱
一个简单易用的PDF处理工具支持多种格式转换和PDF文件处理功能。
## 功能特性
- PDF转Word将PDF文件转换为Word文档
- PDF转图片将PDF文件转换为图片文件
- PDF转Markdown提取PDF文本内容并转换为Markdown格式
- PDF转Excel将PDF中的表格数据提取为Excel文件
- PDF合并将多个PDF文件合并为一个文件
- PDF拆分将PDF文件拆分为多个单页文件
- PDF压缩压缩PDF文件大小
## 环境要求
- Python 3.11 或更高版本
- 所需Python包已在 requirements.txt 中列出
- 对于PDF转Excel功能需要安装Java环境
- 安装Java JDK推荐Java 8或更高版本
- 配置JAVA_HOME环境变量
- 将Java添加到系统PATH中
### Java环境配置步骤仅PDF转Excel功能需要
1. 下载并安装Java JDK
- 访问 [Oracle Java下载页面](https://www.oracle.com/java/technologies/downloads/) 或使用OpenJDK
- 选择适合您系统的Java版本进行下载和安装
2. 配置环境变量
- 右键"此电脑" -> "属性" -> "高级系统设置" -> "环境变量"
- 在系统变量中新建 JAVA_HOME值为Java安装目录C:\Program Files\Java\jdk-x.x.x
- 在系统变量Path中添加 %JAVA_HOME%\bin
3. 验证安装
- 打开命令提示符
- 输入 `java -version`
- 如果显示版本信息,说明配置成功
## 安装步骤
1. 克隆或下载本项目
2. 安装依赖包:
```bash
pip install -r requirements.txt
```
## 打包说明
如果您想将程序打包成可执行文件可以使用PyInstaller进行打包
1. 首先安装PyInstaller
```bash
pip install pyinstaller
```
2. 进入项目目录,运行以下命令进行打包:
```bash
pyinstaller --onefile --windowed --add-data "src;src" --add-data "config.json;." --add-data "requirements.txt;." main.py
```
3. 打包完成后在dist目录下会生成可执行文件。
打包完成后,可执行文件将在 dist/PDF工具箱 目录中生成。
注意事项:
- 打包前请确保已安装所有依赖包
- 如果使用PDF转Excel功能打包后的程序仍然需要Java环境
- 首次运行打包后的程序可能需要稍等片刻
## 使用说明
打包命令的参数说明:
- `--name "PDF工具箱"`: 设置生成的程序名称
- `--windowed`: 不显示控制台窗口
- `--icon=assets/icon.ico`: 设置程序图标(如果有的话)
- `--add-data "assets;assets"`: 包含资源文件(如果有的话)