前言:
中国知网的某些文献(多为学位论文)仅提供其专有的 CAJ 格式下载,仅能使用知网提供的软件(如 CAJViewer 等)打开,给文献的阅读和管理带来了不便(尤其是在非 Windows 系统上)。
若要将 CAJ 文件转换为 PDF 文件,可以使用 CAJViewer 的打印功能。但这样得到的 PDF 文件的内容为图片,无法进行文字的选择,且原文献的大纲列表也会丢失。使用caj2pdf可以解决上述两问题。
安装:
- 环境要求:Python 3.3+ (https://www.python.org/downloads/windows/)
我用的是Python 3.8.7(Win7不支持Python 3.9+),caj2pdf可以正常使用
1.安装依赖
pip install PyPDF2
2.克隆代码到本地
git clone https://github.com/caj2pdf/caj2pdf.git
3.下载mutool(目前最新的是1.18.0版,如果后面有更新的下载最新版即可)
下载地址:https://mupdf.com/downloads/archive/mupdf-1.18.0-windows.zip
下载后解压mupdf-1.18.0-windows.zip
4.解压后复制mutool.exe
到caj2pdf
目录下
(或者直接下载我的打包版,执行pip install PyPDF2
安装依赖后,再下载解压我的压缩包,进入caj2pdf
就可以直接使用了,压缩包下载地址:https://fourdmayi.lanzous.com/iZjE9mltasf
)
caj2pdf使用:
进入caj2pdf
目录,开始转换
简单使用示例:
cd caj2pdf
python caj2pdf convert 心理距离对沉没成本效应的影响_张琪琪.caj -o 心理距离对沉没成本效应的影响_张琪琪.caj.pdf
没报错的话基本上1秒左右就转换完成了。
基本用法:
# 打印文件基本信息(文件类型、页面数、大纲项目数)
caj2pdf show [input_file]
# 转换文件
caj2pdf convert [input_file] -o/--output [output_file]
# 从 CAJ 文件中提取大纲信息并添加至 PDF 文件
## 遇到不支持的文件类型或 Bug 时,可用 CAJViewer 打印 PDF 文件,并用这条命令为其添加大纲
caj2pdf outlines [input_file] -o/--output [pdf_file]
批量转换的话可以通过脚本实现