pdf2htmlEx - html高度还原pdf

引言

本篇针对我的上篇文章翻译手册技巧,对 pdf 转 html 进行一个补充。

上一篇文章,我使用了福晰 pdf 编辑器,对 pdf 转换成 html 来对英文进行翻译,具体效果如下:

00.png

转换完成后,效果很差,排版与原始的 pdf 相差太远,所以基于这点考虑,我就想是否有替代的方式可以保留原始格式,最终在 Github 上,看到作者 coolwanglu 的开源项目 pdf2htmlEx,可以完美的解决这个问题。

pdf2htmlEx

介绍

该项目地址为:https://github.com/coolwanglu/pdf2htmlEX。

pdf2htmlEX 利用现代 Web 技术以 HTML 格式呈现 PDF 文件。

贴两个作者项目的效果图:

01.png

02.png

转换完的 html 效果基本完美的还原了 pdf 的格式,具体的其他展示可以去项目地址查看。

下载

有能力的读者可以下载源码自行编译,项目的 Wiki 介绍了使用方法及构建的方法。

这里我直接用简单的方法,Wiki 上下载页有打包者打包好的各环境的包,这里我用的 Windows,所以直接点击进入下载。

03.png

下滑至下载,选择第一个进行下载即可。

04.png

下载至本地后,解压到自己需要保存的路径,

05.png

接下来,就可以直接用下载好的工具,对 pdf 进行转换了,

在工具目录下右键打开命令行,为了简单,我直接把要转换的 pdf 拖到工具目录下,

06.png

由于不需要特殊处理,我直接用最简单的命令进行转换,转换完成后,会在当前路径生成 html。

07.png

转换效果如图:

08.png

软件更多的操作命令,可以在作者项目的 wiki 里看到,这里我就不过多陈述了。

结语

使用 pdf2htmlEx 转换后的 html 格式高度的还原了 pdf,对比之前的工具,这个已经堪称神器了,配合翻译,可以更加高效的阅读文档,所以十分推荐大家使用这个~