良言一句三冬暖,恶语伤人六月寒。
--明代谚语
:

给pdf电子书添加目录

给pdf电子书添加目录

给pdf电子书添加目录

给pdf电子书添加目录

有些比较古老的电子书没有目录,读起来很不方便。GitHub上有些工具能把生成号的目录写入到PDF文件,但是需要有一个生成好的目录格式,其实就是一个ocr文字识别的过程,这个其实可以交给AI了。\n我用DeepSeek+pdf.tocgen搞定了一本书的目录生成。\n先把目录截图,发给deepseek让他生成目录。因为前面有序言之类的,所以书正文的第1页其实是这本电子书的第十几页了,所以目录里的页码和电子书的页码有些偏差(见图2),可以叫DeepSeek处理的时候加上这个偏差。还可以给DeepSeek一个例子,这样准确率更高,我给的提示词是这样的:\n\n用我提供的目录图片生成一个pdftocio工具能识别的目录toc文件,需要把页面数字都加上17。\n例如前几行是这样的:\n“一、不均匀的土地” 18\n“1. 美国制造的疑惑” 18\n\n把DeepSeek的输出保存为下来,然后我用的pdftocio:\n\npdftocio -o 输出.pdf 输入.pdf < toc\n\n还有挺多工具都把生成好的目录写入PDF的,可能格式会有一点点不一样,让AI处理的时候给个例子就行了,AI很强的