AI 翻译领域的几个开源免费工具介绍
2025-06-07 08:16:04
AI 翻译领域的几个开源免费工具介绍
一、ePub 电子书翻译软件 - LinguaGacha\nLinguaGacha 在 AiNiee 的基础上进行了优化,主要体现在:\n1、速度更快\n2、界面更简洁\n3、支持翻译.md(markdown)文件\n但是 LinguaGacha 和 AiNiee 都有个问题就是在翻译的同时,会去除原始 ePub 文件中的排版格式,这样子对于以文字为主的 ePub 文件影响不大,但是对于理工科那些包含较多公式、代码的效果就会比较差。所以我在 LinguaGacha 原版基础上又做了优化,主要就是尽最大可能保留原始的排版,对于公式、代码的支持会好一些。\n二、PDF 翻译软件\nPDF 的翻译有好几种方案,分别说明如下:\n1、PDFMathTranslate (又名 PDF2ZH)方案\n2、Gemini 方案\nGemini 方案也就是利用谷歌的 Gemini 大模型,又可以分为手动版和自动版。\n3、MinerU 方案\n这个方案比较繁琐,要先利用 MinerU 把 pdf 文件转换为 markdown 文件,再利用前面介绍的 LinguaGacha 翻译软件来翻译 markdown 文件,最后可以在 Visual Studio Code 中把 .md 文件转换为 pdf 文件。\n三、视频翻译及配音\n利用 Github 上的开源软件 VideoLingo,可以实现对英语视频文件提取声音为字幕、字幕翻译以及配音。\n1、声音转文本\n其中提取声音生成文本这一步是利用的 Whisper 大模型,可以选择使用本地部署的 Whisper 大模型,也可以使用云服务。\n2、翻译字幕\n第二步是要将提取声音转换出来的字幕翻译到指定语言,这一步需要调用文本大模型来完成。\n3、配音\n第三步则是要将字幕再转换为语音,以达到配音的效果。由于 VideoLingo 默认支持的 TTS 大模型基本都是云端的,本地部署的 TTS 大模型只支持 GPTSovits,而 GPTSovits 又过于复杂,尤其是克隆语音的话还需要自行训练,不支持零样本克隆,所以我干脆优化了一下代码,支持我自己本地部署的 CosyVoice2。\n \n#大模型 #pdf #翻译 #电子书 #电子书翻译 #视频翻译 #字幕 #ai #VideoLingo #Whisper