PDF翻译-ai加持下的梅开二度

之前 pdf 翻译,看了别人的开源项目,一般是先解析为 md 文件,再翻译,现在借助多模态 ai 强大的图片ocr 可以直接翻译

主要思路,把 PDF 转为一张张图片,然后给 ai ,让其输出翻译好的 md 文本,工具如下:

PDF翻译-ai加持下的梅开二度

我用的豆包 1.5 的 vision 版本-大模型 api,提示词也可以自定义
效果大概如下图:

PDF翻译-ai加持下的梅开二度

推荐火山引擎 api: https://console.volcengine.com/auth/login
还有一个硅基流动的: https://siliconflow.cn/zh-cn/
openrouter 好像也有些免费的

蓝奏云工具下载链接,api 在 config.json 里面要自己填下:
https://wwzw.lanzoup.com/i70mH2u34nve

这是源代码: https://wwzw.lanzoup.com/i60jm2u34ydc

发送评论(暂无评论) 本站使用 Cookie 技术保留您的个人信息