PDF翻译-ai加持下的梅开二度 - TreeBlog

PDF翻译-ai加持下的梅开二度

2025年04月21日
无评论
353次阅读

之前 pdf 翻译，看了别人的开源项目，一般是先解析为 md 文件，再翻译，现在借助多模态 ai 强大的图片ocr 可以直接翻译

主要思路，把 PDF 转为一张张图片，然后给 ai ，让其输出翻译好的 md 文本，工具如下：

我用的豆包 1.5 的 vision 版本-大模型 api，提示词也可以自定义
效果大概如下图：

推荐火山引擎 api： https://console.volcengine.com/auth/login
还有一个硅基流动的： https://siliconflow.cn/zh-cn/
openrouter 好像也有些免费的

蓝奏云工具下载链接，api 在 config.json 里面要自己填下：
https://wwzw.lanzoup.com/i70mH2u34nve

这是源代码： https://wwzw.lanzoup.com/i60jm2u34ydc

版权属于： yangshu

本文链接： http://bk.treeblog.top/index.php/archives/170/

文章标签：无标签

文章采用： CC BY-NC-SA 4.0 许可协议授权

发送评论（暂无评论）本站使用 Cookie 技术保留您的个人信息