昨天在调研AI软件的时候发现,现在PDF翻译怎么收费还是这么离谱的高。
论文翻译的需求还是很多的,而且用量也大。
某大厂,不说哪家了,59块钱只能翻译5w字,这是认真的吗????
长一点的论文根本不止5w字吧,也就是说一个月的会员还不够翻译一篇。
不知道你们对这类软件的价格接受程度怎么样,反正我是觉得有点太贵了。
现在AI论文翻译已经很成熟了,落地一个也很容易,大厂卖的这么贵也算是给小团队一些机会。
今天给大家推荐两个开源项目:
- 一个是PDF转Markdown、JSON,格式处理得很好。
- 另一个是基于这个项目做的实际落地的工具,做了很多额外的功能。
MinerU
项目简介
MinerU 是一个开源的高质量数据提取工具,能将 PDF 转化为系统可读格式,如 Markdown、JSON 等。它能很好的解决科技文献符号转换问题。具备去除页眉页脚、输出按人类阅读顺序文本、保留文档结构等多种功能,支持 CPU 和 GPU 环境,兼容多平台。
功能特点
- 格式转换与结构保留:去除 PDF 中的页眉、页脚等冗余内容,按人类阅读习惯输出文本,同时保留原文档的标题、段落、列表等结构。
- 元素提取与格式转换:自动提取图像、表格、脚注等元素,把公式转为 LaTeX 格式,表格转为 HTML 格式,方便后续处理。
- 智能识别与多语言支持:自动检测扫描或乱码 PDF 并启用 OCR 功能,支持 84 种语言的检测和识别,还能自动识别文档语言以选择合适的 OCR 模型。
- 多模式加速与多平台兼容:支持 CPU 运行,也可利用 GPU、NPU、MPS 进行加速。兼容 Windows、Linux、Mac 平台,满足不同用户的设备需求。
- 多样输出与可视化:支持多种输出格式,如多模态和 NLP Markdown、按阅读顺序排序的 JSON 等。还提供布局和跨度可视化结果,便于确认输出质量。
项目链接
https://github.com/opendatalab/MinerU
mad-professor(疯狂的教授)
起的名很有意思。
项目简介
mad-professor 集成了 PDF 处理、AI 翻译、RAG 检索、AI 问答和语音交互等功能,通过富有个性的暴躁 AI 教授,让学术论文阅读更加高效有趣。它具备完善的项目结构,涵盖核心模块、用户界面组件等。
功能特点
- 全流程论文阅读:从 PDF 加载、解析,到内容检索、问答,再到结果语音播报。
- 智能交互体验:利用 RAG,结合 AI 问答和语音交互,让用户能以自然语言与系统交流,快速获取论文关键信息。
- 高效翻译支持:集成 AI 翻译功能,可将英文论文快速翻译成中文,提升阅读效率。
- 个性化角色设定:以 “暴躁教授” 形象为交互特色,增加阅读趣味性和记忆点。
- 跨平台使用:借助 Streamlit 构建 Web 应用,方便在不同操作系统上使用。
项目链接
https://github.com/LYiHub/mad-professor-public