设为首页收藏本站

 找回密码
 立即注册

只需一步,快速开始

搜索
查看: 257|回复: 23

[实用软件] PDF文档提取工具-MinerU 本地离线版

 火... [复制链接]
累计签到:26 天
连续签到:1 天
灌水成绩
14
61
4896
主题
帖子
积分

等级头衔

ID : 654

助理工程师

积分成就 测量币 : 4896
在线时间 : 0 小时
注册时间 : 2025-11-18
最后登录 : 2026-5-19

勋章
UID勋章测量学徒测量员
发表于 2026-4-16 14:31:41 | 显示全部楼层 |阅读模式 IP:北京
之所以另起一个帖子,是因为市面上存在MinerU1.0版本 并且还要手动各种修改,怪麻烦的,所以DIY了一个离线版本,多少会有些许Bug,请各位大佬勿喷
首页


转换后


版本介绍

mineruBat├── beacon│   ├── __init__.py│   ├── update.cp310-win_amd64.pyd│   ├── models.cp310-win_amd64.pyd│   ├── venv.cp310-win_amd64.pyd│   └── core.cp310-win_amd64.pyd├── output├── python_embeded├── mineru.json├── pipeline.py└── setup.exe功能介绍

1.支持包含数学公式的 PDF 转换为 可以复制黏贴的汉字
2.支持包含文本的 PDF 转换为 可以复制黏贴的汉字
3.支持包含图片的 PDF 转换为 可以复制黏贴的汉字
4.支持包含表格的 PDF 转换为 可以复制黏贴的汉字
5.支持 GPU 转换, 使用全新版本,选择模型下载,功能页面(服务:vlm-transformers)
初始版本与全新版本区别

版本空间大小环境模型升级分享他人使用必要条件全新版68M需要下载需要下载可以可以需要联网下载环境与模型初始版2.6G不用下载不用下载不可以不可以解压即可使用全新版本


点击 常规 标签页
启动程序入口

点击 环境 标签页

下载虚拟环境mineru相关依赖包并升级,如果想要更新pip版本的话,我后面可以加一个升级pip的功能  

点击 模型 标签页
下载CPU、GPU使用的大模型文件

点击 升级 标签页
升级mineru版本

点击 设置 标签页
输入电脑IP或者点击获取按钮,运行成功后复制控制台地址给他人,同时手机也可以访问使用(需在同一个局域网内)
link.txt
通过网盘分享的文件mineruBat.7z MD5:  fbf2cb96e80a6cccecf1ef2e26977b1a
觉得不错可以给个小红心
想体验初始版版本请移步 MinerU 2.0 下载地址 https://www.52pojie.cn/forum.php?mod=viewthread&tid=2043840
初始版本演示

由于官方MinerU git库 没有合并我提交的PR因此:
1.后续更新程序更新的内容首页汉化版将失效自动变成英文版本
2.不会自动弹出浏览器网页需手动复制控制台网址,黏贴进浏览器地址栏中打开
3.不在提供自动弹出网页和汉化
请知悉~
refer to: https://github.com/opendatalab/MinerU/pull/3190
问题

1.如果发生 DLL load failed while importing onnxruntime_pybind11_state: 动态链接库(DLL)初始化例程失败。
请安装VC_redist.x64.exe
2.Microsoft Visual C++ Redistributable is not installed, this may lead to the DLL load failure.
It can be downloaded at https://aka.ms/vs/16/release/vc_redist.x64.exe
请安装VC_redist.x64.exe
3.为什么在无网络电脑里 不能使用 ,提示错误:设置模板配置路径时发生错误 - [WinError 5] 拒绝访问?
想在无网络电脑里使用,需提前在有网络电脑里下载模型,完成下载后把模型 modelscope 文件夹 和 env 文件夹 复制黏贴到无网络电脑同目录下
累计签到:28 天
连续签到:1 天
灌水成绩
0
169
12506
主题
帖子
积分

等级头衔

ID : 598

中级工程师

积分成就 测量币 : 12506
在线时间 : 0 小时
注册时间 : 2025-12-27
最后登录 : 2026-7-3

勋章
UID勋章测量学徒测量员
发表于 2026-4-19 16:42:58 | 显示全部楼层 IP:保加利亚
结构很完整,从基础到进阶都覆盖了。
回复

使用道具 举报

累计签到:59 天
连续签到:40 天
灌水成绩
4
241
16525
主题
帖子
积分

等级头衔

ID : 535

中级工程师

积分成就 测量币 : 16525
在线时间 : 527 小时
注册时间 : 2026-2-19
最后登录 : 2026-7-5

勋章
UID勋章测量学徒测量员
发表于 2026-4-30 09:16:20 | 显示全部楼层 IP:北美地区
排版舒服,阅读体验很好。
回复

使用道具 举报

累计签到:61 天
连续签到:45 天
灌水成绩
2
268
18714
主题
帖子
积分

等级头衔

ID : 525

中级工程师

积分成就 测量币 : 18714
在线时间 : 521 小时
注册时间 : 2025-10-10
最后登录 : 2026-7-5

勋章
发表于 2026-5-1 01:19:47 | 显示全部楼层 IP:广东东莞
语言通俗易懂,没有太多晦涩术语。
回复

使用道具 举报

累计签到:28 天
连续签到:1 天
灌水成绩
1
201
13490
主题
帖子
积分

等级头衔

ID : 599

中级工程师

积分成就 测量币 : 13490
在线时间 : 0 小时
注册时间 : 2025-12-25
最后登录 : 2026-7-4

勋章
UID勋章测量学徒测量员
发表于 2026-5-1 01:21:43 | 显示全部楼层 IP:广东东莞
步骤完整,不会出现半路卡住。
回复

使用道具 举报

累计签到:63 天
连续签到:42 天
灌水成绩
2
252
15478
主题
帖子
积分

等级头衔

ID : 586

中级工程师

积分成就 测量币 : 15478
在线时间 : 529 小时
注册时间 : 2026-1-15
最后登录 : 2026-7-5

勋章
UID勋章测量学徒测量员
发表于 2026-5-1 01:41:59 | 显示全部楼层 IP:广东东莞
解决了我项目里的一个关键问题。
回复

使用道具 举报

累计签到:28 天
连续签到:1 天
灌水成绩
1
201
13490
主题
帖子
积分

等级头衔

ID : 599

中级工程师

积分成就 测量币 : 13490
在线时间 : 0 小时
注册时间 : 2025-12-25
最后登录 : 2026-7-4

勋章
UID勋章测量学徒测量员
发表于 2026-5-1 01:43:51 | 显示全部楼层 IP:广东东莞
示例丰富,理解更直观。
回复

使用道具 举报

累计签到:57 天
连续签到:46 天
灌水成绩
3
204
13241
主题
帖子
积分

等级头衔

ID : 520

中级工程师

积分成就 测量币 : 13241
在线时间 : 517 小时
注册时间 : 2025-11-1
最后登录 : 2026-7-5

勋章
UID勋章测量学徒测量员
发表于 2026-5-1 01:43:51 | 显示全部楼层 IP:广东东莞
语言通俗易懂,没有太多晦涩术语。
回复

使用道具 举报

累计签到:62 天
连续签到:45 天
灌水成绩
3
228
14079
主题
帖子
积分

等级头衔

ID : 512

中级工程师

积分成就 测量币 : 14079
在线时间 : 522 小时
注册时间 : 2025-9-22
最后登录 : 2026-7-5

勋章
UID勋章测量学徒测量员
发表于 2026-5-1 01:43:51 | 显示全部楼层 IP:广东东莞
对底层原理讲得很清楚。
回复

使用道具 举报

累计签到:57 天
连续签到:45 天
灌水成绩
2
242
15381
主题
帖子
积分

等级头衔

ID : 587

中级工程师

积分成就 测量币 : 15381
在线时间 : 531 小时
注册时间 : 2025-9-29
最后登录 : 2026-7-5

勋章
UID勋章测量学徒测量员
发表于 2026-5-1 07:28:26 | 显示全部楼层 IP:美国
很多技巧非常实用。
回复

使用道具 举报

快速回复换一批
顶顶顶
路过留名
先赞后看,养成习惯! 感谢大佬指路,回帖留名以备日后查阅。 📝🚀
前排围观! 搬好小板凳,坐看大佬们在线battle技术。 🪑🍿
博大精深。 关注楼主了,以后这类硬核文章请务必多发一些! 🔔❤️
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|精密测量技术论坛 ( 桂ICP备2026007449号-1 )

GMT+8, 2026-7-5 15:03 , Processed in 0.304140 second(s), 53 queries .

Powered by 精密测量技术论坛

© 2025-2026 联系站长

快速回复 返回顶部 返回列表