Umi-OCR是一款实用的批量图片识别软件,能够批量导入本地图片,精准识别图片中的文本,并输出到软件面板或本地txt文件。
该软件一大特色在于具备忽略指定区域的特殊功能。像含水印的视频截图、带有UI/按钮的游戏截图等,通常只需提取字幕区域的文本,避免水印和UI文本的干扰,Umi-OCR通过设置忽略某些区域内的文字来实现这一目的,尤其适合批量提取Galgame截图中的台词。当有大量影视和游戏截图需要整理归档,或是翻找包含特定台词/字幕的截图时,提取图片文字后使用Ctrl+F搜索是十分有效的方法,这也是软件的开发初衷。
软件使用离线OCR模块PaddleOCR-json图片转文字程序,使用过程无需联网。支持更换Paddle官方模型(v2.x版本)或自行训练的模型,还能修改PaddleOCR参数,添加不同语言模型后可识别多国语言。
在v2.1.2版本中,软件进行了多项更新。新增了批量任务(图片、文档)暂停功能,待机/休眠后可恢复任务;文档任务支持保存为单层纯文本PDF;HTTP OCR接口允许设置忽略区域参数;HTTP二维码接口允许设置图像预处理参数;命令行–screenshot允许指定屏幕范围自动截图等。同时还修复了文档内容提取和写入时的坐标旋转、比例适配问题,优化了批量文档标签页性能和流畅度、文件名规则以及UI布局等。



10积分