Umi-OCR是一款功能实用的图片识别软件,专注于批量导入本地图片,并将图片中的文本识别出来,输出至软件面板或本地txt文件。
该软件的一大特色是拥有忽略指定区域的特殊功能。在实际应用场景中,诸如含水印的视频截图、含有UI/按钮的游戏截图等,往往仅需提取字幕区域的文本,避免提取到水印和UI文本。Umi-OCR通过设置忽略某些区域内的文字,能够轻松实现这一目的,尤其适合批量提取Galgame截图中的台词。当面临大量影视和游戏截图需要整理归档,或是想要翻找包含某一段台词/字幕的截图时,通过该软件提取图片文字,再使用Ctrl+F搜索,是一种极为有效的方法。
此外,Umi-OCR使用离线OCR模块PaddleOCR-json图片转文字程序,使用过程无需联网。它支持更换Paddle官方模型(v2.x版本)或用户自己训练的模型,还能修改PaddleOCR参数,通过添加不同的语言模型,可实现多国语言的识别。
在v2.1.2版本中,软件进行了多项更新。新增了批量任务(图片、文档)暂停功能,待机/休眠后可恢复任务;文档任务支持保存为单层纯文本PDF;HTTP OCR接口允许设置忽略区域参数;HTTP二维码接口允许设置图像预处理参数;命令行–screenshot允许指定屏幕范围,自动进行截图等。同时,还修复了文档内容提取和写入时的坐标旋转、比例适配问题,优化了批量文档标签页在拖入大量文件、提交大批任务时的性能和流畅度,以及文档任务保存的文件名规则,对UI布局、文本和视觉效果也进行了优化。



10积分