PandaOCR - 开源免费的多功能OCR图文识别+翻译+朗读+弹窗+公式+图床+搜图+二维码

小李子 2020-06-03 Windows 实用工具 931 ℃

一、软件简介

PandaOCR是一款开源免费的多功能OCR图文识别软件,集成了翻译、朗读、弹窗、公式、图床、搜图、二维码等功能。

很多时候,我们在网上看到有一些文章,比如百度文库,但是却不能复制内容,或者是图片或者扫描型PDF,这些内容都不能直接复制,怎么办才好呢,这时OCR就排上用场了,OCR全名Optical Character Recognition,光学字符识别,即能识别字符并转换为可复制的文字。

市面上的OCR软件很多,但是都存在很多问题,比如最直接的经济问题,商业OCR都是很贵的,不适合我们这种学生等个人使用的场合,没必要花那么多的钱去购买一个月用不了几次的服务。另外,很多免费OCR软件不支持自定义OCR的API接口,因为每种API接口的识别准确性不一样,有时需要变换接口直到取得最佳的识别效果。

今天介绍一款被站长本人认为最优秀的OCR软件——PandaOCR。不冲功能是否比其他软件多,就冲OCR识别来说,站长最喜欢PandaOCR的各种接口了,还可以自定义。

PandaOCR

OCR:12个演示接口+4个API接口

首先,OCR是这款软件最重要的功能,集成了:搜狗OCR、腾讯OCR、百度OCR、有道OCR、京东OCR、华为OCR、网易OCR、讯飞OCR、必应OCR、SpaceOCR、YandexOCR、微软公式等各大接口,更重要的是,有4个API接口(搜狗OCR、腾讯OCR、百度OCR、有道OCR)可以用自己申请的!!!这是其他OCR所没有的功能,比如以前也是开源的天若OCR(现在已经收费),现在的天若OCR免费版本是不支持自定义OCR接口的;有些就是只能自定义百度OCR接口。

具体如何使用自己申请的OCR接口,只需要在配置文件CONFIG.ini里进行设置,配置文件里的注释已经足够详细能教会你如何使用自己申请的API接口了。

PandaOCR

这是一些API接口的申请网址:

PandaOCR进行识别的方式有3种:图片识别、截图识别、剪切识别。其中,图片识别是直接打开你需要进行识别的图片进行识别;截图识别是在屏幕上的特定区域进行识别,点击后直接在需要识别的地方截个图,然后就会自动识别了。剪切识别是当你在网上找到一张图片,但是你不想下载下来,又懒得截图,你可以直接复制图片,然后点击剪切识别即可实现识别啦!还有,PandaOCR还支持把图片拖入窗口中实现自动识别,真的很方便。

PandaOCR

PandaOCR还支持公式识别。对于要写作的人,如果对不熟悉用代码来编写公式的话是比较慢的,有时候也懒得打公式,这时可以直接使用PandaOCR进行识别,省下很多时间。

PandaOCR

翻译:20个演示接口+5个API接口

PandaOCR除了是一款OCR软件,还是一款翻译软件,PandaOCR的翻译引擎支持:搜狗翻译/API+腾讯翻译/API+百度翻译/API+有道翻译/API+谷歌翻译+词霸翻译+必应翻译+沪江翻译+奇虎翻译+海词翻译+彩云翻译等。

当你需要使用OCR识别英文等语言时,你可以选择在识别时自动翻译,直接省去了又要在翻译软件进行翻译的步骤。如果不用OCR但也要翻译时,同样可以在PandaOCR软件里输入、粘贴需要翻译的原文,点击翻译即可实现翻译。或者在文本区输入文本后按CTRL+回车键会直接翻译,不需要再用鼠标点翻译按钮。这样子你又可以卸载一个翻译软件了。

PandaOCR

有时候在正版限免下载的软件并不都是中文界面的,有很多是英文界面的,而英文不好的人怎么无障碍使用?别慌,PandaOCR还有汉化功能,你可点击汉化按钮,然后不放并拖动到需要汉化的窗口即可实现翻译。还有,有人喜欢玩游戏的,也可以用它来实现游戏的实时汉化,不用苦苦求官方汉化啥的。具体如何操作,可以上B站(www.bilibili.com)搜索学习哦。

朗读

PandaOCR除了是一款OCR软件、翻译软件外,还是一款朗读软件。语音朗读支持的引擎:搜狗朗读+腾讯朗读+百度朗读+必应朗读+讯飞朗读+谷歌朗读+京东朗读+知声朗读等。除了在OCR识别后进行朗读外,还支持在文本区输入文本进行朗读。输入文本后按ALT+回车键会直接朗读,可以朗读原文也可以朗读译文哦。好了,你又可以卸载一个朗读软件了。

其他功能

PandaOCR已经不是一个简单的OCR软件了,现在还集成了其他实用功能。比如解析二维码、以图搜图、上传到图床等,还有其他功能就留着你自己去探索发现啦!

官方使用技巧

  • 将鼠标移到各功能组件或按钮上会显示简单的悬停提示帮助你理解程序操作。
  • 配置文件内已添加各功能注释说明,如果想要实现某种功能但在程序界面上没找到相关设置,可以先翻一翻配置文件或许它已经在- 那里等着你(程序目录下CONFIG.ini即是配置文件)。
  • 如果你有两块屏幕,请勾选“高级截图方式”以解决无法截取第二块屏的问题。
  • 如果你是高分屏或修改了系统DPI缩放,可能出现截图不全或弹窗位置偏移的问题,此时你需要在此程序文件的属性中取消系统DPI设置。
  • 程序界面上存在的设置多数是可以实时生效的不需要频繁点击保存按钮,比如设置语言、更换引擎此类。
  • 有时手工更改了配置文件又不想重启软件可以试试右键点击界面左上角图标重载配置,不要点左键。
  • 从演示版引擎临时更改为API版引擎可以右键点击引擎选择组合框。
  • 鼠标党如果觉得按快捷键识别麻烦可以把鼠标移到屏幕左上角来触发识别,默认配置已启用,也可以编辑配置文件关闭或改为其他位置。
  • 在截图时按住CTRL键可以临时取消识别,只截图并复制至剪贴板。
  • 在截图时按住ALT键可以临时取消修正文本,当识别图像的文本中不包含任何标点符号时建议这样使用。
  • 在文本区输入文本后按CTRL+回车键会直接翻译,不需要再用鼠标点翻译按钮。
  • 在文本区输入文本后按ALT+回车键会直接朗读。
  • 将图片直接拖入至程序界面上会自动开始识别。
  • 在识别或是朗读进行中如果想中止任务可以双击界面右上方“线程”字样处,或按住空格键的同时点击托盘图标。
  • 鼠标右键点击“保存设置”按钮可缩小或展开程序界面。
  • 如果觉得文本区域过小,可以双击文本区使用大窗口浏览或简单编辑。
  • 有些不太用的上的功能建议关闭以减少识别等待时间,比如朗读文本。
  • 在启用了监听复制功能时临时不想执行识别或翻译可以在复制的同时按住空格键。

特别声明

  • 程序使用压缩壳减小文件体积,如有误报请自行加入白名单无恶意代码,程序访问的所有服务器都是上面这些引擎需要调用的,可自行验证
  • 程序的开发与发布均在NOD32杀软保护的环境中完成,如果使用过程中,您系统中某种“安全”软件称「发现木马」,那么此种情形将考验您的判断力
  • 已知在高分辨率/高分屏下截图功能异常 [尝试解决方法]
  • 如需使用自己申请的ID和KEY,用文本编辑器打开程序目录下的CONFIG.ini文件,在[数据配置]项,将各版本后面数值设为1(0为演示版),并修改下面相应的ID和KEY
  • 如需反馈API版引擎存在的问题,请主动提供相应的ID和KEY给我测试
  • 各引擎精准度推荐:OCR推荐搜狗,翻译推荐搜狗或腾讯,朗读推荐搜狗或腾讯,讯飞只适合短句也不太稳定
  • 右键点击<保存设置>按钮可以收缩/展开界面,弹窗上的小按钮单击隐藏,右击弹出菜单

二、关于软件

  1. 中文界面:是
  2. 开发厂商:miaomiaosoft
  3. 产品主页:https://github.com/miaomiaosoft/PandaOCR(软件只在GitHub发布,网上的所谓官网并不是官网,请注意文件安全性!)
  4. 下载链接:
GitHub下载:https://github.com/miaomiaosoft/PandaOCR/releases
备份下载(2.57):https://lanzous.com/b0bemu8pg(密码:bkrj)

请多支持这样子的原创开发者!


非特殊说明,本博所有文章均为博主原创。

评论啦~