如何使用白描桌面版识别图片、数学公式和PDF文件。

智慧西瓜 发表于 2023-12-5 08:59:53

在日常学习和工作中，视障用户经常会遇到图片形式的pdf文件或图片格式的资料需要阅读，此时需要用到pdf和图片文件的转换工具。在众多转换工具中，今天介绍的白描是笔者使用频率最高的一款软件。该软件具有界面简洁、识别准确、操作无障碍等特点，并且支持苹果、安卓手机，微软windows、苹果macos电脑以及网页版等多平台使用。今天我们来介绍桌面版的使用方法。
根据官方的介绍，白描是一款像猫一样灵动的OCR扫描识别工具。具备高准确度的文字识别、表格识别转Excel、批量识别、识别后翻译、文件扫描等功能。但需要注意的是，桌面版只包含其中的一部分功能，下面我们逐个进行介绍。
1. 主界面介绍：：白描的安装非常无障碍，安装后在桌面上找到白描回车打开，页面上默认进入的是图片文字识别，用上下光标可以浏览到四个主要功能，分别是图片文字识别、数学公式识别、电子表格识别和设置。需要使用哪个功能可以在相应功能上回车确认。下方是几个功能按钮，包括添加文件、从剪贴板导入粘贴文件和开始识别。
2. 设置：由于白描主界面的设置无法使用读屏软件点击打开，推荐使用通知区域托盘菜单中的设置。按windows加b切换到通知区域，左右光标找到白描。需要注意的是，白描的名称无法读出来，在这里读屏软件只会给与“按钮”的提示，大家可以多尝试几次，一定可以找到该软件。如果寻找正确，按菜单键弹出菜单，第一项是“屏幕截图”，如果没有此提示，说明寻找错误，还需要继续寻找。
在菜单中按下光标找到设置回车，进入设置界面。界面上包括三个设置，默认停留在通用设置界面。按下光标可以浏览到所有设置项目。首先找到登录按钮回车，此时会打开白描的登录界面，输入账号密码后回车即可登录。白描仅支持移动端注册，如果之前没有白描账号，需要先下载白描手机版进行注册，注册方式选择手机号或邮箱注册才能在桌面版登陆。登陆后回到了设置界面，继续向下浏览，这里是关于界面语言的设置，默认为“auto”，也就是自动模式，通常情况下不需要修改。继续向下有一个是否开机启动的复选框，根据需要进行选择。
按ctrl加home键（首页键）回到页面顶部，下光标找到快速识别，使用各品牌读屏软件移动鼠标的功能，将鼠标移动到该处并点击，即可进入快速识别设置界面。其中有几个项目需要设置。第一个是截图快捷键，按下该键后会将窗口截图并识别，如果想设置此快捷键，继续按下光标找到“设置快捷键”回车，继续按一次下光标可以切换到一个按钮，在此按钮处回车，然后输入我们想设置的快捷键，如果此快捷键不予其他快捷键冲突，即可设置成功；第二个是显示/隐藏窗口快捷键，顾名思义该快捷键按一次可以显示主窗口，再按一次可以隐藏窗口。如果想设置，同样继续按下光标找到“设置快捷键”回车，设置方法同上；第三个是截屏后弹出结果窗口，截屏识别后是否自动弹出识别结果窗口，如需选择，可以继续按下光标找到一个复选框，用空格键切换状态；第四个是截屏识别后自动复制结果，如需选择，同样继续按下光标找到一个复选框用空格键即可选中。
回到页面顶部，下光标找到“关于”，将模拟鼠标移动到该处并点击，下光标可以找到一个检查更新的按钮，在此处回车，如有新版本会提示更新。设置部分主要就包括这些内容。
3. Pdf和图片转文本文件：在白描主界面按上下光标找到“图片文字提取”回车确认，随后按下光标找到“点此选择图片”，在此处用读屏软件的模拟鼠标点击一次，会弹出选择文件的对话框，选择需要转换的pdf文件或图片。支持识别的格式包括JPG/PNG/BMP/GIF/SVG/PDF。如果想批量识别，只需要在此处用文件多选的方法将多个文件添加到白描中。操作时可以先将所有要识别的文件放入一个文件夹中，在选择需要转换的文件时浏览到该文件夹回车进入，随后按ctrl加a全选所有文件后回车。此时会将该文件夹中的文件添加到白描中。白描一次最多识别50个文件。
添加完成后，按下光标可以浏览到pdf每一页的名称。如果一次识别多个文件，先浏览的是第一个文件的所有页面，后面是第二个文件的页面，以此类推。查看完所有页面后，继续按下光标可以切换到一个“开始识别”的元素，在此处用模拟鼠标点击一次即可开始识别，开始识别后：原本“开始识别”元素的名称也会变成“识别中”。识别完成后按上下光标可以切换到所有页面的识别情况，正常情况下，每个页面后面都会显示一个“识别完成”的提示。如果想查看某一页的识别结果，可以用模拟鼠标点击页面下面的“点击查看结果”，随后按下光标切换到页面底部，可以查看该页面的识别结果。如果对识别结果不满意，可以用模拟鼠标点击页面下方的“重新识别”，白描会重新识别该页面。如果想查看所有页面的识别结果，可以点击页面底部的“合并结果并查看”。点击后需要等待片刻，随后在页面底部会出现几个元素。第一个是复制，点击后会将所有识别结果添加到剪贴板，我们可以打开一个记事本或word将剪贴板中的内容粘贴进去。继续按下光标可以切换到导出为docx和txt的选项，点击后会弹出保存对话框，可以将识别内容保存为word或txt文件。
4. 数学公式识别：按ctrl加home（首页键）回到页面顶部，下光标找到数学公式识别回车确认。随后的识别流程与图片文字提取完全相同，在此不再赘述。批量识别最多支持50张图片。支持的格式包括JPG/PNG/BMP/GIF/SVG。需要注意的是，此处不包括pdf格式。
支持识别的数学公式共有22种，分别是平面直角坐标系、一元二次方程、概率初步cz、函数及其图像、解直角三角形、平面几何、投影与视图、代数、实数与二次根、三角形、相似形、分式、统计初步（初中）、圆锥曲线方程、直线和圆方程、直线和平面、三角函数、复数、概率初步gz、函数和投影、推理和证明以及平面向量。
5. 电子表格识别：切换到页面顶部，下光标找到“电子表格识别”，随后添加包含表格的图片，识别的流程同上。需要注意的是，电子表格不支持批量转换，一次仅支持转换1个文件。转换时尽量将表格图片转成正向，可以提高识别准确率。
6. 窗口截图识别：首先找到需要识别的界面，将该窗口最大化，按上面设置过的快速截图的快捷键，此时会弹出一个框选识别区域的界面，通常笔者都是对整个屏幕进行识别，这里的操作需要一点技巧。如果使用的是触屏电脑，可以用一根手指从屏幕的左下角沿对角线滑动到右上角，这样及可框选整个屏幕。如果使用的是传统非触屏电脑，可以先用模拟鼠标将鼠标指针移动到屏幕右下角，随后按住鼠标左键向右上方滑动，只要方向正确，也能成功选取整个屏幕的内容。框选后，程序会自动识别，识别完成后会弹出一个识别结果界面，同时将识别结果拷贝到剪贴板。识别结果界面的无障碍体验不是很完善，推荐大家将剪贴板中的识别结果粘贴到word、记事本中进行编辑。
以上就是白描桌面版的主要功能，今天主要介绍了图片和pdf转文本文件、批量转换、数学公式识别、电子表格识别、屏幕截图识别等等。大家还发现了哪些实用功能可以在文后留言讨论。下期，我们将继续为大家介绍pdf阅读的其他方法和技巧，敬请期待。

更多实用的视障经验，更多新奇好物分享，尽在微信公众号“西瓜无障碍”，我们每周一篇干货文章，咱们下周不见不散！
本帖来自爱盲客户端

页: [1]

爱盲论坛's Archiver

如何使用白描桌面版识别图片、数学公式和PDF文件。