智慧西瓜 发表于 2023-12-5 08:59:53

如何使用白描桌面版识别图片、数学公式和PDF文件。

在日常学习和工作中,视障用户经常会遇到图片形式的pdf文件或图片格式的资料需要阅读,此时需要用到pdf和图片文件的转换工具。在众多转换工具中,今天介绍的白描是笔者使用频率最高的一款软件。该软件具有界面简洁、识别准确、操作无障碍等特点,并且支持苹果、安卓手机,微软windows、苹果macos电脑以及网页版等多平台使用。今天我们来介绍桌面版的使用方法。
根据官方的介绍,白描是一款像猫一样灵动的OCR扫描识别工具。具备高准确度的文字识别、表格识别转Excel、批量识别、识别后翻译、文件扫描等功能。但需要注意的是,桌面版只包含其中的一部分功能,下面我们逐个进行介绍。
1.        主界面介绍::白描的安装非常无障碍,安装后在桌面上找到白描回车打开,页面上默认进入的是图片文字识别,用上下光标可以浏览到四个主要功能,分别是图片文字识别、数学公式识别、电子表格识别和设置。需要使用哪个功能可以在相应功能上回车确认。下方是几个功能按钮,包括添加文件、从剪贴板导入粘贴文件和开始识别。
2.        设置:由于白描主界面的设置无法使用读屏软件点击打开,推荐使用通知区域托盘菜单中的设置。按windows加b切换到通知区域,左右光标找到白描。需要注意的是,白描的名称无法读出来,在这里读屏软件只会给与“按钮”的提示,大家可以多尝试几次,一定可以找到该软件。如果寻找正确,按菜单键弹出菜单,第一项是“屏幕截图”,如果没有此提示,说明寻找错误,还需要继续寻找。
在菜单中按下光标找到设置回车,进入设置界面。界面上包括三个设置,默认停留在通用设置界面。按下光标可以浏览到所有设置项目。首先找到登录按钮回车,此时会打开白描的登录界面,输入账号密码后回车即可登录。白描仅支持移动端注册,如果之前没有白描账号,需要先下载白描手机版进行注册,注册方式选择手机号或邮箱注册才能在桌面版登陆。登陆后回到了设置界面,继续向下浏览,这里是关于界面语言的设置,默认为“auto”,也就是自动模式,通常情况下不需要修改。继续向下有一个是否开机启动的复选框,根据需要进行选择。
按ctrl加home键(首页键)回到页面顶部,下光标找到快速识别,使用各品牌读屏软件移动鼠标的功能,将鼠标移动到该处并点击,即可进入快速识别设置界面。其中有几个项目需要设置。第一个是截图快捷键,按下该键后会将窗口截图并识别,如果想设置此快捷键,继续按下光标找到“设置快捷键”回车,继续按一次下光标可以切换到一个按钮,在此按钮处回车,然后输入我们想设置的快捷键,如果此快捷键不予其他快捷键冲突,即可设置成功;第二个是显示/隐藏窗口快捷键,顾名思义该快捷键按一次可以显示主窗口,再按一次可以隐藏窗口。如果想设置,同样继续按下光标找到“设置快捷键”回车,设置方法同上;第三个是截屏后弹出结果窗口,截屏识别后是否自动弹出识别结果窗口,如需选择,可以继续按下光标找到一个复选框,用空格键切换状态;第四个是截屏识别后自动复制结果,如需选择,同样继续按下光标找到一个复选框用空格键即可选中。
回到页面顶部,下光标找到“关于”,将模拟鼠标移动到该处并点击,下光标可以找到一个检查更新的按钮,在此处回车,如有新版本会提示更新。设置部分主要就包括这些内容。
3.        Pdf和图片转文本文件        :在白描主界面按上下光标找到“图片文字提取”回车确认,随后按下光标找到“点此选择图片”,在此处用读屏软件的模拟鼠标点击一次,会弹出选择文件的对话框,选择需要转换的pdf文件或图片。支持识别的格式包括JPG/PNG/BMP/GIF/SVG/PDF。如果想批量识别,只需要在此处用文件多选的方法将多个文件添加到白描中。操作时可以先将所有要识别的文件放入一个文件夹中,在选择需要转换的文件时浏览到该文件夹回车进入,随后按ctrl加a全选所有文件后回车。此时会将该文件夹中的文件添加到白描中。白描一次最多识别50个文件。
添加完成后,按下光标可以浏览到pdf每一页的名称。如果一次识别多个文件,先浏览的是第一个文件的所有页面,后面是第二个文件的页面,以此类推。查看完所有页面后,继续按下光标可以切换到一个“开始识别”的元素,在此处用模拟鼠标点击一次即可开始识别,开始识别后:原本“开始识别”元素的名称也会变成“识别中”。识别完成后按上下光标可以切换到所有页面的识别情况,正常情况下,每个页面后面都会显示一个“识别完成”的提示。如果想查看某一页的识别结果,可以用模拟鼠标点击页面下面的“点击查看结果”,随后按下光标切换到页面底部,可以查看该页面的识别结果。如果对识别结果不满意,可以用模拟鼠标点击页面下方的“重新识别”,白描会重新识别该页面。如果想查看所有页面的识别结果,可以点击页面底部的“合并结果并查看”。点击后需要等待片刻,随后在页面底部会出现几个元素。第一个是复制,点击后会将所有识别结果添加到剪贴板,我们可以打开一个记事本或word将剪贴板中的内容粘贴进去。继续按下光标可以切换到导出为docx和txt的选项,点击后会弹出保存对话框,可以将识别内容保存为word或txt文件。
4.        数学公式识别:按ctrl加home(首页键)回到页面顶部,下光标找到数学公式识别回车确认。随后的识别流程与图片文字提取完全相同,在此不再赘述。批量识别最多支持50张图片。支持的格式包括JPG/PNG/BMP/GIF/SVG。需要注意的是,此处不包括pdf格式。
支持识别的数学公式共有22种,分别是平面直角坐标系、一元二次方程、概率初步cz、函数及其图像、解直角三角形、平面几何、投影与视图、代数、实数与二次根、三角形、相似形、分式、统计初步(初中)、圆锥曲线方程、直线和圆方程、直线和平面、三角函数、复数、概率初步gz、函数和投影、推理和证明以及平面向量。
5.        电子表格识别:切换到页面顶部,下光标找到“电子表格识别”,随后添加包含表格的图片,识别的流程同上。需要注意的是,电子表格不支持批量转换,一次仅支持转换1个文件。转换时尽量将表格图片转成正向,可以提高识别准确率。
6.        窗口截图识别:首先找到需要识别的界面,将该窗口最大化,按上面设置过的快速截图的快捷键,此时会弹出一个框选识别区域的界面,通常笔者都是对整个屏幕进行识别,这里的操作需要一点技巧。如果使用的是触屏电脑,可以用一根手指从屏幕的左下角沿对角线滑动到右上角,这样及可框选整个屏幕。如果使用的是传统非触屏电脑,可以先用模拟鼠标将鼠标指针移动到屏幕右下角,随后按住鼠标左键向右上方滑动,只要方向正确,也能成功选取整个屏幕的内容。框选后,程序会自动识别,识别完成后会弹出一个识别结果界面,同时将识别结果拷贝到剪贴板。识别结果界面的无障碍体验不是很完善,推荐大家将剪贴板中的识别结果粘贴到word、记事本中进行编辑。
以上就是白描桌面版的主要功能,今天主要介绍了图片和pdf转文本文件、批量转换、数学公式识别、电子表格识别、屏幕截图识别等等。大家还发现了哪些实用功能可以在文后留言讨论。下期,我们将继续为大家介绍pdf阅读的其他方法和技巧,敬请期待。

更多实用的视障经验,更多新奇好物分享,尽在微信公众号“西瓜无障碍”,我们每周一篇干货文章,咱们下周不见不散!
本帖来自爱盲客户端
页: [1]
查看完整版本: 如何使用白描桌面版识别图片、数学公式和PDF文件。