如何把图片转换成文字(免费 OCR,无需上传)
别再对着截图、照片或扫描件一个字一个字地重新打了。本文教你用 OCR 把任何图片里的文字精准提取出来——支持 12 种语言,而且全程在浏览器里完成。
更新于 2026年6月25日
别再对着图片重新打字了
你有一张地址截图、一张收据照片,或一页扫描件——而你真正需要的,只是其中的文字。如果没有 OCR,唯一的办法就是眯着眼盯着图片,一个字一个字手动重打,既慢又容易在长串数字或不熟悉的拼写上出错。
光学字符识别替你完成这项工作。把图片拖进去,它就会把字符读取成可编辑的文字,你可以随处复制、搜索和粘贴。不用重打,不用找转录服务,也不用注册账号。
OCR 究竟做了什么
OCR——光学字符识别——把文字的图片变成真正的文字。无论哪种方式你的屏幕都显示着字母,但对计算机来说,图片只是一堆彩色像素;在有东西把这些形状识别成字符之前,这些文字既不能选中也不能搜索。OCR 就是这一步:它定位图片中的文字区域,把形状与某种语言的字符集做匹配,然后输出一段你可以编辑的文本。
这与「在照片里选取文字」的功能、扫描文档搜索以及古籍数字化背后是同一项技术。「OCR 文字识别」工具会在你给它的任何图片上运行它——PNG、JPG、截图或照片——并把文字连同一个置信度分数一起返回给你,让你知道它有多大把握。
三步从图片中提取文字
- 打开图片。 把你的截图、照片或扫描件拖进「OCR 文字识别」工具。它在本地完成读取,所以图片绝不会被上传——即使在识别开始之前也是如此。
- 选择语言并识别。 选择图片中文字所用的语言,好让引擎加载正确的字符集,然后点击「识别文字」。工具会扫描图片,返回提取出的文字,并附上一个反映读取清晰程度的置信度分数。
- 复制文字。 把识别出的文字粘贴到你的文档、邮件、表格或笔记里。整个流程就这么简单——没有导出步骤,没有水印,不用登录。
某种语言首次运行时会下载一次它的模型;之后识别速度很快,甚至离线也能用。
如何获得干净、准确的结果
OCR 的准确度主要取决于你喂给它的图片,而不是工具本身。几个习惯能带来很大差别:
- 用你手头最清晰的图片。 分辨率越高,字符形状越清晰。直接截图胜过对着屏幕拍照;平板扫描胜过手持快拍。
- 尽量提高对比度。 浅色背景上的深色文字识别效果最好。避免反光、阴影和文字背后杂乱的背景。
- 把它摆正。 裁剪到只剩文字,并旋转使文字行保持水平——歪斜或旋转的文字会让识别出错。
- 匹配语言。 选错语言会迫使引擎用错误的字符集去猜。这一点对非拉丁文字尤其重要。
印刷文字的识别远比手写可靠得多。如果结果很乱,通常换用同一张图片更干净、对比度更高的版本就能解决。
这个工具涵盖横跨多种书写体系的十二种语言——英语、简体中文、繁体中文、日语、韩语、西班牙语、法语、德语、葡萄牙语、阿拉伯语、俄语和印地语——所以它能处理拉丁文、CJK、阿拉伯文、西里尔文和天城文,而不只是英语。
为什么要在浏览器里跑 OCR
你最想转成文字的图片,往往也最私密:扫描的证件、工资单、医疗信函、印着你卡号的收据、私人聊天的截图。把这些上传到云端 OCR 服务,就意味着把原件交给了一台你无法掌控的服务器。
基于浏览器的工具完全避开了这个问题。识别由 tesseract.js 完成,这是一个在页面内执行的 WebAssembly OCR 引擎;语言模型只需下载一次并会被缓存,你的图片在你自己的设备上处理。识别过程中不会传输任何东西,而且模型缓存之后,离线也能继续工作。同样的隐私逻辑贯穿整个文档处理流程——先从图片里提取文字,再从 PDF 里提取,然后做清理:只要文件不离开你的机器,就没有什么可泄露的。
快速清单
- 把图片拖进工具——本地读取,不上传。
- 使用你手头最清晰、对比度最高的版本。
- 识别前先选择与文字相符的语言。
- 点击「识别文字」并查看置信度分数。
- 复制结果——并记住:这一切都发生在你的设备上。
快速步骤
- 1打开「OCR 文字识别」工具,把图片拖进去。不会有任何上传——图片在你的浏览器本地完成读取。
- 2选择图片中文字所用的语言,然后点击「识别文字」。工具会扫描图片,返回识别出的文字以及一个置信度分数。
- 3复制提取出的文字,粘贴到任何你需要的地方。图片始终不会离开你的设备,所以即使是私密文档的截图也只留在你的机器上。
常见问题
OCR 在清晰、高对比度的印刷文字图片上效果最好:截图、扫描文档、收据、书页、幻灯片,以及标牌或标签的照片。 画面锐利、光线充足、文字端正、深色文字配浅色背景的图片识别结果最准确。花体字、低分辨率、反光和手写都更难识别, 可能需要更干净的图片。
横跨多种文字体系的十二种语言——英语、简体中文、繁体中文、日语、韩语、西班牙语、法语、德语、葡萄牙语、阿拉伯语、 俄语和印地语。运行识别前请选择与图片中文字相符的语言,这样引擎才会使用正确的字符集。
准确度几乎完全取决于图片本身。清晰的印刷文字扫描件识别得非常可靠;模糊的手机照片或字迹浅淡的收据则更难。 工具会为每个结果显示一个置信度分数,而你随时可以换用更锐利、对比度更高的图片来提升准确度。
不会。识别由 tesseract.js 完成,这是一个在浏览器内运行的 WebAssembly OCR 引擎。语言模型只需下载一次并会被缓存, 你的图片在本地处理——不会有任何内容发送到服务器,所以证件、收据、医疗或财务文件等私密资料都只留在你的设备上。