编辑“OCR”

OCR是光学字符识别技术（Optical Character Recognition）的简称，这项技术能够将各类印刷品中的文字转化为数字信息。OCR用于将印刷或手写的[[文本]]转换为可编辑的电子文本格式。OCR系统通过扫描文档或图像，识别其中的字符，并将其转换为文本数据，用户可以在[[计算机]]上编辑、搜索或处理这些文本内容。
== 发展历程 ==
OCR（光学字符识别技术）的概念最早在1929年由德国科学家Tausheck提出，其后美国科学家Handel也独立提出了类似的文字识别思想。IBM公司的Casey和Nagy于1966年发表了关于利用模板匹配法识别印刷体汉字的文章，标志着对汉字识别研究的开端。

自20世纪60年代至70年代，世界各国开始着手于OCR的研究，早期研究以数字的识别为主。日本在1960年左右启动了对OCR的基本理论研究，最初聚焦于数字识别，并在1965至1970年间推出了一些简单的产品，例如邮政编码识别系统。中国在OCR领域的研究起步较晚，始于20世纪70年代的数字和英文字母识别研究，到70年代末期扩展到汉字识别，并在1986年国家“863”计划推动下进入实质性研究阶段。

随着时间推移，特别是进入21世纪后，深度学习技术的引入显著推动了OCR技术的发展，扩展了其使用范围。基于深度OCR的算法逐渐成为主流，传统的OCR处理流程得到优化，包括图像预处理、文本检测、字符分割与识别等步骤。
== 发展现状 ==
OCR技术在识别印刷文本方面已经取得了较大进展，但在手写文本和复杂文档的识别上仍存在一定挑战。随着深度学习和人工智能技术的发展，OCR系统的识别准确率和处理速度正在不断提升，未来有望在更多领域实现广泛应用。
== 工作原理 ==
1、图像采集： 使用扫描仪、摄像头或其他图像采集设备获取待识别的文档或图像。

2、预处理： 对图像进行预处理，包括去除噪音、调整图像大小和方向等操作，以提高后续字符识别的准确性。

3、分割： 将图像中的文本区域分割成单个字符或单词，为后续的识别步骤做准备。

4、特征提取： 提取每个字符或单词的特征，如形状、大小、颜色等，以帮助识别算法准确地识别字符。

5、字符识别： 使用识别[[算法]]将每个字符或单词与已知的字符模板进行比较，以确定最可能的字符或单词。

6、后处理： 对识别结果进行后处理，包括错误校正、字典校验等操作，以提高识别准确性和文本的可读性。
== 常见OCR ==
=== [[Tesseract]] ===
Tesseract是一个开源的OCR引擎，由[[Google]]开发和维护。它支持多种操作系统，包括[[Windows]]、[[Linux]]和[[macOS]]，并提供多种语言的识别模型。
=== [[ABBYY FineReader]] ===
ABBYY FineReader是一款商业化的OCR软件，具有强大的文本识别和布局保持功能。它支持多种文件格式的识别，包括扫描文档、[[PDF]]文件等。
=== [[Adobe Acrobat]] ===
Adobe Acrobat是一款流行的PDF阅读和编辑软件，它内置了OCR功能，可以将扫描的文档转换为可编辑的PDF文件，并提供文本搜索和复制功能。

=== [[Microsoft OneNote]] ===
Microsoft OneNote是一款便签和笔记软件，它具有内置的OCR功能，可以识别图片中的文本，并将其转换为可编辑的文档。
=== [[Online OCR]] ===
Online OCR是一种基于[[互联网]]的在线OCR服务，用户可以上传图片或扫描文档，通过网站或[[应用程序]]进行文本识别，并将识别结果下载到本地。

== 应用领域 ==
1、文档数字化： 将纸质文档转换为电子文本，实现文档的数字化存储和管理。

2、图书馆和档案管理： 对图书、期刊、档案等纸质文献进行数字化处理，便于检索和共享。

3、自动化办公： 实现自动化的文档处理流程，如自动扫描、识别和归档文件。

4、车牌识别： 识别车辆上的车牌号码，用于交通管理、停车场管理等场景。

5、身份证识别： 识别身份证上的姓名、身份证号码等信息，用于实名认证、身份验证等场景。
== 相关条目 ==
* [[AI]]
* [[AIGC]]