站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
建站程序
开发
服务器
办公软件
开发教程
服务器教程
软件使用教程
运营教程
热门电子书
WordPress教程
宝塔面板教程
CSS教程
Shopify教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
Tesseract
”(章节)
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
== 主要仓库 == 1、tesseract:这是 Tesseract OCR 引擎的主仓库,包含了引擎的核心[[代码]]和主要功能。它是整个项目的基础,负责图像预处理、字符识别以及后处理等操作,以实现高效的文本提取。 2、tesstrain:这个仓库用于训练 Tesseract 的 LSTM(长短期记忆)模型。通过使用 make 工具,用户可以方便地构建和训练自己的 LSTM 模型,以适应不同的应用场景和字符集。 3、tessdata:这个仓库包含了经过训练的模型数据,这些模型支持传统的 OCR 引擎和 LSTM OCR 引擎。用户可以从这个仓库中获取已经训练好的模型,以便在自己的项目中使用。 4、tessdata_contrib:这个仓库是用户贡献的非 Google [[数据库]]。它包含了一些由社区成员提供的、针对特定语言或字符集的模型数据。这对于那些需要识别非标准字符或语言的用户来说非常有用。 5、langdata_lstm:这个仓库存放了用于 LSTM 模型训练的数据。这些数据包括字符集、字体样式、语言规则等,它们是构建和训练准确模型的关键组成部分。 6、tessdata_fast:这个仓库提供了经过训练的 LSTM 模型的快速整数版本。这些模型在保持一定准确性的同时,减少了计算资源和时间的消耗,适用于对性能要求较高的场景。 7、tessdata_best:这个仓库包含了最准确(也是通常最大)的 LSTM 模型。这些模型经过精细的训练和优化,提供了最高的识别准确率,但可能需要更多的计算资源和时间。它们适用于对识别准确性有极高要求的场景。
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)