导图社区阿里云文字识别

阿里云文字识别

这是一篇关于阿里云文字识别的思维导图，主要内容包括：OCR文档自学习，票证核验，医疗场景识别，小语种识别，教育场景识别，车辆物流识别，票据凭证识别，个人证照识别，通用文字识别，OCR统一识别，企业资质识别，产品概览。

编辑于2024-03-11 19:42:29

阿里云
OCR
文字识别

宇尘

他的近期作品查看更多>>

TMO与PMO组织架构及职责
这是一篇关于TMO与PMO组织架构及职责的思维导图，模板详细拆解了 TMO（技术交付组织）与 PMO（项目管理办公室）两大核心模块：TMO 模块涵盖业务分析师、应用技术负责人、项目技术负责人、测试技术负责人等多个关键岗位，明确了各角色的执行层对应团队与核心职责，如业务需求转化、技术方案设计、跨模块资源协调、用户验收测试管控等；PMO 模块则包含多供应商管理、变更管理、项目计划与管理、成本管控、配置管理等全流程职能，清晰呈现各岗位的汇报线、工作边界与协作逻辑，解决项目管理中角色模糊、职责交叉、流程混乱等痛点。无论是 IT 项目交付团队搭建、企业项目管理体系梳理，还是个人项目管理知识学习、团队培训材料制作，该模板都能提供标准化参考框架。项目经理可借助它明确团队分工、优化协作流程，技术负责人能快速对齐技术交付各环节的角色职责，企业管理者可用于搭建规范的项目管理组织架构，项目团队成员也能通过模板快速了解岗位定位与工作要求，实现高效协同。模板支持按需修改与拓展，可直接套用或根据企业实际需求调整岗位、职责内容，大幅节省架构梳理与文档制作时间，提升项目管理效率。
华为项目交付组织架构
这是一篇关于华为项目交付组织架构的思维导图，涵盖项目铁三角核心角色、决策层与执行层架构、项目管理办公室（PMO）及技术交付组织（TMO）四大核心模块，清晰梳理了各岗位职能、汇报关系、关键逻辑与协作流程，是拆解华为项目管理体系、搭建标准化项目交付团队、明确项目权责分工的实用参考工具。模板深度融合华为项目管理的核心理念，详细拆解了客户负责人、方案负责人、交付负责人、PMO Leader、TMO Leader 等关键角色的职责边界，以及多供应商管理、变更管控、成本控制、技术执行等专项职能的分工逻辑，帮助用户快速理解大型复杂项目中 “决策 - 管理 - 执行” 三层架构的协作模式，解决项目权责不清、流程混乱、协同低效等常见问题。无论是企业搭建项目交付团队、项目管理者梳理组织架构，还是学习华为项目管理方法论，都能通过该模板快速掌握项目交付组织的搭建逻辑，高效落地项目管理流程。借助万兴脑图软件绘制，助力快速搭建标准化项目交付管理体系。
DPIA流程和模板
这是一篇关于DPIA流程和模板的思维导图，主要内容包括：DPIA模版，DPIA概述和范围，如何执行DPIA，可接受的DPIA标准，DPIA解决什么问题，DPIA执行标准。

阿里云文字识别

社区模板帮助中心，点此进入>>

宇尘

他的近期作品查看更多>>

相似推荐
大纲

互联网9大思维
- 39.8k
- 977
- 2.5k
- 401
- 0
MindMaster
组织架构-单商户商城webAPP 思维导图。
- 18.6k
- 3
- 186
- 9
- 1
Kacyun
域控上线
- 4.3k
- 171
- 11
- 4
- 0
jackrao
python思维导图
- 9.6k
- 557
- 242
- 7
- 0
(*^▽^*)
css
- 3.9k
- 1
- 43
- 3
- 0
A张舫
CSS
- 6.3k
- 271
- 189
- 33
- 0
journey
计算机操作系统思维导图
- 8.1k
- 354
- 209
- 16
- 0
journey
计算机组成原理
- 4.1k
- 98
- 71
- 8
- 0
journey
IMX6UL(A7)
- 2.7k
- 41
- 5
- 0
- 0
Handler XU
考试学情分析系统
- 3.6k
- 51
- 10
- 1
- 0
蒋龙

阿里云文字识别

产品概览

阿里云OCR是依据阿里巴巴多年AI技术积累打造的全栈全场景OCR文本识别类产品。多年来, 通过持续整合前沿AI技术和行业实战经验，阿里云OCR打磨出了能够承载跨行业敏捷应用的技术架构，具备图像文字定位、文字识别和文字理解的全栈技术体系，形成了包含通用文本识别、卡证票据自动化分类及结构化识别、卡证票据混贴识别、表格文档批量结构化识别以及试题作业智能识别等全量OCR原子能力矩阵。支持公有云调用、私有化部署、终端 SDK 等云边端全业务场景服务能力。

OCR统一识别

OCR统一识别是阿里云OCR团队重磅推出的新品，一个接口集成了59种不同场景识别能力，可满足多功能需求，提升客户接入的便捷性、易用性及高效性，降低客户同时接入多个OCR场景能力的门槛

适用于用一个API覆盖多场景下各类文档图片或文档扫描件的文字信息识别或文字信息抽取。

产品功能

一个接口即可满足59种不同的单场景及混贴票证识别。

覆盖现有六大类场景：通用文字识别、个人证照识别、车辆物流识别、票据凭证识别、企业资质识别和混贴。

特色优势

兼容多数据类型

多能力复用一个接口，可以识别多场景数据类型，无需对接多个接口，一次搞定接入成本。

计费划档清晰

OCR统一识别支持按量付费和共享资源包两种计费方式，多种能力共用资源包消耗，采购更方便。

实时性高

依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务。

服务稳定

根据调用量提供弹性服务，扩展性好，算法持续迭代优化对客户稳定性不会造成影响。

应用场景

图片内容审核

各类通用型接口，可针对不同场景，识别内容进行内容审核。及时发现违规行为，大大降低人力成本，广泛应用于电商内容治理场景。

物流/运输/汽车

应用于二手车交易、智慧停车、物流运输、快递驿站、汽车保险等场景，提供个人身份、车辆信息、快递信息记录并认证服务。支持行驶证、驾驶证、车牌、VIN码、电子面单、身份证、车辆合格证等卡证信息文字识别。

金融/银行/保险

为远程开户、身份核验/实名认证/信息录入、合同/保单数字化、银行流水/财报信息录入等场景，提供人工智能识别服务，大大降低人力成本。支持身份证、护照、往来通行证、银行卡、印章、表格等识别文字服务。

政务/医疗

应用于财税报销、纸质电子化（文档/卷/合同）、医疗票据/药房、简历/论文扫描编辑等场景，提供图片、扫描件等非文本格式转换为可编辑文本服务。支持增值税发票、发票核验、各类票据凭证、全文识别高精版、手写体、表格等识别文字服务。

零售/互联网/电商

为内容治理（海报/宣传页/商品详情页）、资质审核（商家入驻）、商机/品牌挖掘等场景，提供图片识别文字服务，支持电商图片、营业执照、房产证、银行开户许可证、表格、高精、通用等识别能力。

通用文字识别

适用于各类常见文档图片或扫描件中的文字信息按照文档原有的格式进行文本识别和还原。

产品功能

通用文字识别

通用文字识别适用于各行业场景下的非结构化文字识别，支持返回文字内容和位置坐标信息。

全文识别高精版（推荐）

全文识别高精版支持多格式版面、复杂文档背景和光照环境的精准识别，文档识别率超过99.7%。同时针对有印章、手印的文档，可实现印章擦除后识别，支持低置信度过滤、图案检测等高阶功能。

通用手写体识别

读光通用手写体识别模型可以支持中文手写体、英文手写体、数字手写体等各种复杂场景的手写文字识别，同时具备较强的印刷文字识别能力，适用于识别各类手写笔记、板书等。

表格识别

表格智能解析：进行通用表格解析，从表格中提取出表格样式、表格内容、文本KV、表格KV等。支持100M、100页之内的PDF文档，以及30张之内的图片文档格式。

电商图片文字识别

电商图文识别是专门针对电商商品宣传图片、社区贴吧图片、网络UGC图片等网络场景下图片字符快速精准识别的原子能力产品，在违规广告识别、信息审核管理和网络安全治理等场景下具有极大应用价值。

防疫健康码识别

读光OCR防疫健康码识别包括全国主要省市健康码，支持健康码图片的姓名、日期、时间、颜色、备注信息等主要字段的识别结果输出。

文档结构化识别

读光文档结构化识别可对文档信息进行结构化识别，并提供元素平铺和层级树两种视角的版面信息输出。能够将文档中的文字元素（单字、文字块、行等）和相应的版面格式（标题、段落、表格）抽离并按顺序输出。目前仅支持单页文档。

特色优势

准确率高

利用海量的图片样本训练模型，具有业内领先的准确率。以身份证识别为例，准确率超过99%。

实时性高

依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务。

技术前沿精深

基于阿里云人工智能平台 PAI ，应用阿里深度优化的深度学习框架PAI-Tensorflow，训练出业界领先的文本检测模型及文本识别模型。

服务稳定

根据调用量提供弹性服务，扩展性好，算法持续的迭代优化对用户稳定性无影响。

应用场景

图片内容审核

各类通用型接口，可针对不同场景，识别内容进行内容审核。及时发现违规行为，大大降低人力成本，广泛应用于电商内容治理场景。

合同文档类识别

通用文字识别可用于识别合同、文档、小说等图片，用于合同校对、文档检索、PDF提取等场景，广泛应用于司法卷宗管理、企业法务合同审核、金融/保险自动化流程等行业。

个人证照识别

个人证照类识别提供个人身份识别所需的身份证、银行卡、护照等证件的结构化识别服务。

产品功能

身份证识别

读光身份证识别（中国大陆身份证），可支持二代身份证正反面，包括姓名、性别、民族、地址、出生日期、身份证号、签发机关、有效期限等字段的结构化识别。该接口同时支持壮族、维吾尔族、蒙古族、满族、藏族等少数民族身份证全量字段，以及临时身份证主要字段的识别，并可进行实拍或复印件判断及人脸位置检测。

国际护照识别

读光OCR国际护照识别基于业界领先的深度学习技术，可对美国、法国、英国、日本、韩国等世界多个主要国家和地区护照提供识别服务，其中已支持字段包括国籍、护照号码、出生日期、姓名等；可以应用于出入境审查、国内外人员身份核验等各种需要提取护照信息的场景。

户口本识别

读光户口本识别可结构化识别户口常住人口登记卡页面及户主页的内容，可有效识别户口本上的相关户籍证明信息。

不动产权证识别

读光OCR不动产证可准确识别不动产证中的各项关键信息，包括户主信息、房屋地址、面积大小、土地权利类型等，能够适用于全国各地的不同房产证识别。

银行卡识别

读光OCR可精准识别各类银行卡中的银行卡卡号和有效期，且支持横卡、竖卡及银行卡任意角度偏斜情况的识别与提取，支持中国内地大多数银行，以及各种位数、凸字卡面、平面卡面等的识别，为用户提供最方便快捷的卡面信息录入体验。

出生证明识别

读光OCR出生证明可准确识别出生证明中的各项关键信息，包括出生日期、出生体重、出生地点等。

中国护照识别

读光OCR中国护照识别基于业界领先的深度学习技术，支持中国人民共和国护照的结构化内容检测识别功能，支持中国内地、中国香港、中国澳门和中国台湾地区的护照识别，识别内容包括出生地、出生日期、国籍、性别、护照号码、有效期至、签发国、签发地等字段。可应用于出入境审查、身份核验、业务办理等场景。

往来港澳台通行证识别

读光OCR往来港澳台通行证识别，支持通行证中的各项关键信息，包括姓名、出生日期、证件号码等准确识别，具有高鲁棒性。

来往（大陆）内地通行证识别

读光OCR来往（大陆）内地通行证识别可准确识别通行证中的各项关键信息，包括姓名、出生日期、证件号码等。包括港澳居民来往大陆通行证以及台湾居民来往大陆通行证，具有高鲁棒性。

中国香港身份证识别

读光OCR中国香港身份证识别支持香港永久性居民身份证和香港居民身份证两种类型的证件识别，已支持全字段识别，包括中文姓名（如有）、英文姓名、中文姓名电码（如有）、出生日期、性别、符号标记、身份证号码等。

社保卡识别

读光OCR社保卡识别，已支持全字段识别，包括标题、姓名、社会保障号码、社会保障卡号、银行账号、发卡日期等。

国际身份证识别

读光OCR国际身份证识别，可对几类国外身份证件进行结构化识别，目前支持越南、韩国、印度、孟加拉居民身份证，可识别字段包括姓名、出生日期、证件号码等。

特色优势

准确率高：利用海量的图片样本训练模型，具有业内领先的准确率。以身份证识别为例，准确率超过99%。

实时性高：依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务。

技术前沿精深：基于阿里云人工智能平台 PAI ，应用阿里深度优化的深度学习框架PAI-Tensorflow，训练出业界领先的文本检测模型及文本识别模型。

服务稳定：根据调用量提供弹性服务，扩展性好，算法持续的迭代优化对用户稳定性无影响。

应用场景

身份认证：可以自动识别身份证、护照、户口页等用户证件中的关键信息，验证用户身份。广泛应用于金融、政务、出行、电商场景，有效降低用户输入成本，控制业务风险。

线上支付：应用绑定银行卡，验证远程操作用户，保障支付快捷安全。有效降低用户输入成本，大幅度提升用户使用体验。

产品分类

票据凭证识别

票据凭证系列提供企业报销所需的各类发票的结构化识别以及混贴发票的自动分割与识别。

教育场景识别

OCR识别能力赋能教育应用场景中试题题目、数学公式、速算题目等信息智能化识别需求。

车辆物流识别

适用于交通物流相关的行驶证、驾驶证、车牌、vin码、电子运单等汽车相关内容识别。

企业资质识别

提供企事业单位在业务开展过程中使用到的营业执照、商标注册证等资质证明的结构化识别服务。

小语种识别

小语种文字识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。

医疗场景识别

医疗场景识别提供抗疫场景下核酸检测报告识别能力。

票证核验

提供针对发票及企业执照等各类票证单据的真伪核验能力。

文档格式转换

可实现图片、PDF、扫描件与Word、Excel等多种格式的转换，保留版式样式信息。

文档智能解析

从文档中提取出逻辑层级结构、文本内容、表格内容、 Key-value键值字段、样式信息等。

企业资质识别

产品介绍

读光企事业资质证明类OCR识别提供企事业单位、机构、公司业务开展过程中经常使用到的营业执照、商标注册证、食品经营许可证、食品生产许可证、银行开户许可证、医疗器械生成许可证、医疗器械生产许可证等资质证明的结构化识别服务，且读光OCR可满足此十多类资质证明的自动分类功能，即无需提前进行资质证明的手动分类，系统可自动判断所属类型并返回结构化信息，广泛应用于办公自动化、行业资料数字化等价值场景。

产品功能

营业执照识别

读光OCR可快速精准的识别企业营业执照中的统一社会信用代码、公司名称、地址、主体类型、法定代表人、注册资金、组成形式、成立日期、营业期限和经营范围等关键有效字段。支持营业执照、民办非企业登记证书、社会团体法人登记证书、事业单位法人证书。

银行开户许可证

读光OCR可快速精准的识别银行开户许可证中的账号、法定代表人、开户银行、核准号、企业名称、编号等关键信息。

商标注册证

读光OCR可快速精准的识别商标注册证中所包含的商标名称、注册人、注册人地址以及有效期限、核定服务项目等关键有效字段信息。

食品经营许可证

读光OCR可快速精准的识别食品经营许可证所包含经营者名称、社会信用代码、法定代表人姓名、地址、经营场所、经营项目、有效期、许可证编号等关键字段信息。

食品生产许可证

读光OCR可快速精准的识别食品生产许可证所包含经营者名称、社会信用代码、法定代表人姓名、地址、经营场所、经营项目、有效期、许可证编号等关键字段信息。

医疗器械生产许可证

读光OCR可快速精准的识别医疗器械生产许可证所包含许可证编号、法定代表人、企业名称、注册地址、生产地址、生产范围、企业负责人、有效期限等关键字段信息。

医疗器械经营许可证

读光OCR可快速精准的识别医疗器械经营许可证所包含许可证编号、企业名称、注册地址、法定代表人、企业负责人、质量管理人、仓库地址、经营范围、许可期限、发证日期等关键字段信息。

第二类医疗器械经营备案凭证

读光OCR可快速精准的识别第二类医疗器械经营备案凭证所包含备案编号、企业名称、住所、经营场所、库房地址、经营方式、法定代表人、企业负责人、经营范围、许可期限、备案日期等关键字段信息。

化妆品生产许可证

读光OCR化妆品生产许可证识别，已支持关键字段识别，包括证照名称、企业名称、社会信用代码、住址、法定代表人、许可证编号等，关键信息识别准确率达92%以上。

国际企业执照识别

读光OCR国际企业执照识别，目前支持韩国、印度营业执照类型，提供包括证件类型、公司名称、注册号、法人姓名、签发日期等关键字段的识别能力。

特色优势

准确率高：利用海量的图片样本训练模型，具有较高的准确率。以身份证识别为例，准确率超过99%。

实时性高：依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务。

技术前沿精深：基于阿里云人工智能平台 PAI ，应用阿里深度优化的深度学习框架PAI-Tensorflow，训练文本检测模型及文本识别模型。

服务稳定：根据调用量提供弹性服务，扩展性好，算法持续的迭代优化对用户稳定性无影响。

应用场景

金融抵押贷款：结构化识别证件上核心字段，自动化资产录入及审核。提升管理效率，节省人力成本。

政务资质审核：结构化识别证件上核心字段，自动化资产录入及审核。提升管理效率，节省人力成本。

票据凭证识别

产品介绍

基于OCR技术，票据凭证系列提供财税报销、税务核算所需的各类发票结构化识别，包括增值税发票、增值税发票卷票、火车票、定额发票、航空行程单、出租车发票、通用机打发票、过路过桥发票、客运车船票、银行承兑汇票等近二十种常见发票，及混贴发票的自动分割与识别能力。

产品功能

混贴发票识别

基于达摩院强大的深度学习算法和结构化模板优化技术，确保各字段精度均处于业界领先水平，其中各类票据的发票代码、价税合计、合计金额、购买方识别号、开票日期等关键字段结构化识别输出，识别准确率超过99%。

网约车行程单识别

读光OCR网约车行程单识别，已支持网约车行程单全部字段的识别，包括：服务商、申请日期、行程开始时间、行程结束时间、行程人手机号、总金额等字段，识别准确率达到96%以上。

增值税发票识别

读光OCR支持增值税专用发票、增值税普通发票、增值税电子发票识别，支持包括发票代码、发票号码、开票日期、发票金额、发票税额、检验码、购买方税号、销售方税号、发票详情等关键字段结构化识别输出，识别准确率超过99%。

火车票识别

读光OCR火车票识别，支持包括票号、出发站、到达站、开车时间、票价、座位类型、旅客信息、座位号、车次等字段结构化识别输出。其中火车票关键字段姓名、出发时间、出发站、识别、座位号等识别准确率超过96%。

定额发票识别

读光OCR定额发票支持包括发票号码、发票代码、发票金额等关键字段结构化识别输出。

航空行程单识别

读光OCR航空运输电子行程单识别，支持包括旅客姓名、身份证号码、电子客票号码、填开日期、填开单位等字段结构化识别输出。

出租车发票识别

读光OCR出租车机打发票识别，支持包括发票代码、发票号码、日期、发票金额等关键字段结构化识别输出，其中发票代码、发票号码等关键字段识别准确率超过95%。

增值税发票卷票识别

读光OCR增值税发票卷票识别，支持对卷票上包括发票代码、发票号码、开票日期、发票金额、校验码、大写金额、销售方税号、购买方税号等关键字段结构化识别输出。

机动车销售统一发票识别

读光OCR机动车统一销售发票识别，针对购车发票支持包括发票代码、开票号码、开票日期、发票金额、增值税税额、合格证号、购买方名称、购买方身份证号/代码等关键字段结构化识别输出。

二手车销售统一发票识别

读光OCR二手车销售统一发票识别，针对二手车购车发票支持包括发票代码、发票号码、开票日期、发票金额、购买方名称、购买方身份证号等关键字段结构化识别输出。

通用机打发票识别

读光OCR通用机打发票识别，支持包括发票代码、发票号码、销售方名称、销售方识别号、购买方名称、购买方识别号、合计金额等关键字段结构化识别输出。

过路过桥发票识别

读光OCR过路过桥费发票识别，支持包括发票代码、发票号码、金额、日期、车型、出口、入口等关键字段结构化识别输出，准确率超过95%。

客运车船票识别

读光OCR客运车船票识别，支持包括标题、发票号码、出发车站、到达车站、日期、金额等关键字段结构化识别输出。

税收完税证明识别

读光OCR税收完税证明识别，支持包括税务机关、纳税人识别号、纳税人名称、合计金额、填票人、完税详单等关键字段的结构化识别输出，准确率超过98%。

电商订单页识别

读光OCR电商订单页识别，支持包括订单编号、收货信息、交易金额、店铺名称、商品详单等关键字段结构化识别输出。

支付详情页识别

读光OCR支付详情页识别，支持包括收款方名称、合计金额、付款方式、商品说明、支付时间等关键字段结构化识别输出。

非税收入发票识别

读光OCR非税收入发票识别，支持包括票据代码、交款人、票据号码、合计金额、收款单位等关键字段结构化识别输出，准确率超过97%。

酒店流水识别

读光OCR酒店流水识别，支持包括房号、入住日期、离店日期、消费总计、付款总计、消费详单等关键字段结构化识别输出。

购物小票识别

读光OCR购物小票识别，支持包括开票方名称、开票日期、联系电话、地址、合计（实际）金额等关键字段结构化识别输出。

银行承兑汇票识别

读光OCR银行承兑汇票识别，支持包括出票日期、票据号码、出票人信息、收票人信息、承兑人信息、票据金额等关键字段结构化识别输出。

发票核验

读光OCR支持5种增值税发票的真伪核验（不支持发票内容识别），包括增值税专用发票、增值税普通发票、区块链发票（深圳地区）、机动车销售统一发票、二手车销售统一发票。核验前请核对所需的发票字段，手动输入进行核验。发票开票日期须在近5年内，开票后次日可查验。

特色优势

准确率高：利用海量的图片样本训练模型，具有业内领先的准确率。

实时性高：依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务

技术前沿精深：基于阿里云人工智能平台 PAI ，应用阿里深度优化的深度学习框架PAI-Tensorflow，训练出业界领先的文本检测模型及文本识别模型。

服务稳定：根据调用量提供弹性服务，扩展性好，算法持续的迭代优化对用户稳定性无影响。

应用场景

财务报销：实现对各类税务发票、交通票据等的自动识别和录入。能够有效减少人工核算工作量，降低人力成本，实现财税报销的自动化。

移动投保：对各类保险单据中的有效信息进行结构化提取，应用于保单审核、保费核发等场景。有效提升信息录入效率，减少人工核算工作量，降低人力成本。

财务共享：可用于费用报销和支出控制共享、资金结算共享、税务和发票管理共享。有效提升信息录入效率，减少人工核算工作量，降低人力成本。

车辆物流识别

产品介绍

提供与车辆、物流相关的各类证件、面单的结构化识别。支持行驶证、驾驶证、车牌VIN码、车牌、机动车注册登记证、车辆合格证、快递面单的智能识别，广泛应用于智慧停车、汽车交易、汽车保险、快递物流等场景。

产品功能

车牌识别

读光车牌识别可有效识别车辆车牌信息，支持机动车车牌、摩托车车牌以及临时车牌。广泛应用于车辆安防检控、车辆出入识别等场景。（示例图片信息已做脱敏处理，具体结果以API测试为准）

行驶证识别

读光行驶证支持对行驶证正页、副页关键字段的自动定位和识别，同时，也支持对正副页在同一张图片的场景进行自动分割与结构化识别。（示例图片信息已做脱敏处理，具体结果以API测试为准）

驾驶证识别

读光驾驶证识别支持对驾驶证上的姓名、证号、国籍、住址、初次领证日期、准驾类型、有效期等字段进行结构化提取。驾驶证的总体准确率和召回率在95%以上。（示例图片信息已做脱敏处理，具体结果以API测试为准）

车辆vin码识别

读光车辆识别代码（VIN）识别，用于进行车辆质检检查、车辆登记等场景。（示例图片信息已做脱敏处理，具体结果以API测试为准）

面单识别

读光面单识别可支持识别面单上所有关键字段。（示例图片信息已做脱敏处理，具体结果以API测试为准）

机车注册证识别

读光OCR可快速精准的识别机车注册证所包含证件类别、条形编码、登记机关、登记日期、机动车登记编号等关键字段信息。整体字段准确率超93%。

车辆合格证识别

读光车辆合格证识别支持车辆型号、车辆识别代号、底盘型号、发动机型号等字段进行结构化提取。车辆合格证的平均召回率在97%。

特色优势

准确率高：利用海量的图片样本训练模型，具有业内领先的准确率。以身份证识别为例，准确率超过99%。

实时性高：依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务

技术前沿精深：基于阿里云人工智能平台 PAI ，应用阿里深度优化的深度学习框架PAI-Tensorflow，训练出业界领先的文本检测模型及文本识别模型。

服务稳定：根据调用量提供弹性服务，扩展性好，算法持续的迭代优化对用户稳定性无影响。

应用场景

交通协查：实现违章车辆信息的自动识别，实现道路违章行为检测和记录的自动化。有效降低人力监控成本，大幅度提升管理效率。

车险年检：实现车主及车辆信息的自动识别。有效提高相关信息录入效率，简化车险年审流程，提升用户使用体验。

车辆租借交易：实现人、车辆证件的自动识别，应用于人车证信息一致性的核对。提升用户使用体验，并且保障交易安全。

停车管理：实现车牌号和VIN码的自动识别，实现停车场、小区等的自动化规范管理。有效降低人力成本和通行卡证制作成本，大幅度提升管理效率。

教育场景识别

产品介绍

读光试题作业OCR识别产品能力，主要针对教育应用场景中对试题题目、数学公式、速算题目等信息的智能化识别需求，通过对通用OCR高精度识别能力的教育场景迭代优化，为用户提供数学试题图片中题目文本及数学公式的识别、速算题目文字的检测和识别等服务，并返回题目框位置与内容，为智慧教学场景下的拍照搜题、板书识别、自动阅卷等应用提供关键基石技术能力。可大程度辅助教师的教务工作，并协助教育进行数字化转型。

产品功能

印刷体数学公式识别

支持印刷体的数学公式识别，可应用于题目录入、拍照搜题、作业批改等场景。

题目识别

读光题目识别可对教育中的题目进行有效识别。通过对题目的元素进行打标，提升题目的识别效果。目前主要覆盖的标签类型包含但不限于：公式、手写体、印刷体、下划线、图片等，是拍照搜题等功能的基础原子能力。

试卷切题

读光试卷切题可支持各学科的教辅试卷的结构化电子录入，将试卷中的题目进行自动化切分和结构化打标，并进行对应题目、题干、选项、答案等内容的结构化输出，能够大大释放手工录题成本，在教辅数字化、试卷批改有广泛应用。

口算判题

读光口算判题可以识别小学数学口算题目并给出题目判断结果。可支持整数的加减乘除四则运算、整数的混合运算、大小比较、最大数最小数等。

整页试卷识别

整页试卷识别是教育的基础OCR识别能力。支持K12全学科扫描场景的整页内容文字识别。接口支持印刷体文本及公式的OCR识别和坐标返回，此外，接口还可对题目中的配图位置进行检测并返回坐标位置。适用于对练习册、教辅、教材等内容进行整页识别与题目检索。

精细版结构化识别

精细版结构化识别支持多学科教辅试卷的结构化识别，将整页练习册、试卷或教辅中的题目进行自动切题，并识别出其中的文字内容和坐标位置。适用于精细化题目生产、智能组卷等场景。

特色优势

准确率高：利用海量的图片样本训练模型，具有业内领先的准确率。以身份证识别为例，准确率超过99%。

实时性高：依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务。

技术前沿精深：基于阿里云人工智能平台 PAI ，应用阿里深度优化的深度学习框架PAI-Tensorflow，训练出业界领先的文本检测模型及文本识别模型。

服务稳定：根据调用量提供弹性服务，扩展性好，算法持续的迭代优化对用户稳定性无影响。

应用场景

试题录入：通过上传试卷图片，自动识别试题内容。有效提升抄录效率，节省人力成本。

答案搜索：使用ocr技术自动识别试题，根据识别的结果进行答案搜索。广泛应用于试题类软件，辅助教学。

作业批改：识别试题并对问答自动化判断，可检测出文中常见的错别字、标点误用及语法问题。可极大幅度提升教师批改作业的效率，亦或应用于导学软件辅助学生学习。

小语种识别

产品介绍

读光通用多语言识别能够支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。语言检测覆盖十余个国家地区语种，适用于国际化所需的各类图文识别与信息翻译场景。

产品功能

通用多语言识别

英语专项识别

读光OCR英文专项识别是针对全英文图片文档场景下英文印刷体字符高效检测和识别的原子能力产品，具备英文专项识别和英文分词功能，支持旋转、表格、文字坐标等多项基础功能，全英文文档字符识别率超过99%。

日语识别

读光OCR日语识别是针对全日文图片文档场景下日文印刷体高效检测和识别的原子能力产品，支持旋转、表格、文字坐标等多项基础功能。

俄语识别

读光OCR俄语识别是针对图片文档场景下俄文印刷体高效检测和识别的原子能力产品，支持旋转、表格、文字坐标等多项基础功能。

韩语识别

读光OCR韩语识别是针对图片文档场景下韩文印刷体高效检测和识别的原子能力产品，支持旋转、表格、文字坐标等多项基础功能。

泰语识别

读光OCR泰语识别是针对泰语图片文档场景下泰文印刷体高效检测和识别的原子能力产品，支持旋转、表格、文字坐标等多项基础功能。

拉丁语识别

读光OCR拉丁语识别是针对拉丁语系的图片文档场景下印刷体高效检测和识别的原子能力产品，支持旋转、表格、文字坐标等多项基础功能。

特色优势

准确率高：利用海量的图片样本训练模型，具有业内领先的准确率。以身份证识别为例，准确率超过99%。

实时性高：依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务。

技术前沿精深：基于阿里云人工智能平台 PAI ，应用阿里深度优化的深度学习框架PAI-Tensorflow，训练出业界领先的文本检测模型及文本识别模型。

服务稳定：根据调用量提供弹性服务，扩展性好，算法持续的迭代优化对用户稳定性无影响。

应用场景

信息翻译：信息翻译场景下需要支持覆盖多个语系，读光OCR支持国际主流几大语系的自动语言分类判定并返回对应语言的文字信息。适用于国际化所需的各类图文识别与信息翻译场景；语言检测覆盖十余个国家地区语种。

商务公关：商务公关场景下需要多语言以及精准快速翻译响应，读光OCR支持国际主流几大语系的自动语言分类判定并及时返回对应语言的文字信息，语言检测覆盖十余个国家地区语种。方便商务人员处理多语言场景。

医疗场景识别

产品介绍

基于OCR技术，医疗场景识别提供中国疫情防控场景下的核酸检测报告的结构化识别服务。

产品功能

核酸检测报告识别

核酸检测报告识别，支持对全国各地区不同版式的核酸检测记录中姓名、证件号码、采样日期、采样时间、检测机构、检测结果等6个关键字段的结构化结果输出。

特色优势

准确率高：利用海量的图片样本训练模型，具有业内领先的准确率。

实时性高：依托于阿里自建的EAS在线服务集群，精益求精优化Inference技术，提供弹性伸缩的低延时服务。

技术前沿精深：基于阿里云

人工智能平台 PAI ，应用阿里深度优化的深度学习框架PAI-Tensorflow，训练出业界领先的文本检测模型及文本识别模型。

服务稳定：根据调用量提供弹性服务，扩展性好，算法持续的迭代优化对用户稳定性无影响。

应用场景

疫情防控：可以自动识别核酸检测报告中的关键信息，验证报告结果。有效提升疫情防控效率，降低人力成本。

票证核验

产品介绍

读光OCR票证核验产品提供针对发票及企业执照等各类票证单据的真伪核验能力。作为读光OCR票据凭证识别、企业资质识别的能力补充，票证核验不提供内容识别功能，仅支持输入要求字段后返回真伪核验结果。

产品功能

营业执照核验

读光OCR营业执照核验提供营业执照的验真能力（不含营业执照识别功能）。输入企业全称、统一社会信用代码、法定代表人姓名三要素信息进行验证，返回对应的匹配结果。

发票核验

读光OCR发票核验提供各类发票的验真能力（不含发票识别功能）。发票核验接口支持包括：增值税专用发票、增值税普通发票（折叠票）、增值税普通发票（卷票）、增值税电子普通发票（含收费公路通行费增值税电子普通发票）、机动车销售统一发票、二手车销售统一发票多种类型发票核验。您可以通过输入发票的关键验证字段，返回真实的票面信息，包括发票类型、发票代码、发票号码、作废标志、开票日期、购方税号及其他发票信息等。当天开具发票次日可查验。

应用场景

适用于企业费控报销场景，通过票面信息核验，提高费控报销审核效率。

适用于供应商信息管理场景，通过企业执照、发票信息审核，提高电商、零售、O2O等行业对合作伙伴的管理效率。

OCR文档自学习

功能简介

OCR文档自学习，是面向“无算法基础”的企业与个人开发者用户，通过全流程可视化操作，支持用户完成模板配置、数据处理&标注、模型构建&训练、部署发布等操作的一站式工具平台。本平台采用少样本训练、智能预标注，视觉-语义联合学习等前沿AI技术，支持客户低成本实现个性化场景的文档数字化和信息化业务。

提供用户可控的定制化工具，帮助用户实现其业务场景下的模型定制，实现业务数据驱动AI服务。

多模态信息抽取，帮助客户实现多模态自定义信息抽取，可达到服务可用、好用的效果。

支持少样本冷启动，最少可支持用户通过一张图进行服务定制。

定制化效率提升，支持用户端到端小时级AI模型定制，大大缩短业务等待时间。

交互友好型，通过可视化人机交互，降低模型训练的进入与使用门槛。

功能详情

OCR文档自学习平台现支持模板和模型两大类项目的自主训练。用户可以通过配置模板或少量标注数据，训练出更满足业务场景需求的AI智能模型。

价值主张

数据资产化

支持数据资产的闭环管理（上传、处理、标注等），提供一站式预处理与标注工具，通过平台可视化引导，

服务无算法基础的用户，5分钟内完成自定义模板任务从创建到发布全流程，从而持续沉淀数据资产，助力业务的转型升级。

模型业务化

通过预置的通用多模态AI能力，通过沉淀的数据资产，支持用户一键训练更满足业务场景需求的自主定制化模型，通过预训练模型、图文多模态算法和少样本信息抽取等核心技术能力，更高效、高精度地满足业务场景的需求。

管理平台化

通过一站式的工具平台，提供从数据资产管理、模型构建、训练、部署的全流程管理工具，支持用户对模型评测与业务效果持续跟踪，未来通过持续业务正、负样本回流，实现业务运营管理的终生学习与持续迭代升级。提升业务场景的闭环与价值的持续提升。

产品优势

多模态文档信息抽取

围绕“视觉文档信息抽取”中心，致力于解决复杂视觉文档的个性化信息抽取痛点，构建服务稳定、效果精准、链路智能的自学习信息抽取平台。

零代码自主定制

通过

少样本等技术手段，降低模型训练门槛，让无算法基础的用户结合自己场景数据，自主完成模型定制，将数据资产转化成服务资产。

高精度模型效果

内置超大规模多模态预训练模型、多场景高精度文字识别模型，和统一的信息抽取模型，满足不同场景零代码建模的精度需求。

高效模型生产效率

内置智能化预标注和方便易用的一站式标注套件极大提升标注效率，内置基础预训练模型大幅提升模型在微调阶段的训练效率。

灵活的部署形态

支持高可用公共云形态与本地私有化部署，满足不同客户的落地需求。

应用场景

票据单证抽取

支持对各类单据、票证的KV信息抽取，识别率可达95%，适用于版式相对固定且可枚举的场景。

表格表单解析

可实现对各类表格表单的信息抽取，识别率可达95%，适用于版式相对固定且可枚举的场景。

非结构化长文档解析

支持对各类非结构化文档进行自动化信息抽取，识别率可达85%，适用于处理非结构化的多页文档。

公告公文处理

支持公告公文等类型的文档信息抽取，通过文档自学习平台实现版式样式不固定下的文档处理。