百度大脑开放24种全新能力,可识别生病或未绝育的流浪猫
在百度大脑首场开放日活动上,百度大脑宣布开放24种新的AI能力,在市政、物流、教育等行业有了更多落地方案。截至目前,百度大脑开放了158项AI能力,24小时快速集成,开发者数量超过100万。
百度大脑开源深度学习平台PaddlePaddle以及通用AI能力都进行了更新。其中,PaddlePaddle核心框架Paddle Fluid v1.3新增发布视频分类模型库,新增支持NLP语义表示BERT模型,提升分布式训练性能。目前,百度PaddlePaddle已对外开放超过50种经过工业场景验证的官方模型。比如,领邦利用PaddlePaddle,通过ICNet语义分割模型识别精密零件瑕疵,实现了零件自动分拣。
此外,百度大脑通用AI能力还在语音、视觉、自然语言处理、知识图谱等方面进行了更新。
语音方面,百度大脑推出了语音识别极速版,搭载注意力(attention)模型的语音能力,百度方面称实现了更快的响应速度,相对识别准确度可提升15%。语音识别预置语义解析的预置场景由35个升级为51个。百度大脑即将推出几款新产品,包括语音识别自训练平台、远场语音开发套件和语音离线合成等产品。
视觉方向上,OCR、车辆分析、人脸人体、图像识别都有升级。比如,卡证OCR新增了户口本、出生医学证明、港澳通行证和台湾通行证四类新能力,可识别卡证总数达到9种。当用户对着户口本拍一张照片,系统就能根据字段进行结构化识别,然后反馈出信息页的出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码。
票据OCR和汽车场景OCR也分别新增了行程单、保单、通用机打发票、定额发票、车辆VIN码、机动车销售发票、车辆合格证等识别能力。目前,百度大脑OCR产品全系列可以识别类型多达34款。
人脸人体识别方向上,百度大脑此次发布了新能力人脸情绪识别,人脸检测关键点由72个增至150个,常见手势能识别种数也达到了24种。图像识别方向,百度大脑更新了红酒和地标识别两个新能力。车辆分析方面上线了车辆检测和车流统计。百度大脑还会陆续上线车辆属性识别、车辆外观损伤识别、人脸融合、手部关键点识别、更高精度的人像分割以及钱币识别等有趣有用的应用场景。
同时,百度大脑语言及知识技术也进一步开放。在语言处理应用技术方面,百度大脑新增文本纠错、新闻摘要、智能写诗、智能春联和对话情绪识别等能力,在知识理解方面,百度大脑推出了作文检索和知识问答两个新能力。智能写作平台将在4月全面上线,从素材上可为创作者提供工具、帮助找到灵感,从而提升创作者的写作效率和产出质量,降低写作成本。
在市政、物流、教育等领域,百度大脑加持的产品有了更多落地的案例。比如,百度EasyDL与分形科技打造的智能垃圾桶已成功地落地海淀公园,可以对7种常见垃圾自动分类;在和德邦物流的合作中,百度EasyDL使用定制词法分析快递申请,一秒拆分姓名、电话、住址等信息;百度EasyDL还与中科院在珍稀鸟类识别项目上展开的合作。百度EasyDL利用图像识别技术协助专家们对动植物标本、照片进行快速鉴定,目前在700多种鸟类模top5上的识别准确率达到93.89%,非雀形目鸟类模型top5准确率达到95.79%。
值得一提的是,工程师用百度大脑动物识别技术和百度EasyDL设计出了智能猫窝,拥有猫脸门禁、病猫识别、绝育识别三大功能,能够帮助救助志愿者发现生病和未绝育的流浪猫。
百度AI技术生态部总经理喻友平表示,百度大脑开放能力不断加速,希望帮助企业、开发者、合作伙伴们快速地实现各自领域的业务解决方案,创造全新商业模式,带来更多机遇。