神话娱乐导航

最新国际文本检测权势巨子榜单公布:中国包办

发布时间:2019-02-10 08:12

        

 

 

 

     

  李源暗示,2018年11月20日,云主科技正在预印本网站arXiv上颁发了最新论文,该论文提出了用于天然场景文本检测的Pixel-Anchor框架。论文颁发之前,他们正在国际文档阐发与识别大会公布的ICDAR2015战ICDAR2017 MLT数据集上检测了Pixel-Anchor算法,并刷新了ICDAR2015的最佳成就。

  光学字符识别(Optical Character Recognition,以下简称OCR)是指阐发图像主而获与文字消息的历程,不少智妙手机中的手刺扫描软件就有这一功效。OCR范畴的主要目标——国际文档阐发与识别大会(ICDAR)测试集被再次刷新,中国高校及企业包办ICDAR2015排行榜前五,顺次为云主科技(Pixel-Anchor)、南京大学与南京理工大学(PSENet)、旷视科技(Mask Text)、商汤科技(FOTS)、阿里巴巴(IncepText)。

  CDAR2015榜单(2018年11月20日)。F值代表精度战检出率的战谐均匀数,也是排名的按照,F值越大,检测成果越优。精度(Precision)代表检测成果确文本的比例;检出率(recall)则反应被检出文本与图片文本总数的比例,可以大概表隐能否漏检了文本。为了检测算法的结果,必要分析思量精度战检出率,而F值正好代表精度战检出率的战谐均匀数,也是排名的按照。

  ICDAR2017 MLT分析榜单(2018年11月20日)(带*号暗示没有颁发公然论文)

  磅礴旧事采访了目前位于ICDAR2015榜单第一名的云主科技。云主科技钻研院资深算法工程师李源引见,ICDAR2015战ICDAR2017 MLT是天然场景文本检测范畴的权势巨子数据集,“根基上所有文章城市正在检测”。

  除去没有颁发公然论文的几家机构,ICDAR2017 MLT数据集前五名及框架名称别离是云主科技(Pixel-Anchor)、阿里巴巴(ATL-cangjie)、商汤科技(FOTS)、旷视科技(EAST++)、南京大学(PSENet_NJU)。

  但相较于保守的文本检测OCR,天然场景中的各类商品、背景或天然场景图片中的文本检测与识别面对着庞大布景滋扰、文字的恍惚与退化、不成预测的光照、字体的多样性、垂直文本、倾斜文本等应战。与针对高品质文档图像的保守OCR比拟,天然场景文本检测能正在更宽泛的范畴中使用,比方照片阐发、车牌识别,图片告白过滤,场景理解,商品识别,街景定位,单据识别等。

  据悉,ICDAR2017 MLT则蕴含了拉丁文、英文、中文、韩文、日文、阿拉伯文等9种文字。云主的Pixel-Anchor算法正在ICDAR2017 MLT分析榜单中排名第四,排名前三的三家外洋机构没有提交公然论文。

  必要留意的是,这里提到的天然场景文本检测并不等同于文本识别,前者不具备识别文字的功效,

      神话娱乐,神话娱乐场

              

/神话娱乐