報告簡介:
随着智能終端的普及和移動互聯網的飛速發展,場景文字識别(Photo OCR)越來越引起學術界和工業界的重視。圖片中的文字包含豐富的高層語義,因此如何去檢測和識别自然場景中的文字具有廣泛的技術應用前景。在這次報告中,我将首先介紹場景文字檢測和識别的基本方法、前沿技術以及相關應用。然後,我将介紹我們在此領域的最新研究成果,包括:基于字符定位的場景文字識别算法(CVPR14);基于對稱性的文字區域檢測算法(CVPR15); 場景文字語種識别方法(ICDAR15);及圖像序列識别神經網絡等。
報告人簡介:
白翔博士現為華中科技大學電子信息與通信學院教授,博士生導師,擔任國家防僞工程中心副主任。他的研究領域為計算機視覺與模式識别,具體包括目标識别、形狀分析、自然場景文字識别及智能系統。他已在計算機視覺與模式識别相關的國際權威期刊或頂級會議發表論文30餘篇。他的研究工作曾獲得微軟學者2007,首屆國家自然科學基金優秀青年基金的資助。他的博士論文獲得2012年全國優秀博士論文提名。擔任中國圖象圖形學學會圖象視頻處理與通信專業委員會秘書長,人工智能學會模式識别專委會委員,計算機學會計算機視覺專業組委員,計算機學會人工智能與模式識别專業委員會通訊委員,視覺與學習青年研讨會(VALSE)在線委員。擔任包括權威雜志PAMI、IJCV、TIP、TSMC、TNN、TMM、PR、CVIU、PRL、IVC等評審和頂級會議CVPR ,ICCV, NIPS, ECCV等TPC。