2017年,在有人工智能“世界杯”之称的ImageNet大规模视觉识别挑战赛(ILSVRC-2017)上,一向低调的360人工智能团队最终夺得冠军,并且刷新了此前谷歌、微软、牛津大学等机构保持数年的世界纪录。巨大的荣誉和强大的实力也让以颜水成院长为首的360人工智能研究院逐渐被广大公众所了解。
计算机视觉是发展人工智能的核心技术。事实上,作为人工智能领域的16年老兵,颜水成在计算机视觉竞赛领域堪称是名副其实的常胜将军。除了这次ImageNet ILSVRC赛事上夺冠,5年前的PASCAL VOC大赛的收官之战,冠军同样是他。
近日,在接受媒体采访时,颜水成对计算机视觉的未来发表了自己的看法,同时也分享了自己多年来的实战经历。“计算机视觉的未来是属于多标签、像素级、语义级分析的。引领计算机视觉进入下一个时代需要一个像素级、多标签的数据集。如果像素级分类做好了,无论做任何类型图像理解和语义理解的问题都好办了。”颜水成说。
在颜水成看来,虽然现在新的数据集有做语义级别分析或者局部关联分析的,但这些数据库存在内在的局限性。建立一个像素级和多标签的数据集挑战非常大,他希望在合适的时间点,由大公司甚至国家出面做这样的事情。
对于最近火热的边缘计算,颜水成表示,大家都希望AI最终能落地,2C的量远大于2B的量,最大的量在手机等终端设备上。所以边缘计算是人工智能发展需求决定的一个大趋势。技术上看,目前有三种方式降低边缘计算量:第一种是内功—就是特别好的网络结构;第二种是武器—低精度表示的方法;第三种是暗器—巧妙用低功耗的网络先确定那部分不需要计算的网络。三种方法都是为了减少计算量以适应边缘计算,三种相辅相成。
自从进入人工智能领域研究以来,颜水成师承计算机视觉大师Thomas S. Huang、张宏江、汤晓鸥、李子青等,在学术界风生水起,在新加坡国立大学任终身教职。不过,两年前,颜水成却选择从学术界跨入工业界发展。回顾自己的选择,颜水成表示:“我加入360最吸引我的是智能硬件这一块,软硬件结合是计算机视觉的一个大方向。周鸿祎本人对智能硬件也非常有热情。新加坡国立大学候任校长陈永财曾问我在工业界怎么样,我的回答是tiring but exciting(疲惫而兴奋)。”
两年来,在颜水成院长的带领下,360人工智能研究院发展迅速。安全与智能是360当前两大重点。360人工智能研究院立足于世界领先的深度学习研发能力,发力视觉、语音、语义和大数据四个方向,向360相关业务部门提供技术输出,并完成人工智能相关方向的原始技术积累和前沿探索。
目前,研究院的人工智能技术已经广泛应用于360的全系列产品中,包括直播、智能硬件、搜索和信息流等业务。未来,研究院将会推动360在人工智能方面的技术实现突破性进展。其中,视觉技术将进一步提升,优化识别物体、行为等,并拓展到SLAM领域;语音分析将增强合成真实感,提高识别准确度,逐步建立基于NLP语义的对话系统;大数据技术的提高将带动广告、精准推荐等。