量化投资与金融科技量化投资Fintech人工智能金融热点
关于图像识别,属于AI界前沿的Google有个两年多都没解决的问题:如何区分黑人和大猩猩?
早在年,Web开发人员杰基·阿尔西内(JackyAlciné)的一条推特在互联网上火了,原因是Google图像将他与一名女性朋友的合影误认为“Gorilla(大猩猩)”:
Google的解决方式也十分简单粗暴:他们的图像识别算法去掉了“大猩猩”这个类别……
不得不承认,算法实现的分类还有许多不完美的地方,算法与人不同,它不具备常识、不理解抽象概念,如果出现训练数据中没有遇到的极端情况,它也是一脸懵逼的。
事实上鉴别“大猩猩”的乌龙只是个图像识别的小小缩影。图像识别技术的范畴十分广泛,人脸识别、虹膜识别、指纹识别等都属于这个范畴,它涵盖了生物识别、物体与场景识别、视频识别三大类。发展至今,尽管它并不完美,但日渐成熟的图像识别技术已在互联网搜索、娱乐监督、购物、机器人、自动驾驶、教育、古玩等行业中广泛应用。
机器是如何识别图像的?
其实,图像识别技术背后的原理并不是很难,它是从模拟人类识别图像的过程开始的。
我们识别图像都是依靠图像所具有的本身特征而先将这些图像分了类,然后通过各个类别所具有的特征将图像识别出来。机器也一样,它通过分类并提取重要特征而排除多余的信息来识别图像。以网络搜索为例:
首先,我们构造一个模型,并将成千上万种带标签的图片输入模型,让它学习如何分类动物,这个过程被成为机器学习。
图像识别技术的过程分以下几步:信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。
1信息的获取
获取研究对象的基本信息并通过某种方法将其转变为机器能够认识的信息。在这个例子中,我们输入一张狗的照片
2预处理
指图像处理中的去噪、平滑、变换等的操作,从而加强图像的重要特征。在这一步,我们将狗的轮廓变成各种尖角、圆弧。
3特征抽取和选择
图像识别的关键技术之一,我们所研究的图像是各种各样的,如果要利用某种方法将它们区分开,就要通过这些图像所具有的本身特征来识别,而获取这些特征的过程就是特征抽取。在这一步,我们抽取预处理中的特征点:尖角可能是尾巴、爪子、嘴
4分类器设计
指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别技术能够得到高识别率。这个例子中我们第一步就已经做过分类器的设计并对其进行了训练。
6分类决策
指在特征空间中对被识别对象进行分类,从而更好地识别所研究的对象具体属于哪一类。在例子中,我们通过抽取的特征,与库中的动物进行匹配,最终判定输入的是一张狗的图片。
机器学习12大算法
我们可以看出图片识别最关键的一步是分类器设计,ThinkBigData发布的信息图展示了12种最重要的机器学习算法,或许它能为你指明今后的研究方向:
如今,移动互联网、及社交网络的发展带来了海量图片信息,根据BI五月份的文章,Instagram每天图片上传量约为万张;WhatsApp每天的图片发送量为5亿张;国内的
转载请注明:http://www.daxingxinga.com/dwly/4993.html