近日,Google AI在国内发布了一款微信游戏小程序“猜画小歌”,瞬间刷爆了朋友圈,各路隐藏的抽象大师和灵魂画手纷纷上线,用自己抽象的画,调戏了未成年的AI。有人说,朋友圈里弥漫着幼儿园美术班的气息。对于这些灵魂画作,“猜画小歌”是如何读懂的呢?这款采用机器学习技术制作而成的小游戏,玩法很简单,即人机互动版你画我猜。当你在屏幕上画图后,神经网络会尝试猜出你画的是什么。虽然神经网络不一定能猜对,但会从这个过程中不断学习。因此,你玩的次数越多,就越能提升神经网络的辨识能力。本期的“聚焦”关注刷屏的人工智能小程序——谷歌AI“猜画小歌”,让我们来看看“灵魂画手”的大作及背后隐藏的人工智能的秘密。
谷歌推出智能小程序“猜画小歌”
近日,Google AI 在国内发布了一款微信游戏小程序“猜画小歌”,瞬间刷爆了朋友圈,各路隐藏的抽象大师和灵魂画手纷纷上线,用自己抽象的画,调戏了未成年的AI。这就叫“灵魂画手一出手便知有没有”。
据CNN的消息称,谷歌正在尝试用一种新方式来开拓中国市场。用户需要在20秒内勾勒出一幅图画,AI队友则需要猜出图画中的物体,近似AI版的你画我猜。谷歌产品经理Chris Tam在博客中说,这个游戏旨在让人们“有机会体验一下人工智能的交互现在是多么自然”。谷歌已经宣布,将在北京建立一个人工智能研究中心,这是谷歌在亚洲的第一个研究中心。
据了解,用户进入“开始作画”的页面后,系统会给一个词,例如“路灯”,用户有20秒的时间作画,在这个过程中AI会根据你的画不断地疯狂猜词,搭配背景音乐,给人一种“它比你还着急”的感觉。当AI猜出图画中的物体时,就会进入下一轮。一轮游戏过后,用户的画作可以保存成图片,分享到朋友圈。
谷歌方面表示:“谷歌的信念就是AI的福祉让所有人触手可及。通过‘猜画小歌’,我们可以帮助用户更好、更直观地体会和了解 AI。”开发“猜画小歌”小程序,谷歌的目的在于让每个人都有机会体验人工智能技术驱动下的人机交互。据介绍,“猜画小歌”由来自Google AI的神经网络驱动,该网络源自全世界最大、拥有5000多万个手绘素描的数据群。
谷歌透露,计算机的视觉技术能让计算机直接理解输入的视觉信息,由此“看到”这个世界。这一技术既能在视频通话中识别出你的朋友,以便加上对应标签,也能帮助识别人类眼底诊断图像上的早期糖尿病症状。通过神经网络技术,一些看起来极其困难的事情,计算机也能处理得非常好。
还是没通关?
你得成为“灵魂画手”或“抽象大师”
“猜画小歌”“炸出”了朋友圈的“灵魂画手”,其不按套路出牌的识别能力让人又爱又恨。很多人在绘画过程中十分困惑:“猜画小歌”有时候很懂你,画一笔就知道你要画什么,很快就猜出来了;有时候又显得“智障”,明明画得很具体了,它反而猜不出来,还用机械音嘲弄你:“你画的啥玩意。”有绘画功底的画手往往难以通关,抽象派的“灵魂画手”的画反而能被识别。网友忍不住质疑:这AI是个傻子吧?
AI不是傻子。在这个游戏中,绘画技巧高低不重要,重要的是,能不能具备快速抽象创作的能力。
怎么才能让“猜画小歌”识别出你的涂鸦?一个诀窍是抓住特征。比如,有人为了画出“动物迁徙”,费劲地画了两只行进中的斑马,但实际上,他只需要画两只大雁,即两条折线即可;画蚊子需要突出尖尖的嘴;画蒙娜丽莎的微笑需要先画个画框。另一个诀窍是先勾勒形状。比如,很多人画鱼,有鱼头、鱼尾、鱼鳍,十分具体,也很形象,然而AI却猜不出来。系统认可的鱼依赖数据库,其实很简单,一笔画勾勒出鱼身和鱼尾,再点个眼睛,AI立马猜出来了;有人画眼镜,包括镜片、镜框,也十分形象,但AI猜不出来,相反,想要被AI识别,只需画两个圆圈即可;画脸需要先画圆圈,画微波炉得先画个正方形,小歌多猜几次总能猜对。
在绘画过程中,你会发现,谷歌并不是等你画完,才开始根据整幅画来猜的。在你刚刚画了一两笔的时候,谷歌的AI就已经开始猜了。
总之,真正的灵魂画手,不惮于用最简单的笔画,描述这个世界。
AI是怎么让“小歌”学会涂鸦的?
被网友玩坏了的“猜画小歌”其实和大家都熟悉的“你画我猜”玩法类似:系统会给出题目,玩家需要在规定的时间内画出题目对应的物体。然而,“猜画小歌”最为独特与令人叹为观止之处在于人类玩家画画,人工智能来猜。这背后,蕴含了怎样不为人知的黑科技?
据谷歌介绍,“猜画小歌”背后的技术主要是计算机视觉和神经网络。具体而言,“猜画小歌”由来自Google AI的神经网络驱动,该网络源自全世界最大、拥有超过5000万个手绘素描的数据库。目前,计算机视觉技术已经广泛应用到人脸识别解锁、美颜、图像分类等领域,这一技术能在视频通话中识别出你的朋友以便加上对应的标签,也能帮助识别人类眼底诊断图像上的早期糖尿病症状。有观点指出,通过训练数据,用计算机视觉来识别图像中的物体已经不是难题,但是要识别一些难以打标签、难以分类的物体却并不简单,比如:人类的手写笔迹。“猜画小歌”之所以能识别网友的“鬼画符”,根本原因在于“猜画小歌”的背后有超过5000万个手绘素描数据群作支撑。简言之,谷歌出的猜画题,其实已经有着大量的手绘素描的数据群,你这边画,神经网络那边就进行快速比对。
那什么是神经网络呢?有观点指出,神经网络或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。神经网络由大量的人工神经元联结进行计算,大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统,通俗地讲就是具备学习功能。超强的数据库配上神经网络,或许,这就是“猜画小歌”能够猜出各种各样人类“画作”的原因。
“猜画小歌”的前世今生
谷歌的“猜画小歌”刷爆朋友圈,它的火爆是必然还是偶然?其实,早在2016年,谷歌就曾经在旗下的A.I.Experiments网站上线小游戏“Quick, Draw!”,游戏规则与“猜画小歌”大体相同,在发布的六个月内就风靡全球。数百万玩家的涂鸦被陆续收录到手绘数据集,不断丰富着AI系统,为神经网络训练提供样本。
推出“Quick, Draw!”的谷歌A.I.Experiments网站于2016年11月上线,由谷歌创意实验室的程序员、设计师、创意师共同创建,旨在使用户通过趣味性体验和游戏来了解AI最新技术,让专业人士和普通玩家都能在这个平台上轻松创建自己的AI实验。2017年,谷歌发布了从“Quick, Draw!”获得的数据,向公众展示了1500万人是如何同时画一类物体的,开发者可以用这些开源数据开展基于计算机视觉的AI项目。
时至今日,谷歌以微信小程序的形式上线“猜画小歌”,做到了大陆本土化,成功占领朋友圈。“猜画小歌”使用了愈发强大的神经网络技术,能在20秒内识别各种或简易或潦草的手绘图。神经网络(Neural Network, NN)是一门非常重要的机器学习技术,也是深度学习的基础。它是一种模拟人脑神经网络结构和功能的数学模型或计算模型,用于估计和拟合函数,由神经元、参数和偏置项三个部分组成基本架构。神经网络能够让机器接近大脑去“思考”,通过大量表象数据积累来感知表象信息。在“猜画小歌”中,AI从大量的已被标注的手绘数据中学习到每个分类的核心特征,理解人们每一笔的下笔走势等细节。被训练好的AI系统从接收到的粗略轮廓中提取匹配的特征信息,从而识别出所画的物体。
从“猜画小歌”这样一个小小的游戏程序发展历程中,我们看到了AI技术的神奇,科技还会给我们带来哪些惊喜呢?值得期待。
是什么支撑着“小歌”做出判断?
“有时候画得挺像的,但是小歌却猜不到;有时候画得一点都不像,小歌却猜到了。”玩过“猜画小歌”的人往往都会有这样的感受,那么“猜画小歌”是如何做到在有限的时间内猜出你画的是什么呢,猜测的依据是什么?其背后是什么技术?
谷歌公司表示,“猜画小歌”背后的技术主要是计算机视觉和神经网络,由Google AI的神经网络驱动。早在去年11月,谷歌上线了一款叫“Quick,Draw!”的游戏,也就是“猜画小歌”的网页原版,通过这个网页版游戏,谷歌搜集了来自全球100多个国家和地区的5000万份绘画。而谷歌利用这些搜集来的绘画图,让计算机学习人类如何绘画,并且在谷歌上开源了数据库。
网页版的游戏也就成为“猜画小歌”微信小游戏的原型和数据来源,鉴于谷歌网站在中国的情况,此前的数据库中并没有收集到中国人的绘画作品,此次上线的微信小游戏弥补了这个数据空缺。为何要搜集不同国家的绘画作品呢?原来谷歌在游戏数据统计中发现,不同国家和地区的人们对于同一物品的绘画思路是不一样的,画出的作品各有特色,如美国人喜欢逆时针画圆,日本人更多习惯于顺时针画圆。对此,研究者认为,画画其实也是思维方式的一种表现形式,画画的笔顺受到母语书写笔顺的影响,在日语中,大部分的圆形笔画都是顺时针方向书写,这就导致人们在画画时笔顺也大多是顺时针方向。
谷歌对于“猜画小歌”作出这样的解释,计算机一直以来都是聪明的,在有了AI以后,计算机可以用一种自然的、更接近人类的方式去理解这个世界,其中一个令人兴奋的新进展就是计算机视觉技术,它能让计算机直接理解输入的视觉信息,并由此“看到”这个世界。实际上,你让“猜画小歌”猜出你画作的同时,“猜画小歌”也在洞察你的思维方式和书写习惯,学着像你一样认识这个世界,“看到”这个世界。
“猜画小歌”或许只是敲门砖
自从谷歌退出中国市场,谷歌的大部分服务与应用程序都被关在门外。谷歌曾多次通过“旁敲侧击”的方式接近中国消费者。今年1月,谷歌宣布和腾讯达成专利许可协议,意图在中国市场展开进一步合作。前不久,谷歌还向京东投资5.5亿美元。显然,中国这块大蛋糕,谷歌也不舍得放弃。
谷歌一名产品经理说,“猜画小歌”旨在让人们有机会体验一下人工智能的交互是多么自然。但有媒体表示,这是谷歌不断尝试重返中国消费市场的最新行动,与中国计划打造大规模的人工智能产业目标相吻合。
此前,谷歌的AR技术AR Core已借助小米、华为等手机,直接接触到中国用户。去年,谷歌在中国市场发布了“谷歌翻译”应用程序。今年5月,谷歌通过其在中国成立的公司将一个文件管理应用Files Go添加到小米、华为等几个应用程序商店。
去年年底,谷歌还在国内开设了第一家人工智能实验室。李飞飞曾表示:“中国在ImageNet、Kaggle、基础科研等方面有巨大的成就。除了发表自己的作品,谷歌人工智能实验室还将通过资助AI相关研讨会和中国的AI人才,支持人工智能的研究社区。”
除了自己发力外,像文章开头所言,谷歌还通过投资来增强中国市场的黏性。不论是和腾讯签署的专利交叉许可协议,还是入股京东,谷歌都表现出了与中国互联网巨头合作的意向。有媒体表示,谷歌可能把自己重返中国的宝押在了中国互联网巨头身上,未来,谷歌和其他公司或许会有更多的合作。
就“猜画小歌”而言,该款小游戏的目标很低,但这将成为谷歌在微信扎根的第一步,未来很可能基于微信这个平台推出更重要的应用程序或服务。
被AI错判的写实画作




被AI认可的灵魂画作

电钻

西兰花

埃菲尔铁塔

动物迁徙
蒙娜丽莎
评论