从技术角度来看,百度“神灯搜索”离我们有多远?

anonymous-100322  06/03   3962  
4.0/1 

2015-04-01 19:44 来源:itbear 

  今天是愚人节,各大互联网公司跟疯了似的推出了各种“愚人节产品”,各种天马行空那个、脑洞炸开。手机百度今天推出的是一个叫做“神灯搜索”的功能,需要使用手机百度搭配“百度神灯”智能扩展配件来使用。用户可以通过“摩擦摩擦”百度神灯的边框启动该功能,然后利用语音进行方便的搜索,搜索结果会以全息投影的形式呈现出来,并支持用户进行多轮语音交互、支持用户通过手指触摸对影像进行放大、缩小等操作。



  这个功能是真是假,我觉得不用现在花时间去讨论,作为一个科技宅,我想花时间把这个功能里面可能涉及到的技术稍微盘点一下,盘点完了你就知道它到底能不能实现、离我们还有多远了。

  “神灯搜索”都涉及了哪些技术?

  启动“神灯搜索”,需要用手摩擦“百度神灯”的边框,这个没什么技术障碍,很多智能手机现在都支持熄屏状态下的手势唤醒等操作,加个感应器的事儿而已;然后是语音搜索,这个虽然现在已经实现了,但是要实现后续的多轮对话,一方面需要更加出色的语音智能交互技术,另一方面也需要背后人工智能技术的强力支持;最后,还需要全息投影技术的支持以及在全息投影上进行操作的虚拟触控技术。

  既然摩擦唤醒不是个难事儿,我们就来看看语音智能交互、人工智能、全息投影以及虚拟触控技术的进展。探讨一下如果真要做“神灯搜索”的话,还有哪些技术需要提升。

  识别率不断提升,语音智能交互初具规模

  不同于大家熟悉的siri等语音产品,视频中“神灯搜索”和用户的语音智能交互过程让人印象深刻,而这些部分功能的实现需要依托于语音识别和人工智能这两个领域的进步。目前,谷歌、苹果、百度、科大讯飞等国内外企业都在语音识别领域发力,并取得了突破性进展。





  既然“神灯搜索”是百度可能推出的功能,我们就来看看百度目前在语音技术方面的进展。类似视频中演示的语音交互,其实包含了语音识别、语义理解和语音合成几个方面的技术,依托百度自然语言处理(NLP)及机器学习领域的经验,百度在语义理解方面的技术实力毋庸置疑;而近期,百度在语音识别率方面也取得了较大的突破。根据媒体的报道,百度首席科学家吴恩达曾透露,通过使用神经元系统以及数据燃料,百度人工智能帮语音识别提高了准确性,百度语音识别可以很好地处理背景噪音,使手机离得比较远也能很好地识别用户讲出的话。权威测试结果显示,在噪音环境中,百度Deep Speech系统的出错率要比谷歌语音识别引擎,微软必应以及苹果的语音系统低10%以上。这对类似神灯搜索这样的依托语音智能交互的功能来说意义非常重大。

  人工智能离你我很近

  百度神灯搜索还有一个亮点是“懂你”。当人们想订电影票时,通过“百度神灯”唤醒“神灯搜索”,语音搜索“最近什么电影好看啊”,手机百度就会立即投出近期热映的“帕丁顿熊”全息影像,并可以播放预告片,基于用户数据进行影院、场次、座位的智能推荐,简捷地完成在线选座。要像“神灯搜索”一样做到“有求必应“,背后的人工智能技术是关键。

  人工智能技术从去年开始再次得到了前所未有的关注,Eron Musk和霍金的“人工智能恶魔论”在学术界和产业界引发了激烈争论;资本对这个方向也是趋之若鹜。公开数据显示,截止到2004年,有超过20亿美元的风险投资流入到基于认知技术研究的产品和服务里,超过100家的相关公司被互联网巨头收购。谷歌、百度、Facebook和IBM四家科技公司在人工智能领域强势布局,并将这些技术应用到具体的产品和服务中,让人们真正感受到了人工智能带来的优势。

  例如谷歌去年初收购DeepMind公司后推出了新的模拟神经网络,能够模仿人类大脑的工作记忆原理,拥有更加强大的归纳整理和联想演绎等逻辑处理能力,从而带来更快的任务处理速度,还可以通过训练去自行处理任务。Facebook则利用人工智能算法分析用户在Facebook的全部行为,从而为用户挑选出其感兴趣的内容。IBM推出了新版“沃森”,并开放了Watson平台,开始与纽约基因中心开展合作,将人工智能用于医疗领域。

  国内企业中,百度在该领域深挖已久,去年刚刚正式对外公布了“百度大脑”。百度大脑通过深度学习来模拟人类大脑的神经元,参数规模达到百亿级别,这是世界上最大规模的深度神经网络,目前已具备2-3岁儿童智力水平。今年初,百度对外公布了其基于人工智能深度学习等技术打造的“对象识别方法和装置”专利技术,这项专利技术可以保证“神灯搜索”里所提及的多轮语音交互的实现。

  全息投影其实屡见不鲜,虚拟触控才是真正难点

  在“神灯搜索”功能里,“百度神灯”智能硬件可以投射出各类的全息投影。事实上,尽管全息投影看上去才刚刚为我们所了解,比如今年春晚上李宇春所表演的节目《蜀绣》就里用了该技术,但其实全息投影技术早在1947年就由英国物理学家盖伯发明出来了,而在我们的邻国日本,虚拟歌星初音未来早就考全息投影技术成了全民偶像。所以说,要实现全息投影其实并不难,可能存在的难点在于如何在不使用多余附件的情况下,既保证投影的效果,又让投射装置可以小型化到一个手机套的大小。



  “神灯搜索”在视频中还可以让用户实现对全息投影进行虚拟触控,之前曾经在极客圈子里小范围风靡过的Magic Cube激光键盘跟这个有些类似,用户只需要对着投射出来的影像就可以完成相应的交互。但像“神灯搜索”视频里演示的那种交互,基本上只在钢铁侠托尼·史塔克的办公室里见过,离真正走进我们日常的生活还有些远。

  眼下最实际的问题可能是电池

  说完了上面那几个高科技、高大上的技术,最后我们还是得提一句电池技术,全息投影要想达到一定的亮度和体积,需要的投射功率会很大,这就对电池有很高的要求,基于现阶段手机上常用的锂聚合物电池技术,要想支撑那种程度的交互,看起来并不乐观。所以,眼下最棘手的问题或许并不是那些技术到底发展到什么程度了,而是那些技术真正到了成熟可用的那一天的时候,电池技术是否也能随之跟上。

  所以,总体来看,手机百度的这个“神灯搜索”并不是遥不可及的目标,但要想达到视频里所演示的那种程度,路其实还是挺长的。返回光明网首页