<
>

苹果与Siri的七年之痒

2018-03-19 17:17:56 来源:易采站长站 作者:王振洲

“当时搜索团队有一种感觉,‘为什么我们不从头开始,创建我们需要创建的东西,然后再来协调两边?’”搜索团队的一名前成员说。“他们现在还在进行协调。”

Core Siri和Spotlight是由Topsy的技术和Siri数据服务组合而成的;该服务的基础是从iTunes搜索移植过来的旧版搜索技术,但是针对Siri进行了修改,在2013年的时候推出。 Siri数据服务处理维基百科、股票和电影放映时间等事项,Topsy则处理Twitter、新闻和web搜索结果。 Siri数据服务团队最终被并入了Topsy团队。但是它们使用的是两种不同的编程语言,很难协调。

对搜索团队的整合导致了一些令人尴尬的结果。用户使用Siri和Spotlight时可能会获得完全不同的回答,这些回答是由两个不同团队构建的两种不同的搜索技术提供的。

“宫斗”和篮球

Siri最初的技术涉及自然语言处理,它的用处是理解用户的意图。语音处理是用来检测用户讲的话,苹果最初将这项技术外包给了位于波士顿的Nuance。斯达西亚到来后,苹果公司开始致力于构建自己的语音识别软件。

2013年,该公司聘请了微软经验丰富的语音识别专家阿历克斯·阿西洛(Alex Acero)来领导一个新的语音识别团队。苹果还在2013年收购了语音创业公司诺瓦瑞斯技术公司,希望将其新的语音识别技术与核心Siri技术相结合,以改善Siri的语音交互能力。 Siri团队认为,将这些技术结合起来很有意义,可能会为Siri带来重大改善。

但在2014年年底,这种团队联合开始仅仅6个月后就结束了。阿西洛继续领导语音识别团队,而自然语言团队则由曾在咨询公司麦肯锡工作的管理顾问安诺普·辛哈(Anoop Sinha)来领导。

接受采访的前员工表示,从来没有人向他们解释过联合为什么要终结,但这件事给人的感觉是辛哈在搞“宫斗”。

辛哈没有自然语言处理领域的背景,Siri团队有几名成员从一开始就不喜欢他。一名前员工说,辛哈做决定的出发点似乎是办公室政治而不是科学。

辛哈和阿西洛不对盘是公开的,有一名前员工谈到了两人参加会议的情景:两个人会都让斯达西亚澄清他们中谁负责哪一个项目。这种“宫斗”引发了另一批员工离职,其中包括几名经验丰富的语音科学家。

辛哈的LinkedIn个人资料显示,他于2016年离职,现在是Facebook的工程经理。

基特劳斯和切尔又联手组建了一家名为Viv Labs的新公司,继续打造更好的数字助理,一些离开Siri团队的员工也投奔了他们。 斯达西亚对这样的情况很不爽。当得知基特劳斯和切尔仍然会去苹果园区和老同事打篮球时,斯达西亚担心他们挖走更多人。很快,两人就被禁止进入苹果园区了。

对手涌现

斯达西亚继续开展雄心勃勃的收购活动,试图改善Siri。 2015年10月,他牵头收购了VocalIQ,这是一家英国AI初创公司,致力于动态学习系统,而不是提供程式化的响应。

VocalIQ的一名员工说,VocalIQ团队将Siri视为“手工制作的系统”,认为他们的技术有助于改善之。他说,VocalIQ的技术旨在通过吸收和分析语音交互的数据,不断地调整准确性。知情人士透露,苹果已成功将VocalIQ技术整合到Siri的日历功能中。

苹果还在自然语言处理系统中引入了更多自动化机器学习技术。前Siri员工拉辛·萨阿(Rushin Shah)领导了将更多自动化机器学习集成到域选择中的工作—— 例如Siri需要弄清某个请求是要发短信,还是要打专车。萨阿在LinkedIn上的个人资料显示,他在2017年离开苹果公司,去了Facebook担任自然语言理解团队的高级经理。

与此同时,苹果公司在数字助理领域的优势地位已经不保。 2017年6月,《华尔街日报》的一篇报道预测,HomePod最好也就是排在家庭智能扬声器市场的第三位。

苹果公司似乎并未料到会面对这样的竞争。Siri团队的两个成员告诉记者,该团队直到2015年才知道苹果有HomePod项目。亚马逊推出Echo是在2014年底。据消息人士透露,苹果最初的计划之一是将在没有Siri的情况下推出扬声器。

苹果决定将Siri加入扬声器项目后,Siri语音识别单元开始与苹果以30亿美元的价格收购的Beats音频产品公司每周举行一次会议,一开始大约有25人参加这些会议。

Beats团队负责开发麦克风上的降噪和波束形成算法,以便更好地提取用户的语音命令。苹果公司在湾区周围的一些公寓安装了麦克风,用来收集数据并复制家庭环境。

暂时禁止评论

微信扫一扫

易采站长站微信账号