有好算法,有好的“数据消化效率”,却没有足够的“数据饲料”去喂养这副“消化功能”极强的“胃
”。
这一直是初音
工智能研究院的缺憾,短板。
但是,如果按照严磊的说法,把谷歌中国过去五年,在中国市场上搜集到的服务器端历史记录数据统统copy过来,“填鸭式”地塞给“初秘”去学习,那么初秘在“真正听懂中国
讲话”这个问题上,起码可以赢得相当于额外获得两三年时间锻炼的效果。
历史上sIRI公司成立于2oo7年,1o年被苹果收购后,在4s上放出了这个
工智能产品。
但是用过Iphone4s的用户,恐怕都有一种记忆:
刚开始,4s上的sIRI智能程度真的很低,几乎听不懂什么话。还是只能和旧时代的“语音拨号助手”那样,帮主
翻翻通讯录、拨打一下电话为主。
至于让sIRI真的近似于
一样和主
聊天,似乎是2o12~2o13年的事
了,那时候的sIRI才渐渐说话像
话。
那就是因为,sIRI花了两三年时间来“学习”、来积累和消化云端大数据,渐渐统计出
类语言习惯。
如果谷歌中国不倒下,谷歌在华的那多年数据记录,肯定是作为商业秘密不会公开的。因为那涉及到其对中国
上网习惯的统计。如果公开了,很有可能被对手拿去,作为优化对手引擎算法的参照物。
但是,如果谷歌中国倒下了,这些数据再遮遮掩掩藏着,似乎就没什么意义了。
只要顾莫杰出一笔看上去挺诚意的价码,谷歌总部相信就会把这笔数据财富卖给初音。
顾莫杰意
着美好前景,简直要兽血沸腾。
恨不得现在就在老朋友拉利佩脊梁骨上捅一刀,然后把谷歌中国的数据资源巧取豪夺走。
“磊哥,来,好好说说你数据到手之后的详细使用计划。我都有点迫不及待了……”
“当然没问题,就是如此如此,这般这般……”
严磊一副指点江山状,对顾莫杰讲解了一个钟
的技术路线梗概。
“只要做到了这些,然后,我们的初秘肯定可以在‘
话识别率’上领先sIRI至少两年。”(未完待续。)
