柏菊
总共有3个
一个是李萌(化名)
李萌是北京一所高校播音主持专业的大四学生。为了让小冰开口说话,自 6 月以来,她每周来录音棚三次,每次从早上十点工作到下午五六点,最多一天大约能录 700 多句。这里录下的每句话都会保存成一个 wav 文件,传给微软的工程师处理。
李萌最早知道这个录音项目是 5 个月前。她说,学院老师让同学在班级群转了条消息,称有家公司需要为人工智能项目配音,要求是阳光、活泼的女生。
和班上几名同学一起报名后,老师带着她们到录音公司录制海选作品。不怎么用微博的李萌,当时还不知道小冰的存在。
明星是最早被放弃的,她们的声音太有个人特色,会被认出。而有经验的配音演员年纪普遍较大,很难一直“装”出 17 岁少女的声音。
“17 岁”使小冰成为人工智能中的异类。在人工智能还不够智能的今天,科技公司在推出人工智能助手的时候倾向于模糊人工智能的形象。苹果 Siri、亚马逊 Echo 以及微软的另一个语音助手 Cortana 都没有强调人工智能的年龄。
而小冰从推出之初便自称“16 岁少女”,去年年底一条宣布自己 17 岁的微博,引来 2000 多条评论。
录音指导廉洁负责塑造小冰的声音,在她看来,小冰这个 17 岁的姑娘“天不怕地不怕,同时也可以撒娇、卖萌,也可以削你。”
但技术团队提供的需求要细得多,在一份好几页的 PDF 文档上,微软的产品经理列出了“普通话”、“不要方言”、“关切度”等一系列指标。
两轮筛选以后,第三轮候选人只剩下五个人。这时侯除了主观判断以外,微软互联网工程院的研究员和工程师也加入参与进来,用技术手段衡量每一位参与者的声音是否稳定。
“之前录的一百句和第三百句之后的一百句。这两个一百句之间,如果是随便找个人的话,他的差异可能会很大。”人工智能语音组研究员夏海荣向《好奇心日报》解释说。只有稳定的声音才能被计算机识别处理,并根据需要重新组合成任意语句。
最后,录音指导和工程师在一张复杂的表格上分别给五名候选人打分,综合主观和技术数据两个维度后,来自同校同专业,编号为 102 和 143 的两名大学生开始为小冰“发声”。
在挑选发音人的同时,工程师们也开始着手构建小冰的语料库。语料库是工程师给小冰发音人挑选的句子,也是小冰声音来源的基础。
还有是浙江卫视少儿频道的一个出境主持人
还有一个是日本AKB48的一个成员(小冰凛菜)
后两个至于叫啥巨硬那边没说的~