技术基础:智能出站机器人的核心是AI的基础技术,赋予产品语音识别、语义理解、语音合成的能力。简单来说,就是如何准确识别客户表达的意思,一般称为识别意向。另一方面,Fs和sip构建的电话服务赋予了产品拨打外线的能力,可以拨打客户的手机进行沟通。权限:机器人服务需要消耗一定的资源。一般整个过程分为流量、TTS、ASR、机器人的资源。如果要完成完整的外呼服务,一般是1:1的关系。如果是saas产品,可以把整个许可证打包成一个商品出售。根据这种区分,可以明确划分产品框架,后续的运维和扩展也非常方便,也有利于成本计算和产品定价。流量模块:流量模块是管理流量容量的功能,如语音通话、录音等。语音服务:这个模块是管理语音的能力,包括ASR服务和TTS服务。也有一些产品将这些功能整合到流量模块中。算法模块:算法模块是出站机器人的核心能力,需要完成数据处理、模型构建和训练等。这样机器人才能有识别能力。对话:机器人识别出顾客的意图后,需要做出一定的反应。怎么说,说什么由对话管理控制。管理:基于上述模块的协作,构建出站服务。对于业务人员来说,需要管理出库清单、出库策略等。在操作层面,让机器人工作。对产品有一个全局的架构思维,无论是产品设计还是后续运营,都有助于全面的看待问题。
00-1010智能呼出,简单来说就是模拟人的对话能力,教会机器人识别语音内容,然后根据内容做出反应。当运营管理发起出库动作时,整个业务流程将经历以下步骤:
1.根据电话服务的呼叫请求拨打客户电话后,采集客户的语音并实时返回给语音服务模块;
2.语音服务通过ASR处理客户的语音,并将客户的文字输出到算法模块;
3.算法模块通过算法分析,识别客户意图,理解客户想要表达的内容。有一点需要注意的是,分析意图不一定要说话。比如客户沉默太久,你可以输出一个沉默的意图,让机器人唤醒客户再来回答。它不一定是对文本内容的直接分析。比如机器人在演讲还没结束就被客户打断了,它要输出一个打断的意图,停止广播,让客户说话然后识别。各种情境,对应人与人之间的对话情境;
4.对话控制在获得客户意图后,根据对话过程输出机器人需要回答的内容。将回答文本转换为TTS合成语音(如果文本不涉及变量,可以一次性保存为录音,不占用TTS资源),也可以将录制的音频转换为电话服务模块输出语音给客户。然后再次获取客户语音,循环这个过程直到结束,并将通话数据返回到外呼管理模块进行后续分析。
1)梳理外呼业务的主流程
在产品中必须有一个过程来期望客户遵循我们的设计,完成某些动作,实现业务目标。所以在设计之前,要理清清楚自己要做什么业务,业务涉及哪些环节,业务目标是什么。以信用卡欠款催收为例:
2)归纳意图
在业务运转过程找中,会遇到哪些情况,然后归类起来,形成一个意图,代表客户反馈给机器人的状态。可将意图分为三种类别:通用意图、业务意图、QA。
确定意图后,有助于我们梳理流程框架:
3)编写对话剧本
确定了环节、意图后,还是比较零散的信息,典型的对话场景是怎么样的?实际的对话流又是怎么体现的?这时候可以借助对话剧本去模拟人机对话。如果客户按推荐的流程走,并完成了目标,称之为愉悦路径。如果客户没有按推荐的流程走,无法完成外呼目标,则成为非愉悦路径。
举个例子:
编写对话剧本其实就是梳理主流程、异常分支如何处理,尤其是非愉悦路径,通话环境的情况很复杂,各种不在目标内的情况要做好处理。
4)设计对话跳转逻辑
经过对话剧本的编写,VUI有了雏形,接下来需要整合成一个完整的流程。对于VUI,我理解为一个庞大的决策树,在某个节点,根据客户的反馈决定往哪个分支走,主体设计是环节+意图+跳转。
对话的跳转逻辑设计是个十分复杂的过程,需要反复推敲跳转是否合理,是否符合业务场景,是否覆盖了常见的情况。从开场白到完成业务目标会有多种分支,而且有时候跳转较多,单纯看路径会比较抽象,可以借助对话剧本具象化。另外建议设置好结束点,路径设计不宜过长,机器人没法像人这么灵活,对话轮次过多反而会阻碍业务目标的达成。如果某个意图出现频率高,而且处理方式是一致的,可以提炼出来作为一个全局节点。
5)设计话术
确定了对话跳转逻辑后,需要明确每个节点机器人的应答话术。话术内容的设计也很考究,基本原则是通用化、封闭化。应答内容尽量通用化,往主流程引导,兜住未知的情景,复杂的内容引导客户去确认。虽然AI大大提升了效率,但是还没有达到可以处理全部开放化的情景,比较适合做标准化的工作。举个例子,你想确认客户的地址是否正确,不应该去问”请问您所在的地级市是哪里“,答案千千万万,而且asr识别不准,可行性可想而知,倒不如改为”请问您是在xxx地方吗?“,这样范围可控。
参照对话跳转逻辑设计每个节点话术,包括环节+客户意图+机器人话术+跳转节点:
经过5个步骤的思考以及设计,对话管理模块的功能已完成,产品展示层面比较多的是画布的模式,可以自由组合各个环节、节点以及话术。但VUI设计是复杂性的功能,不建议普通客户去操作,交由专业人员管理,或者采用模板的方式推广。
VUI里面涉及的意图是由算法分析出来的,建议在意图设计的环节也保持与算法的同事沟通。算法模型是核心资产,也是产品护城河。目前市面上会有厂商提供NLP服务,但作为核心能力,建议采用自研,契合自身业务去构建算法能力。智能产品需要众多的语料去完善其模型,即使产品上线后也需要不断去调优,一套完整的算法优化流程尤为重要。
作为产品经理,重点关注其中的标注结果,核对分类是否正确、是否存在与产品设计违背的地方、是否可以达到可用的效果,这样可以减少效果与最终目标的不适应情况。另外还有需要关注模型校验的结果是否符合预期,生产对客的效果如何。
虽然AI技术很强大,但也不是无敌,也要看与各个技术的配合度以及局限性。语音机器人特别依赖ASR的准确率,曾经踩过一个坑,询问客户的所在地,以判断是否可办理金融业务,但ASR对短句的转译能力差,无法精准转写,导致识别准确率很低,效果很不理想。如果前期关注到ASR的局限性,就很有可能会规避这个问题。
算法能力的构建涉及多个角色、多个流程以及持续性优化,如果业务比较成熟,可以搭建一套运营后台系统去支撑这部分工作,发现热点知识、拒识等内容,实行标注质检工作等。
经过各个模块的搭建,已经具备了机器人外呼能力、识别能力、对答能力,运营管理模块就负责如何使用机器人,根据业务需要设计各种外呼策略,比如重拨、定时外呼、防骚扰等。
智能外呼机器人是AI落地较为广泛的产品,涉及了多个领域的知识,也需要多种角色参与,因此需要掌握的东西比较多,很考验产品的整合能力。同时也是十分重运营的产品,不是搭建完成就完事了。如果功能建设完成了,我认为只是从0到0.5,要达到真正的对客效果,还需要持续优化,采集更多的语料去丰富意图、提升识别效果等。
以上为本人的一点经验之谈,欢迎大家一起交流。