ai智能语音客服 ai智能语音客服 ai智能语音客服机器人

创始人

2025-05-31 21:56:18

　　技术基础：智能出站机器人的核心是AI的基础技术，赋予产品语音识别、语义理解、语音合成的能力。简单来说，就是如何准确识别客户表达的意思，一般称为识别意向。另一方面，Fs和sip构建的电话服务赋予了产品拨打外线的能力，可以拨打客户的手机进行沟通。权限：机器人服务需要消耗一定的资源。一般整个过程分为流量、TTS、ASR、机器人的资源。如果要完成完整的外呼服务，一般是1:1的关系。如果是saas产品，可以把整个许可证打包成一个商品出售。根据这种区分，可以明确划分产品框架，后续的运维和扩展也非常方便，也有利于成本计算和产品定价。流量模块：流量模块是管理流量容量的功能，如语音通话、录音等。语音服务：这个模块是管理语音的能力，包括ASR服务和TTS服务。也有一些产品将这些功能整合到流量模块中。算法模块：算法模块是出站机器人的核心能力，需要完成数据处理、模型构建和训练等。这样机器人才能有识别能力。对话：机器人识别出顾客的意图后，需要做出一定的反应。怎么说，说什么由对话管理控制。管理：基于上述模块的协作，构建出站服务。对于业务人员来说，需要管理出库清单、出库策略等。在操作层面，让机器人工作。对产品有一个全局的架构思维，无论是产品设计还是后续运营，都有助于全面的看待问题。　　

　　00-1010智能呼出，简单来说就是模拟人的对话能力，教会机器人识别语音内容，然后根据内容做出反应。当运营管理发起出库动作时，整个业务流程将经历以下步骤：　　

　　1.根据电话服务的呼叫请求拨打客户电话后，采集客户的语音并实时返回给语音服务模块；　　

　　2.语音服务通过ASR处理客户的语音，并将客户的文字输出到算法模块；　　

　　3.算法模块通过算法分析，识别客户意图，理解客户想要表达的内容。有一点需要注意的是，分析意图不一定要说话。比如客户沉默太久，你可以输出一个沉默的意图，让机器人唤醒客户再来回答。它不一定是对文本内容的直接分析。比如机器人在演讲还没结束就被客户打断了，它要输出一个打断的意图，停止广播，让客户说话然后识别。各种情境，对应人与人之间的对话情境；　　

　　4.对话控制在获得客户意图后，根据对话过程输出机器人需要回答的内容。将回答文本转换为TTS合成语音(如果文本不涉及变量，可以一次性保存为录音，不占用TTS资源)，也可以将录制的音频转换为电话服务模块输出语音给客户。然后再次获取客户语音，循环这个过程直到结束，并将通话数据返回到外呼管理模块进行后续分析。　　

二、业务流程

10-1010依托FS强大的扩展性，搭建电话软交换平台，可以接入运营商的sip线路，也可以用来搭建带有网关设备的呼叫中心，可以提供呼叫控制、资源分配、录音、计费等能力。一般大型企业都会有独立的电话服务，专用于所需的业务系统接入，而自建的外呼服务或者saas产品需要从0到1搭建。　　

三、产品设计

ASR和TTS是基础底层技术，自研成本非常高，经过长期发展已经成熟。市场上有来自HKUST、阿里云、腾讯云和其他制造商的服务。一般有两种模式，一种是接入云服务，按照通话次数收费。如果有开放开发者　　

1. 话务服务模块

对话管理是智能出站机器人产品的核心模块，涉及VUI设计、语音管理等。VUI设计指的是语音交互过程，也就是机器人的响应逻辑，是机器人的主心骨。我对VUI的设计主要有以下几个步骤：　　

　　1）梳理外呼业务的主流程 　　

　　在产品中必须有一个过程来期望客户遵循我们的设计，完成某些动作，实现业务目标。所以在设计之前，要理清清楚自己要做什么业务，业务涉及哪些环节，业务目标是什么。以信用卡欠款催收为例：　　

　　2）归纳意图 　　

在业务运转过程找中，会遇到哪些情况，然后归类起来，形成一个意图，代表客户反馈给机器人的状态。可将意图分为三种类别：通用意图、业务意图、QA。

通用意图：顾名思义就是整个人机对话环节都可能会发生的情况。咱们可以想想现实中打电话，对方可能会正在忙没法接电话，可能信号不好听不清等等，可以归纳出“正忙、听不清”的意图；
业务意图：与业务相关的情况，比如客户表示是不是本人、已还清欠款等情况，可归纳出“是本人、非本人、已还款”的意图；
QA：通用意图以及业务意图是固定的，在实际运营中会有些频率不高或者未想到的语料，可以在线上添加QA语料，然后在后台经过关键词提取、预定训练方式实现模型建设，可减少算法投入成本，也比较灵活。如果某个QA出现频率高，可以考虑增加一个通用意图或者业务意图。

确定意图后，有助于我们梳理流程框架：

3）编写对话剧本

确定了环节、意图后，还是比较零散的信息，典型的对话场景是怎么样的？实际的对话流又是怎么体现的？这时候可以借助对话剧本去模拟人机对话。如果客户按推荐的流程走，并完成了目标，称之为愉悦路径。如果客户没有按推荐的流程走，无法完成外呼目标，则成为非愉悦路径。

举个例子：

编写对话剧本其实就是梳理主流程、异常分支如何处理，尤其是非愉悦路径，通话环境的情况很复杂，各种不在目标内的情况要做好处理。

4）设计对话跳转逻辑

经过对话剧本的编写，VUI有了雏形，接下来需要整合成一个完整的流程。对于VUI，我理解为一个庞大的决策树，在某个节点，根据客户的反馈决定往哪个分支走，主体设计是环节+意图+跳转。

对话的跳转逻辑设计是个十分复杂的过程，需要反复推敲跳转是否合理，是否符合业务场景，是否覆盖了常见的情况。从开场白到完成业务目标会有多种分支，而且有时候跳转较多，单纯看路径会比较抽象，可以借助对话剧本具象化。另外建议设置好结束点，路径设计不宜过长，机器人没法像人这么灵活，对话轮次过多反而会阻碍业务目标的达成。如果某个意图出现频率高，而且处理方式是一致的，可以提炼出来作为一个全局节点。

5）设计话术

确定了对话跳转逻辑后，需要明确每个节点机器人的应答话术。话术内容的设计也很考究，基本原则是通用化、封闭化。应答内容尽量通用化，往主流程引导，兜住未知的情景，复杂的内容引导客户去确认。虽然AI大大提升了效率，但是还没有达到可以处理全部开放化的情景，比较适合做标准化的工作。举个例子，你想确认客户的地址是否正确，不应该去问”请问您所在的地级市是哪里“，答案千千万万，而且asr识别不准，可行性可想而知，倒不如改为”请问您是在xxx地方吗？“，这样范围可控。

参照对话跳转逻辑设计每个节点话术，包括环节+客户意图+机器人话术+跳转节点:

经过5个步骤的思考以及设计，对话管理模块的功能已完成，产品展示层面比较多的是画布的模式，可以自由组合各个环节、节点以及话术。但VUI设计是复杂性的功能，不建议普通客户去操作，交由专业人员管理，或者采用模板的方式推广。

4. 算法模块

VUI里面涉及的意图是由算法分析出来的，建议在意图设计的环节也保持与算法的同事沟通。算法模型是核心资产，也是产品护城河。目前市面上会有厂商提供NLP服务，但作为核心能力，建议采用自研，契合自身业务去构建算法能力。智能产品需要众多的语料去完善其模型，即使产品上线后也需要不断去调优，一套完整的算法优化流程尤为重要。

作为产品经理，重点关注其中的标注结果，核对分类是否正确、是否存在与产品设计违背的地方、是否可以达到可用的效果，这样可以减少效果与最终目标的不适应情况。另外还有需要关注模型校验的结果是否符合预期，生产对客的效果如何。

虽然AI技术很强大，但也不是无敌，也要看与各个技术的配合度以及局限性。语音机器人特别依赖ASR的准确率，曾经踩过一个坑，询问客户的所在地，以判断是否可办理金融业务，但ASR对短句的转译能力差，无法精准转写，导致识别准确率很低，效果很不理想。如果前期关注到ASR的局限性，就很有可能会规避这个问题。

算法能力的构建涉及多个角色、多个流程以及持续性优化，如果业务比较成熟，可以搭建一套运营后台系统去支撑这部分工作，发现热点知识、拒识等内容，实行标注质检工作等。

5. 运营管理

经过各个模块的搭建，已经具备了机器人外呼能力、识别能力、对答能力，运营管理模块就负责如何使用机器人，根据业务需要设计各种外呼策略，比如重拨、定时外呼、防骚扰等。

四、结语

智能外呼机器人是AI落地较为广泛的产品，涉及了多个领域的知识，也需要多种角色参与，因此需要掌握的东西比较多，很考验产品的整合能力。同时也是十分重运营的产品，不是搭建完成就完事了。如果功能建设完成了，我认为只是从0到0.5，要达到真正的对客效果，还需要持续优化，采集更多的语料去丰富意图、提升识别效果等。

以上为本人的一点经验之谈，欢迎大家一起交流。

上一篇：创业背景模板创业背景模板创业背景分析怎么写

下一篇：文明新风吹进千家万户丨锲而不舍落实中央八项规定精神