浅析智能对话机器人的初期相关理论以及未问先答业务场景的简单应用(电商平台)-爱代码爱编程
前言:
公司开发的软件需要引入智能聊天机器人(AI)。以提升用户体验感和满意度,增强用户与产品的黏度。目前市场上的AI聊天生态正处于快速发展期,无论是OpenAI的GPT,还是阿里的通义千问,亦或Google 提供的Dialogflow,以及百度的文心一言等,大多都有着不俗的性能,可以很好的提升其作为附属的相关产品的价值以及更好的满足使用者的需要。深究下来,这些产品的背后都是大模型提供了强力的支持,实际上,所谓的AI聊天机器人本质就是知识数据集的模糊输入、靶标命中、以及知识(方案)的输出。当然,这其中蕴含着无比复杂的各种细节以及逻辑上的问题。
随着LLM技术的快速发展,智能聊天工具得到了巨大的进步。在电商平台上,其主要作用于服务消费者,提升平台业务效果,既可以减少其它场景下的缺陷所带来的不利影响,也能服务于相关场景的需要。
接下来就以市面上主流的聊天机器人为背景板,简单聊聊聊天机器人在电商平台上的“功效”。
初期相关理论
业务覆盖
从用户方面分析,得到问题》》问询》》得到解决方案》》解决/未解决问题
从聊天机器人本身分析,预测问题》》根据训练逻辑查询知识库》》得到解决方案》》回复解决方案》》得到用户实际提出的问题》》根据训练逻辑查询知识库》》得到解决方案》》回复解决方案
相关性问题
作为电商客服机器人,机器人需要有良好的肢解和分析问题的能力。由于用户的广泛性和问题的深度层级以及方向的不同,难以使机器人成为某一类型的唯一和恒定性,对此,需要海量的数据去训练其不同维度的知识获取能力,进而定位到对应的知识或解决方案流程。此外,若沟通的模式一直是一问一答的形式,则长此以往,可能会导致几个大问题:
-
获取外界数据能力的薄弱,仅仅依靠自身系统的升级难以支撑起日益增长的用户需求。
-
对风险的把握不足,如何在提升对话多样性的情况下控制生成风险是需要解决的问题。
-
多轮状态下知识定位的准确性,多轮交互下如何保证能精准理解用户多阶段表达的内容并精确定位到知识。
方案设计
-
链路设计
不仅对于输入端,对输出端同样也要进行严格的把控,接入风控大模型,建立违禁词库,同时,若可输入输出音频、图片、视频等内容,也需要建立相应的违禁库以进行准入准出的控制。
另外,通过判断模型输出不同的标记来区分多轮对话阶段,如“[定位问题]xxxxx”,表示模型判断可以进行知识库检索,我们将模型生成结果进行检索,并定位到对应解决方案,结束问题沟通。而拒识或澄清,我们将会输出话术并与用户进行进一步确认。COT主要发挥的核心作用是,让模型学习到作为一名售后客服,回答用户问题的主要思路和模版。
-
对齐人工端沟通能力
建设问题沟通阶段的多轮能力,最直接的学习目标就是对齐人工端小二沟通习惯。因此需要对人人语聊进行了细致的处理,使得模型尽可能模仿小二进行问题沟通。
-
增强模型泛化性
防止模型的过拟合问题,在大模型的训练初期,容易出现过拟合,容易生成高频且带有幻觉的结果,泛化性很差;其次,若全部使用人工咨询的SFT指令进行训练,模型的通用指令能力似乎丧失了,也难以对通用知识进行拒识,因此需要混合更多通用数据,对模型进行重新SFT训练,增加模型的泛化能力,避免定位到错误的解决方案误导用户。
未问先答场景应用
“未问先答”顾名思义就是在用户刚刚进线时,根据用户当前状态,立即推送用户可能需要的解决方案,以帮助用户更快的定位到问题,减少用户成本。
对此,需要机器人能够掌握用户聊天窗口的上下文内容以及用户拥有的属性和状态。
业务难点&挑战
在大模型时代之前,算法侧对于服务轨迹的理解也进行了探索并在相关场景实现了落地,但受任务定义、模型框架等方面影响,理解内容存在一定的局限性,特别是对于需要进行灵活理解的场景较难适配。
从用户视角而言,进线后缺乏直接的“被理解”的体感,且在对话中需要重复描述,从平台运营视角而言,对于服务轨迹理解的不充分,导致较难实现解决方案和转人工策略(如重复进线场景)的差异化运营。
解决方案
抽取问题的关键节点和诉求,这需要在业务上线前对大模型进行充分的训练,推断买卖家之间的一致性和争论点。结合理解内容,代理用户提出问题,减少用户协助成本,适时引导用户提出问题。结合上下文服务轨迹以及当前服务状态,提升问题的定位能力和搜索知识集的准确性。在决策时,基于简易流程因子进行预填充,实现解决方案的输出。基于理解,建立多维度联系,探索相关可能性方案,并判断得到最大分数值的方案。并不断打造精细化差异化解决方案。
(由于能力实在有限,只能简单的分析相关理论价值,还在慢慢更新优化中,这需要不断地思考和落地实践以得出最优内容,并展现。存在很多不足之处还望各位读者老爷海涵。(以上内容仅是查找某些资料文档的个人理解))