日前,上海首个政务服务垂类大模型应用——徐汇区政务服务大模型正式上线。面对越来越“聪明”的大模型,政务服务的一线窗口人员怎么看?大模型,会取代人类吗?

“十八罗汉”的帮手

刘蕾是徐汇区行政服务中心法人事项综合受理大厅(A厅)的一名综窗工作人员,每天和同事们负责大厅18个综合办理窗口的咨询受理工作,因而被称为“十八罗汉”。2018年,徐汇区在上海首创“零差别”受理综合窗口,“十八罗汉”人人都通晓1000余项法人事务“一窗综办”事项。

既然有业务精湛的窗口人员,为何还要专门研发政务服务大模型?徐汇区大数据局副局长胡炳介绍,徐汇累积的数字化基础,新公司法带来的办件量增长,还有不断涌现的新产业、新赛道,都推动着徐汇区在海量政务信息中梳理、锻造出具有行业针对性的政务垂类大模型。

“一方面,综窗开设6年来,1000多项事项情形的办理数据均数字化留档,形成了数字底座。另一方面,A厅每天办件量约90%都围绕企业经营变更,单日办件量创下最高纪录800件的那天,约85%都是办理这类事项,重复性突出。”徐汇区行政服务中心公共服务科副科长黄炜说,无论是5月新出台的食品登记管理条例,还是7月1日即将实施的新公司法,只要相关法规更新变化,一线窗口人员就要第一时间学习掌握。

因此,依托当下发展迅速、成熟的大模型技术,来辅助窗口人员提升办事效率和收件准确率,减少企业的跑动次数和等待时间,是徐汇花大力气研发政务垂类大模型的初衷。

从通用到垂类

“五一”前夕,刘蕾开始使用测试阶段的徐汇区政务服务大模型。起初,她在对话框询问大模型最常见的窗口办理事项,譬如“企业注销如何操作”。但大模型回复得非常宽泛,不是内容关联不上,就是洋洋洒洒把沾边的办理操作都列举一通。

不过,刘蕾的任务并非只是与大模型“聊天”,而是不断通过进阶式问答,引导大模型最终输出最准确的答案。常见的训练方式是给大模型更具象的关键词,比如,提问时告知大模型是咨询企业“简易注销”还是“普通注销”。“训练几次后,大模型就学会反问是哪一种注销,甚至会主动提问,是注销内资公司还是外资公司,学得非常快。”

除了窗口工作人员的日常“训练”,数据量的多少也决定了大模型的能力上限。

去年,徐汇区在全市率先推出“线上政务服务大厅”,随后上线“办件中心”模块。这让徐汇率先拥有了政务服务领域的“问题发现模型”,在对涉及环节超时、多次补正、多次跑动、材料规范等4大类93万条办件数据进行智能自检后,转化为了可用、可查询的大模型基础数据。

徐汇区大数据中心积累的“数字底座”涵盖高频业务、法律政策、日常办件数据,使得徐汇区政务服务大模型“横空出世”时,基础数据规模就达到12.31PB(拍字节)。加上徐汇目前可支撑72B参数的大语言模型算力,政务服务大模型的“基建”有了保障。

“徐汇作为上海首个国家级‘互联网+政务服务’示范区,既有厚实的大数据基础,也有一批对数字化高度敏感的窗口受理人员,将新知识、新场景‘教授’给大模型。”阿里云解决方案架构师、徐汇区政务服务大模型项目负责人张朋说。

阿里团队做了三件事:梳理大模型要学习的知识点;总结法人事项办理综窗的高频问答;在徐汇本地化部署阿里云通义千问72B的基础大模型。政务服务大模型在“动脑筋”时,会同时调动基础知识点、高频问答以及通用大模型这三路,经算法合成为一个回答。

窗口人员在实际使用中,纠正大模型缺失、使用错误的知识点,补上正确的回答后提交给后台,算法会将上述反馈应用到模型库,大模型自己学习后,再遇到同类问题就能给出更精准的答案。

解放出时间和精力

“95后”李子安是首批使用政务服务大模型的窗口人员之一。回忆起一年多前自己刚转岗到综窗,大量需要记忆、背诵、理解和掌握的培训内容,小伙子直言多少有些“痛苦”。例如,股东在有限责任公司和合伙企业中分别被称为“股东”和“合伙人”,对待不同性质的企业要随时切换表述。而动辄比砖块还厚的法规条文,即便在窗口能开卷翻阅,仍需要事先记忆大量内容。

而现在,这些内容都能由大模型辅助提供,窗口人员要做的更多是对问题进行定性、分类与反馈。

随着日复一日的使用,大模型的学习效果也颇为显著。“一开始问‘股东去蹲局子了股权变更怎么做’,大模型会纠结于口语化的表述,但现在,它已经能理解这个问题本质就是问股权变更,能找到对应的知识点来回答。”李子安说。

眼下,徐汇区政务服务大模型已构建“办事人提问—窗口人员转化—大模型详细回复”的应用场景,有效提升了窗口人员翻阅法条、比对具体数字的效率。窗口人员会被大模型取代吗?

“未来或许会有18个数字人坐在综窗,但目前,大模型尚处在学习进化的过程,人与人面对面交流的温度和效率还不可取代。”黄炜说。“测试时,我们尝试催促大模型赶快作答,结果它被问到‘CPU都快烧了’。”刘蕾从这个例子发现,人类不要纠结于是否会被取代,而是要将人工智能为自己解放出来的时间和精力,用在更高阶的地方。

据悉,基于徐汇区政务服务大模型的“十八罗汉数字人”正计划推出,相应的模型算法也将推广至徐汇的各街镇和功能区。