来源:刘飞
之前在文章里聊过,AI 落地场景才是大厂们需要关注的——单纯强调大模型的性能,未必经得起考验。另外早点进入市场,获取用户,也有利于 AI 模型的迭代。
昨天跟朋友拿到了钉钉斜杠“/”的测试邀请码,体验了一番,先说结论:
- 从可用性而言,整体还是略超出预期的。虽说看起来,出乎意料的比例没那么高,但的确有很多落地场景。
- 从目前覆盖的应用场景而言,大都是确定性比较强的任务,比如写电子邮件、做摘要等等。对于创意类的任务,完成得还不够好,不能直接完成很多细节的工作。
- 从 AI 结合的方式来看,钉钉还是把 IM 当做核心的界面,围绕 IM 实现更多 AI 的能力。对我体验下来而言,对投喂专属 AI 机器人的功能,感知是最兴奋的。
具体而言,这次钉钉把 AI 融入到了主要 4 个场景模块,我对它们的评价分别是:
- IM+AI:很有特色,也是个人认为最能满足刚需的。问答机器人想象空间很大
- 会议+AI:是能明确提升效率的功能,也是相对刚需的场景。
- 文档+AI:中规中矩,略超出预期,在可用的程度。算是行业常规。
- 应用开发+AI:略低于预期。还是在准确度和可用场景上做提升。
以下是展开的评测内容:
第一部分 与 IM 结合:群消息摘要、问答机器人这次的邀测功能里,最有特点的还是 IM 相关的两个 AI 功能。
第一个是聊天消息摘要。这是工作场景下最吃痛的地方了,常常一小会儿不在,就不知道最近群里发生了什么,有哪些重要信息。一条一条去浏览查看,成本实在很高,而且往往看到的内容都是大量的冗余。
摘要在这块就太有用了。
大致效果是这样的,可以一键快速生成,看到过去聊过的内容:
这对于工作场景之外也很有价值。很期待微信有类似的功能,可能在座的朋友,不少也是面对 999+ 的群消息,没有勇气点进去了吧。
在这次测试的所有 AI 功能里,最让我兴奋的,其实是另一个功能——问答机器人。
我在之前的文章里讲过,我们可以依靠大模型,以及私有的语料,去训练一个掌握独特信息甚至语气的 ChatBot。而钉钉的这个问答机器人就是这样的。
在一个群组里,可以给机器人投喂各种内容(钉钉文档),机器人就能记住和掌握这些信息。这里是一个案例。
在我投喂之前,机器人并不了解半拿铁播客是不是逐字稿,甚至不知道半拿铁是不是播客:
然后我把前阵子发过的这篇有关半拿铁的介绍文章投喂给了群组的机器人:
当我再问机器人的时候,结果就完全不同了:
这只是投喂了一小篇文章。这个问答机器人可以学习数十万字的文档,成为真正的知识库。
可以想象得到,至少在以下场景将会变得非常好用:
1)部门业务知识。各种部门里的业务信息和历史留档可以投喂,后来新人到群里,跟机器人交流学习就可以了,不用阅读大量的可能没有经过整理的部门文档。
2)主题学习群组。对于某个特定主题,比如用户体验,可以有一个群组专门用来投喂各种书籍、论文和学习资料,这个机器人就变成了专业老师,跟他交流能够得到新知。
3)产品售后答疑。将产品的特点、使用方式、注意事项都喂给机器人,客户在群里就可以随时艾特客服机器人,得到想要的回复,工作人员也可释放生产力。
知识管理是个老生常谈的问题,但管理知识的工具其实一直都局限在目录文档这样的形式里,对于内容知识的整理,不是一般人花少量时间就能搞定的。怎么梳理文档、怎么管理撰写的流程,一直是痛点。很多部门人员流动频繁,部门文档早就堆成屎山,用不起来了。
从 AI 是不是可以改造知识管理这个角度说,这是最让我兴奋的功能了。
我过往待过的大厂,也没有把知识管理真的搞明白的。要是能通过 AI 解决,让 AI 去消化过往的文档内容,这工作量就不可同日而语,是完全不同的局面了。也许对知识管理来说,无论是企业内的,还是外部场景的,都很有意义。
第二部分 与会议协同:会议自动智能摘要就在今天上午,阿里的通义大模型发布了一个新的板块,就是用来做音视频处理的「通义听悟」。这个名字起得一目了然,就是对音视频内容进行转写,同时做进一步的处理,比如区分角色(能到 10 人以上), 做会议摘要的提取,重点的标注,乃至待办事项。并且处理的内容长度目前官方称,是不限制开会时长和转写字数的。
我们来直接实验一下。
我找了两个朋友按照一段脚本模拟了一场会议,内容是我跟池建强老师之前聊过的那期播客(三五环 No.109)中的一段,主要是聊文档中的 AI 能帮我们做什么,很快就可以得到转出的内容:
同时重点是能得到几条分议题的摘要总结:
这样就能方便与会者,以及未来复盘会议的人,能快速捕捉到会议讲了什么。
如果说文档的 AI 功能效果还可以,有一定的应用场景的话,那会议智能摘要应该说效果也还可以,应用场景就更加刚需了。
第三部分 与文档结合:AI 协助图文创作文档结合 AI 已经是一个最常见的场景了,Notion、微软 Microsoft 365等都在文档AI上下了功夫,国内钉钉的确是赶在前边的,我们重点看看效果如何。
1 直接创意文档里可以让钉钉 AI 帮忙直接进行创意,根据简单的提示写一篇文章。
比如,我们让它写一个完全开放的故事:
效率还是很高的,实时就会出现大段文字:
故事的完整性很不错,并且提到了几个关键点:李峰为什么要转行(实现个人价值),李峰具体做了什么(学习了解行业、建立渠道、管理团队)。还包括一些小细节(工作是高薪)等等。当然故事本身很正向,比较积极,这点会显得不太现实。
从这个案例看,还是不错的。如果再调教一下、补充一些细节,想必是能够到可用的程度的。
总的来说,创意的部分随机性比较强,有的的确能帮上忙,但也不是都很惊艳。算是中规中矩。
2 推广文案在文档创作的部分,还有一个指令,是写推广文案,试试看给三五环写个推荐:
为了检验实用性,我们可以要求更具体,比如写小红书风格:
再比如,写知乎风格:
整体上来看,输入更多的 prompt 的效果显然是更好的,有了明确要求,给的结果就还不错。从实验结果来看,知乎的味儿不够冲,小红书的还不错。
同时可以看得出,AI 是不了解三五环的,也没有去搜集相关的信息,因此在表述上,完全都依赖提供的这简单的一句话。在一句话的基础上,「硬说」了这么多,还是值得给个肯定的。总的来说,还是满足预期的。
3 写大纲帮助列大纲,也是官方推荐的使用方式之一:
就像大家评价类 GPT 模型的一个主要的体验是有结构、很完整一样,对于这个大纲的完整性我是很满意的,前后的逻辑关联是有的,内容的覆盖也都不错。算是有点超出预期了。
4 写邮件既然是工作场景,肯定免不了要写邮件。
当然这个会显得冰冷,看 AI 能否理解这个问题,做调整。
不得不说,这个改完确实有「那味儿」了。在不少类似的职场的场景里,还挺好用的。比如给下属写点评、给老板写汇报、给同事写感谢信等等。虽说遣词造句还要润色,但对大多数不擅长写作的朋友来说,作为底稿,应该非常好用了。
5 生成表格直接输入每一列的字段名,就可以直接生成。当然,要是只生成一张空表,那这个功能看起来就很废了。这里的生成表格最大的不同是,AI 会协助填写一些内容,可以当做是基础的示例。
比如像这个:
对于一些知识性的信息,AI 就可以直接帮我们填好,甚至只需要微调就可以:
这里有一些常识性的错误,应该是信息获取有误。也期待早日能接入搜索引擎,或者提升语料的准确度吧。
文档的部分就展示这么多。官方推荐的指令还有:头脑风暴(起名字、slogan),职位描述、新闻稿、合同等等。对于基本的应用问题都是不大的,也能在没有思路的情况下提供一些启发,或者在撰写时不够熟练,让AI帮忙润色。
就文档相关的 AI 功能体验说,确实接近了 GPT-3.5 的水平,较大家通常吐槽的国内大模型都差两年而言,算是略超出预期了。
第四部分 与应用结合:拍照让 AI 生成应用
钉钉还提供了拍照生成应用的 AI 功能。这个功能是可以拍摄你手绘的表格,直接变成群组里的应用,比如用户调研问卷、工厂巡检反馈、选题报送申请等。
像这是我手绘的一个示例,我故意把字写得歪歪扭扭一些,还做了涂改:
在群组里就可以直接生成一个可以填写的应用表单:
显然识别是有错误的,我想把应用的名字和字段改掉,发现失败了:
可能是要严格的格式才可以?目前这块显然还有优化空间,我没有再继续读说明书去研究了。这个拍照生成应用对我而言,稍微有点扯虎皮了,实际上是生成表单,虽说是应用,但应用的类型有点过于单一。
另外就是对话的交互,在制作表单应用方面,真的未必是高效的。就像刚刚的表单,我手绘加上反复调试错误的工夫,可能早就在编辑页面手工弄好了,AI 就显得有点鸡肋。当然,在很多不太方便操作、需要用口头表述的场景下,AI 也许会更有价值。
官方提到比较重要的一点,也是让我觉得拉回一些分数的,是钉钉宜搭低代码由于覆盖了各种行业的应用模板,就可以在高频场景下,比如行政、财务、制造流程等方面,基于你初步搭建的应用,结合 AI 大模型的理解,从模版库里提供一些字段建议,这也算是 AI 的重点使用了。
可以理解目前可用性还不太够,但依然能感知到 AI 在企业应用方面的巨大空间。钉钉花了不少时间钻研如何做开放性的生态,其中最难解决的问题,还是渗透进各行各业的场景,并围绕不同的场景搭建应用(低代码、酷应用)。
AI 是一个很显而易见更简洁、更优雅的实现方式,不是堆砌代码和工程量,而是让 AI 辅助判断,配合垂直领域的知识库(有投喂的问答机器人,以及未来很可能提供的 toB 模型),这块在未来将变得更加有意义。
写在最后在最后,补充几个核心的观点。
第一,从可用性而言,整体还是略超出预期的。虽说看起来,出乎意料的比例没那么高,但无论是写大纲、写邮件,做群摘要、会议摘要,还是组建自己的知识机器人,都是能深刻改变我们职场工作的习惯的。
在这些高频的场景下,钉钉做的这些AI 功能已经到达可用的地步了。这也是大模型发展的一个转折点:真正落地到了一部分的应用(替代掉了大量的手工),那 AI 就会更快速地成长,从而形成闭环的效应,继而再替代更多的手工。
哪怕是刚刚提到的 AI 生成应用看起来还不成熟的功能,有了使用量后,迭代也将会是有加速度的。
第二,从目前覆盖的应用场景而言,大都是确定性比较强的任务,比如写电子邮件、做摘要等等。对于创意类的任务,完成得还不够好,AI 也不能很顺滑地理解我们的需求,直接完成很多细节的工作(比如对表单应用的修改,就怎么说都不好使,还得加一堆规则)。
因此这也是一直以来给我们打工人的启示:要有抗风险能力的话,多做创意类的,而不是确定性很强的工作。
第三,从 AI 结合的方式来看,钉钉还是把 IM 当做核心的界面,围绕 IM 实现更多 AI 的能力。而且正如前面所说,我也对 IM+AI 的部分最为兴奋。
群聊天摘要和投喂养成的专属 AI 机器人功能,实在很有价值。毕竟在当下,无论是工作,还是生活,我们大部分内容的生产就发生在 IM 中。不管是办公 IM 钉钉,还是微信这样的产品,AI 的协助就能加最大的杠杆了。这跟我之前聊过的(当群聊从协作的枢纽变成界面)就有了对应。
最后说回钉钉斜杠“/”,这的确是国内目前比较容易能快速落地的AIGC应用了。用 AI 重塑产品,会让钉钉变成不仅是办公协作类,还可能是所有类型产品的排头兵。
很期待接下来 AI 在国内更多产品上的落地。