document.write('
')

作业帮首席架构师王岩:AI 落地,最关键的是要了解核心资源和技术优势

人工智能被称为第四次工业革命,被社会各界寄予了无穷大的期望。它在改善人们生活的同时,提高了整个社会的运行效率。近年以来的大模型、多模态也再一次助推了相关研究的火热。而在聚光灯下,可能大家更多看到的是,业内正在将 AI 推向极致的一面,却往往忽略了它「水利万物」的另外一面。

技术的发展离不开实际的场景,AI 研究热潮的多次起伏,始终伴随着应用落地这个难题。如何将「高大上」的技术稳步推向落地?如何看待 AI 与细分行业的深度融合?如何看待大模型的研究热?

怀揣着这些问题,我们采访了深耕教育场景的科技公司:作业帮。作为一家致力于用科技手段助力教育普惠的企业,运用人工智能、大数据等前沿技术,不论面向数亿规模的 C 端用户,还是成千上万的 B 端客户,都提供了一系列高效的学习和教育解决方案与产品。

尤其在教育领域,AI 技术的探索和落地,不管是用户规模和技术选型都具有很好的代表性。这也为我们思考如何用人工智能推动行业变革,给出了重要的借鉴与参考。

我们有幸邀请到了作业帮智能技术实验室首席架构师王岩谈谈他对这些问题的见解。

PART 01

教育产品的基座:题库建设三板斧

提起作业帮,大家可能印象深刻的还是强大的题库功能。作业帮是全国最早建立题库的教育科技公司之一,到目前已经拥有 5.4 亿+的题库体量。如此庞大的题库是如何建设起来的?

据王岩介绍,题库建设的成功,得益于三个方面的条件。首先,源于作业帮的先天优势:众所周知,作业帮最开始是百度内部孵化的业务,最初定位于一个问答互助社区,后来推出搜索答疑业务。为了优化搜索答疑结果,作业帮通过组建全职教研和兼职老师团队,搭建起了线上最大的题库生产平台。

这也是源于百度知道的模式,在崇尚分享交流的社区氛围中,鼓励用户相互解决问题,也非常贴近网友实际的问答和交流场景。而不是当时别家的做法:让兼职大学生做题库。这样通过对用户产出的内容进行深入的分析挖掘,我们就逐渐清楚了在学习的场景中,用户到底最关注哪些问题,哪些是问题更难的、哪些问题是多数人都会遇到的。这是一个重要的前提,它明确了我们的建设方向。

第二,作业帮非常重视资源的价值与建设,对题库足够重视。题库不仅在用户交流中作用巨大,在答疑和教学中也是非常重要的一环。凭借众包的体系,将题库的建设拆分成难度较小的独立工艺环节,使得题库较好较快,也相对比较全面的建立起来,这样很好地保证了题库建设的规模性。

第三,光有一道道题目还不够,还需要将题目关联起来,比如:所考察的知识点、难易度以及所依赖的其他知识点等标签术语关联起来。这就涉及标签的加工,并与知识图谱、知识树等技术基础设施关联起来。这样才能让题库具备可被高效检索和筛选的能力,让题库的价值得以真正发挥出来。

当然,题库本身建设过程中有很多环节一开始都使用人工操作,后来不断引入了 AI 技术,比如题目拍照等大多数电子化录入步骤,AI 将这些图像自动识别变成计算机可理解的格式化的数据和语言。通过自动打标签、格式化公式、AI 纠错技术等 AI 能力来进行自动化辅助处理,准确率大幅提升,也大大降低了人工成本。得益于题库的建设以及对 AI 技术的不断深入和扩大,作业帮通过落地一系列 AI 加速技术,把搜索答疑的响应时间优化到 1 秒,而早期同类产品的响应时间都在 8 秒左右。

在对接公立学校的项目中,题库在辅助教学场景中发挥了很大的作用。一个亮点的场景就是具备个性化精准推题能力的高质量作业系统。该系统的本质是将基于不同的学生状态,比如做题时长,不同知识点掌握程度进行数据分析进行个性化推题。因为对学生而言,太容易和太难都会让题目失去价值。同样一道题目对于不同的学生而言价值就会不同。所以需要对学生有充分的了解,结合题库本身丰富的标签维度,精准匹配,题库在高质量作业产品设计中的辅助作用很大,有利于学生巩固真正需要巩固的知识。

PART 02

自动辅助批改:机器如何解图形题

作业场景方面,除了题库,比较重要的就是自动辅助批改技术。相较于客观题,主观题的批改就难度很大。以数学的解答题为例,利用多年积累的 OCR 技术对学生的作答内容进行精准的识别,在通过 NLP 技术进行结构化的分析,比如答题内容的逻辑分析,再根据答题规范识别错误点等;此外,还运用了知识图谱的能力,不仅指出学生哪里错了,还可以告诉学生为什么会错,再配合用户画像和推荐算法的能力生成学生专属的学习报告,帮助学生找出学习过程中的薄弱点。

上一篇:魔兽世界化学常识任务怎么做 化学常识任务全流程攻略
下一篇:垃圾分类知识科普丨这些垃圾分类小知识,你知道多少?