桶接小球什么时候出 公测上线时间预告,
K12教育行业专题研究:教育大模型启航,细分领域性能较优
(报告出品方/作者:华泰证券,段联、郑裕佳)
国内教育垂直大模型陆续发布,初测效果尚可
有道:「子曰」教育大模型亮相,场景应用效果良好
7 月 26 日,有道在北京举办了“POWERED BY 子曰”教育大模型应用成果发布会。据发 布会,公司认为大模型在教育领域中最大的机会将是助力因材施教:(1)大模型具有强大 的语言理解和生成能力,可以提供个性化分析与指导;(2)大模型基于人类反馈塑造性格 和语言习惯,能够循循善诱为学生讲解,提供引导式的学习体验;(3)大模型在对全学科 知识进行整合后,可以灵活为用户提供全科和跨学科知识的支持。
有道发展大模型的思路:应用驱动、依托场景、扬长避短
1)应用驱动:有道 AI 技术发展一直十分注重技术落地,在产品和业务中真正为用户提供 所需要的功能。 2)依托场景:例如有道棋类产品提供 AI 棋局讲解功能,可以给出每一个步骤的胜率、风 险等信息。 3)扬长避短:在对话内容、相关性、翻译指令遵从能力、发音评价等方面进行了大量针对 性的优化;多年业务积累的数据、内容、技术能力等为做好大模型打下了坚实基础,例如 将不同教师的反馈用于不断调教模型,使得模型形成循循善诱、因材施教的名师风格。
「子曰」大模型在中英文基础对话、数理逻辑推算等方面表现良好
子曰大模型可以面向不同用户群体采取不同的对话风格。向小学生介绍万有引力的概念时, 大模型能够抓住核心概念,在小学生常识的基础上进行科普,同时,文本的语言风格轻松 活泼,适合低龄的学生。同样一个问题场景变为大学生时,模型对概念的解释更加专业全 面,并提供了与概念相关的公式和例子,满足大学生对专业知识的需求。
开放式问题的回答逻辑清晰,中翻英较为地道。当回答“踢足球有哪些好处”时,子曰大 模型可以迅速条理清晰地列出八点优势,并能够准确将其翻译为英语。
在进行数学和物理能力测试时,大模型并不是直接给出答案,而是将公式先列出来,在对 文本进行数据提取后将数据带入公式中得出正确的答案。并且,大模型能够理解和支持多 轮对话,在数学题中用“一个足球”提问后,在随后的物理题中用“这个球”进行指代, 模型可以理解指的是同一个小球。
有道:“场景为先”,推出六大产品化应用成果
在此次发布会上,有道展示了子曰教育大模型六个产品化的应用:LLM 翻译、AI 作文指导、 语法精讲、虚拟人口语教练、AIBox、文档问答。
LLM 翻译:更符合中国人语言逻辑的翻译引擎
有道 15 年来不断升级翻译技术模型以满足用户多元化的需求。2008 年,有道首先推出国 内第一个商用机器翻译引擎,经过 15 年技术迭代,有道逐渐从统计翻译发展到神经网络翻 译,并一步步升级到 Transformer 模型,翻译质量越来越高,翻译的应用形态越来越丰富, 越来越受到用户的欢迎。公司介绍,有道词典月活用户已超过 1 亿,是国内词典翻译市场 的第一名。随着用户对翻译的上下文理解、文体、语气等方面提出了更丰富的要求,有道 推出大语言模型(LLM)翻译,为用户提供更加场景化、高质量的机器翻译技术,公司预 计今年 Q3 上线。
有道 LLM 翻译的优势: 1)模型理解能力及表达能力全面提高:例如翻译同一则关于特斯拉的新闻,与谷歌和 ChatGPT 相比,有道翻译在表达上更符合中文语言习惯, 做到了简洁、准确、流畅。 2)篇章级问题处理更好:能关注到更多上下文信息,引用、指代、术语更加一致自然,篇 章级翻译处理更完善。例如,同样是翻译一则与日本福岛事件相关的新闻,与谷歌和 ChatGPT 相比,有道翻译做到了先讲核心事实、后加背景信息的“倒金字塔结构”,对文章 上下文逻辑关系的理解较为准确。 3)交互形式全面升级:从 YNMT 升级到自然语言指令,用户可自定义场景,千人千面。
文档问答:文档阅读助手,万字长文 10 秒 get
文档问答可以迅速提取文献中的关键信息,提高学习和工作效率。一篇上万字的文献在正 常情况下阅读并提取关键信息需要花费很长时间和精力,但是文档问答可以利用不到一分 钟的时间进行信息抽取和语义理解,并对问题进行高质量回答,将工作、科研时间缩短十 倍(公司内部测试数据),大大提高了阅读文献的效率。 分析专业文章时,模型能够根据学科特点进行论点整合、概念解释、表格信息提取等,满 足用户的专业学习需求。下面是用文档回答功能分析两篇学术论文的例子。第一篇文章是 心理学相关的英文文献,文档问答将其翻译为中文,并提供左右精准对照,方便用户的理 解和定位。在搜索框输入“总结一下本文的核心观点”后,文本框内迅速出现了一段对文 章内容的概括,并且标注来源页码,方便用户核查校对。对于文中出现的概念,文档问答 提供划词解释功能,能够较好地满足用户的学习需求。在对计算机领域的文章进行文档问 答时,模型展示了从表格中提取信息并进行分析总结的能力。对于更考验理解力的问题, 例如“这篇论文提出的方法和之前的工作相比有什么优势?它是用什么指标来评估效果的” 等,文档问答也能够迅速总结并给出回答和精准定位。这些功能将极大提高用户的生产力。
AI 作文指导:精准定位写作痛点,提供审题和批改两大功能
有道认为,学生在写作中最大的痛点不是写完后无人批改,而是拿到题目后不知道如何下 笔。AI 作文指导就是针对这一问题提供两点帮助: 1)教我写作文:学习机没有像传统作文书或批改软件一样直接罗列提供素材和范文,而是 从题目解析、核心观点、作文结构以及素材等方面一步步带着学生思考,帮助学生解读文 章立意,找到创作思路,掌握组织结构以及素材选取的方法。 2)帮我改作文:从语言表达、结构逻辑、内容深度、情感丰富度等维度提供修改建议。批 改时,学习机会将学生的写作亮点、好词好句逐一画出,在充分肯定同学们长处之后提出 存在的问题和可以提升的地方,整个过程循循善诱,堪比优秀的语文教师进行一对一辅导。
英语语法精讲:私人英语习题家教,AI 老师讲解长句难题
语法精讲功能可以像老师一样,一步一步带领学生抽丝剥茧般分析句子里面的语法结构, 还能推荐同类型的考题,帮助学生触类旁通,真正理解考纲中的考点。在长难句分析中, 语法精讲会首先概括句子的核心意思,让学生对整句话有掌握,然后抽离出句子的主干成 分,然后按照逻辑分析从句,每一步讲解完都会有暂停,方便学生理解和消化。语法精讲 功能还支持单选题扫描。与传统的答疑产品不同,语法精讲功能不会直接给学生提供答案, 而是会首先识别考点,然后拆解分析句子结构、上下文语义,这样将解答的思路分步提供, 让学生在面对难题的时候依然能够保持独立思考。
AI 口语教练:用地道发音和真实对话语境让用户享受一对一口语私教
AI 口语教练主要针对中国人缺乏语言环境的问题,通过打造真正贴合实际的“语境”,帮助 中国人更好地练习英语口语。与传统的口语联系产品不同,AI 口语教练具备类真人、发音 地道、能还原真实对话语境、循循善诱、提供实时报告等特点,让用户享受到类似一对一 口语私教的体验。 实现 AI 口语教练的四个核心创新技术: 1)对话大模型:利用子曰大模型,实现有感情、能推理、能互动的沟通。例如,发布会现 场 AI 口语教练与演讲人进行了多轮随机对话,从比较抽象的“人生目标一个亿”谈论到生 活化的“成都旅游”“最喜欢的作家刘慈欣”等话题,AI 口语教练会主动引导话题,让交流 变得生动有趣,保持交流持续进行下去。 2)虚拟人驱动:虚拟人具有真实的情感表达和实时沟通,在口语的升降调、语音的重度、 弱读以及口型的变化等方面表现俱佳。 3)语音识别以及语音合成能力:语音识别以及语音合成能力得益于网易打造了一个非常强 大的自研技术,可以实现回音消除、自动语音检测、自动短句等技术,带给用户更好的体 验。4)口语评测:在每次结束对话后,AI 都会对文本进行全维度测评,细化至音素级的发音纠 正以及文本批改润色,在口语和内容两方面提供改进意见。
AIBox:高效便捷的中英文写作“神器”
AIBox 致力于提供划词翻译、润色、扩写、总结等一站式服务,适用于论文、邮件、产品 方案等多种场景,并且延续了有道词典的“划词”操作逻辑,使用起来十分方便,全程无 需键盘操作。以一篇高考英语作文的内容扩写为例,点击扩写后,原本一句话的内容在十 几秒内被扩写成近两千字的英语作文,足以满足用户参考和引用的需求。在润色文章时, AIBox 不仅会展示润色后的句子,还会展示具体修改意见,例如更正错误拼写和语法、高级 词汇替代等,方便用户直接使用或是参考学习。
搭载「子曰」教育大模型应用的智能硬件新品将于八月起上市
据发布会,以上六项「子曰」教育大模型应用中,除文档问答和 AIbox 功能已上线有道翻 译外,公司预计有道 LLM 翻译将于今年第三季度上线;AI 口语教练功能将上线多种软硬件 产品,包括 8 月发布的词典笔、听力宝新品;语法精讲功能将在 8 月上线至有道词典笔新 品;AI 作文指导功能将在 8 月上线至有道 AI 学习机新品。
好未来:MathGPT 开放公测,支持小、初、高数学解题及讲题
好未来自研的数学大模型 MathGPT 已开放公测。该模型以数学领域的解题和讲题算法为核 心,致力于弥补和攻克大语言模型在数学解题方面的三个问题:正确率、解题步骤的清晰 稳定性、讲解的趣味性和个性化。相比于只能输入文字的通用大模型,MathGPT 增加了公 式编辑器和图片上传功能,输入体验上更加友好便捷;并且,MathGPT 的回答包括知识点 分析和解答两部分,并非直接给出计算结果。
教育垂类大模型 VS 通用大模型:虽有差距,亦有优势
中英翻译:「子曰」表达更符合中文习惯,但知识性认知方面稍有不足
我们分别截取了财经、科技、娱乐、自然科学等领域的一些英文文章片段,对有道「子曰」 大模型和通用大模型进行翻译测试。我们参照英语专业八级翻译评分原则,从“忠实”(即 准确度)和“通顺”两方面对测试结果进行对比。我们发现,基于「子曰」大模型的有道 LLM 翻译相对通用大模型更多地使用了代词,语言表达更精炼,语序也较为符合中文表达 习惯,但对一些知识性名词的理解上,通用大模型更为准确。
AI 口语对话:「子曰」在仿真性、话题灵活度、反馈详细度等方面表现优秀
讯飞星火大模型支持多轮 AI 口语对话,但并未应用虚拟人形象;有道的 AI 口语教练具有真 人的形象,在对话中也会模拟真人的神态和口型,给人身临其境的感觉。Duolingo(成立 于美国的线上语言学习平台)的 Roleplay 对话功能与子曰大模型的 AI 口语教练相似,但对 话相对局限于某些特定的话题,相比之下,有道 AI 口语教练可以自由畅聊任何话题,灵活 性更佳。并且,Duolingo 每次对话结束后的反馈仅有简短的几句话,而有道的 AI 口语教练 会从语法、发音等多维度生成评价报告,更为详尽。
写作指导:「子曰」大模型功能更丰富
讯飞星火大模型也被应用于学习机的“作文批改”功能上,但有道除批改外还提供主题立 意讲解、素材参考等功能,可以在写作前、写作后较为全面地帮助学生提升。
文本生成:「子曰」大模型指令操作更灵活便捷
讯飞的星火认知模型在扩写、续写、文章润色等能力与子曰大模型基本持平,两个大模型 的文本生成能力均较为成熟,从输出 结果可以看出,模型可以在识别出源文本为英文后自动将输出内容转化为英文,且输出结 果内容充实,条理清晰具有逻辑,但是相比于子曰大模型 AIBox 的功能能够对同一文本多 次施加指令不同,星火模型在接受指令后只能输出一次结果,无法在输出结果的基础上施 加迭代指令。这一点上,「子曰」更具灵活度和便捷性。
数学能力: MathGPT 在小学阶段正确率超过通用大模型;整体仍待突破
目前通用大模型在文字创作和语义理解上已有较好表现,但在数理逻辑方面仍有较大进步 空间。我们分别选取一套小学、初中、高中试题,对 MathGPT 和通用大模型进行测试对比。 我们的测试结果显示,在小学阶段,MathGPT 的正确率显著高于通用大模型,达到约 86%。 我们认为这与好未来(TAL US)在小学数学领域多年的教研教学积累密不可分。在初中和 高中阶段,随着题目难度的快速提升,参与测试的大模型的正确率均出现明显下滑。我们 认为整体来看,现有大模型的数学能力仍需进一步突破。
未来展望:以 Duolingo 为例,大模型有望赋能现有业务增长
23 年 3 月,Duolingo 宣布推出整合了 GPT-4 大语言模型的 Duolingo MAX 服务,在 Super 订阅服务基础上提供 Explain My Answer 和 Roleplay 两项新功能,每月收费 30 美元: 1、 Explain My Answer 功能:语言学习者在练习后,若对答案感到疑惑,可以进入与 Duo 机器人的聊天界面,要求 Duo 机器人进行举例解释或进一步澄清。 2、 Roleplay 功能:允许学习者通过与虚拟角色进行对话来获得经验值,虚拟角色会引导 学习者完成不同场景和话题的对话,例如“与 Lin 的未来度假计划”“在巴黎的咖啡馆 订购咖啡”“与 Eddy 一起去购买家具”等,并在完成对话后生成反馈和改进建议。
虽然目前 Duolingo MAX 服务面向的用户有限(仅限 iOS 平台,主要面向学习西班牙语和 法语的英语用户,且仅在美国、英国、爱尔兰、加拿大、澳大利亚、新西兰等国家开放), 但仍对公司财报产生了积极影响。据 Duolingo财报,作为接入 GPT-4后的第一个季度,23Q2 其 DAU 同比增长了 62%,MAU 同比增长了 50%,付费用户数同比增长了 59%;总收入同 比增长 44%达到约 1.27 亿美元,总订阅收款同比增长 41%达到约 1.38 亿美元,净利润约 370 万美元,同比扭亏为盈。随着 Duolingo Max 的预订人数和营收加入财报,Duolingo 上 调其 23 全年指引,预计总订阅收款将同比增长 33%-34%至 5.69 亿-5.75 亿美元(vs 前次 指引:同比增长 29%-31%至 5.52 亿-5.61 亿美元),总收入将同比增长 38% - 40%至 5.10 亿-5.16 亿美元(vs 前次指引:同比增长 35%-38%至 5 亿-5.09 亿美元),调整后 EBITDA 利润率有望达 14%-15%(vs 前次指引:11%-12%)。
与 Duolingo 直接接入现有通用模型大不同,目前国内已落地的「子曰」、MathGPT 等教育 垂类大模型均为自研。由于落地时间不长,目前这些模型尚在持续完善中,但通过前文测 试对比,我们认为教育垂类大模型在具体学习场景的应用具备一定优势,未来若相关公司 能更好地将大模型与现有的学习服务、智能硬件等业务相结合,则有望在帮助学生提高学 习效率的同时为公司的营收增长注入新的动力。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】。「链接」
-
桶接小球什么时候出 公测上线时间预告, 2023-10-07
-
桥梁建造比赛好玩吗 桥梁建造比赛玩法简介, 2023-10-07
-
桥梁建筑师搭桥好玩吗 桥梁建筑师搭桥玩法简介, 2023-10-07
-
桑葚的营养价值,常吃桑葚对身体有什么好处吗?,野生桑葚与种植桑葚营养价值 2023-10-07
-
桑葚怎样清洗才干净,桑葚应该怎么挑选、清洗?,桑葚如何清洗才能干净 2023-10-07
-
桑河二级水电厂—— 改变泰国用电量历史时间, 2023-10-07
-
桐城中学征选“近百年肯定” 校领导:希望精彩纷呈的下联,桐城中学官网征集对联 2023-10-07
-
桌球下载手机版游戏免费下载大全2022 桌球游戏下载排行榜, 2023-10-07
-
桌游模拟器正版账号,桌游模拟器免费下载 2023-10-07
-
桌游模拟器正版买,桌游模拟器去哪找游戏 2023-10-07