具体看,在立住“问题”后,豆包随即用反问句自然过渡,引出三个排比段提出解决问题的方法。然后用发展的眼光分析问题,结合现实生活揭示问题产生的根源和危害的部分颇为亮点。
重点考查实验探究能力的化学和物理试卷,各模型平均分更是只有34分和39分(满分为100和110)。化学单项最高分由豆包获得,成绩为49.5分,GPT-4o仅有42分。
以数学试卷为例,9款大模型产品中,仅GPT-4o、文心一言4.0和豆包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。
如上提到,大模型理科普遍不行,成绩要差很多,在数学、物理、化学等数理学科上差距极大,包括GPT-4o在内的所有大模型都无法达到及格水平。大模型的理科最好成绩还无法进入人类考生的前30%。
作为本次评测的语文作文阅卷人,北京市级骨干教师、怀柔区语文学科带头人夏老师曾多次参加全国高考语文阅卷。夏老师认为:“Al写出的文章大多有清晰完整的结构,有逻辑性,语言通顺流畅。但其理性有余,感性不足,缺乏感情色彩,自然就缺乏感染力。”
大模型在高考英语测试中的优势更是压倒性的。一张150分满分的英语卷子,平均分达到132分,其中客观题几乎都是满分或接近满分,丢分主要在应用文写作和读后续写的作文部分,表达空泛、缺少细节上是弊端。
与文科相比,大模型的理科成绩要差很多,最高分还不到480分,多数大模型的理科总分在400分以下,数学普遍不及格,相比河南理科511分的“一本”线,大模型还需努力。
领导留言板河南省教育考试院公布的高考录取分数线,文科本科一批分数线为521。根据测试结果,这意味着,GPT-4o、豆包、文心4.0、百小应等四款AI大模型在测试中的得分冲上了“一本”线。
在匿名阅卷中,豆包获得阅卷老师的好评:文章中显出的对就业结构、伦理方面的担心,展现出豆包已经具有不错的思想深度和思辨能力。
大模型处理自然语言方面的能力不容置疑,三款国产大模型产品获得了语文考试前三名,分别是百小应、字节豆包和腾讯元宝,得分依次为128分、125.5分和120.5分。丢分主要在语文写作上。
在历史和政治两科中,测试选手中有三至四家能达到80%以上的得分率。历史单科的桂冠归属豆包82.5的平均分。出乎意料的是,地理考试是文综三科中大模型表现最差的,最高分仅仅是 GPT-4o的68分。原因之一可能是地理涉及图片更多,AI识图能力有待提升。
330.63MB
查看680.49MB
查看52.6MB
查看764.73MB
查看321.93MB
查看243.15MB
查看588.25MB
查看930.88MB
查看767.88MB
查看632.68MB
查看735.13MB
查看232.22MB
查看516.66MB
查看359.65MB
查看569.86MB
查看161.28MB
查看214.26MB
查看533.21MB
查看451.77MB
查看955.11MB
查看825.99MB
查看110.68MB
查看508.64MB
查看380.61MB
查看897.88MB
查看233.87MB
查看608.77MB
查看383.34MB
查看907.28MB
查看965.67MB
查看973.61MB
查看128.59MB
查看848.74MB
查看477.39MB
查看277.11MB
查看793.73MB
查看507.88MB
查看769.64MB
查看401.97MB
查看818.87MB
查看559.17MB
查看872.37MB
查看442.95MB
查看556.36MB
查看629.25MB
查看745.55MB
查看195.79MB
查看268.79MB
查看285.72MB
查看885.41MB
查看425.43MB
查看527.63MB
查看558.59MB
查看623.65MB
查看546.85MB
查看343.37MB
查看589.49MB
查看476.39MB
查看374.72MB
查看685.81MB
查看673.40MB
查看907.16MB
查看874.20MB
查看376.31MB
查看101.13MB
查看400.12MB
查看980.59MB
查看605.28MB
查看808.17MB
查看744.69MB
查看173.31MB
查看567.45MB
查看559.13MB
查看221.97MB
查看238.11MB
查看445.44MB
查看934.21MB
查看617.39MB
查看989.14MB
查看854.30MB
查看847.84MB
查看442.94MB
查看858.35MB
查看280.78MB
查看904.92MB
查看280.76MB
查看279.98MB
查看978.80MB
查看818.28MB
查看287.21MB
查看556.80MB
查看880.22MB
查看403.78MB
查看280.16MB
查看360.12MB
查看207.69MB
查看231.63MB
查看628.47MB
查看977.36MB
查看961.27MB
查看259.32MB
查看331.45MB
查看399.31MB
查看187.19MB
查看
697 桂平wg
花游首金!中国队获得集体技巧自选金牌😷
2025-07-01 10:06:21 推荐
989 188****2213
台风“泰利”的“前世今生”☃
2025-07-03 0-1:39:45 不推荐
363 152****4083
普京首次回应集束弹药问题:俄方有权采取对等行动☇
2025-07-02 15:15:33 推荐
18 公园停车2
自称能搞定全上海名校 24位家长被骗上千万☊
2025-07-02 14:04:26 推荐