高考题,AI大模型不能解,也不敢解

高考,中文世界权威度和认可度最高的标准化考试,世界上最公平的大型选拔考试之一,还在如期进行中。这项考试制度成熟、人数众多、标准统一,各科命题经过多轮审定,阅卷过程统一标准、分数精确。考试考取的分数背后,看似是对知识点和做题能力的展示,实则揭示的是其抽象逻辑、信息整合、快速运算和写作表达等能力。尤其是

高考,中文世界权威度和认可度最高的标准化考试,世界上最公平的大型选拔考试之一,还在如期进行中。

这项考试制度成熟、人数众多、标准统一,各科命题经过多轮审定,阅卷过程统一标准、分数精确。考试考取的分数背后,看似是对知识点和做题能力的展示,实则揭示的是其抽象逻辑、信息整合、快速运算和写作表达等能力。

尤其是逻辑思考和推理能力,是学生时期被重点训练的素养,是绩优生引以为傲的资本,进入社会用来吃饭的看家本事,而当今年大模型深度思考能力全面开花之际,想必大多数学霸会产生一种别样的复杂的心情。

当然了,高考的特殊性,使其成为了大模型能力的天然试金石。高考期间,哪家大模型解题能力强,综合评分到底可以上几本学校,成为很多人津津乐道的话题,今年类似相关的测评文章也零星出现了。

而当随机测试了下市面上主流通用大模型解答高考题时,结果却出人意料——这些大模型压根没有想要参加高考。

上传了高考全国卷I数学试题后,有的大模型显示无法上传,有的则表示无法识别。而一同被“禁言”的解读的,还有往年的高考数学题。

各大主流国产模型厂商对今年高考数学题的回应

高考期间(6月7日-10日),主流国产模型厂商对今年高考数学题的回应

事实上,不只是数学难题,国产大模型已经屏蔽掉了K12阶段学科(语文、数学、英语、物理、化学、生物、历史、地理、政治)内容的部分推理与解析能力。具体而言是,图片识题(拍题)功能禁用,高考真题关键词屏蔽,甚至禁止回答具体某年高考题目。

DeepSeek对高考以及高考题相关的话题限制非常严格,而给出略显详细的提示词后,会给出丰富的答案。

高考期间(6月7日-10日),相比其他大模型应用,DeepSeek对高考以及高考题相关的话题限制更为严格,而给出略显详细的提示词后,也会给出丰富的答案。

也就是说,在今年高考期间,主流的国产模型厂商,都主动或被动对高考采取了限制措施,这在国产大模型发展进程里还是头一回。

实际上,ChatGPT、Claude等国外的大模型可以解答今年高考相关题目,并且以高水平完成推理过程。而大多数国产通用大模型,已经在多项技术指标上持续逼近全球*水平,甚至在某些垂直细分场景呈现*的趋势,也意味着它们是具备足够的能力来解答这些题目的。

很显然,这一次功能“降级”,本质上是一次策略性的行为,也是平台技术治理与内容安全机制的体现。

当前,多数模型处理高考题的模式是,当识别到题干结构类似高考题(选择题、大题、简答题),会直接返回“不支持”或“无法识别”。而图片上传识别时,系统会直接禁掉OCR模块或限制调用次数。与此同时,也对“高考”,“高考真题”等关键词自动限流。这是大模型的内容风险识别系统在发挥作用。

这一场高考期间“特别监管”,目前各大厂商未主动发布官方声明。而最直接的原因,恐怕是为了防止高考考试作弊。因为多数模型厂商直接在页面给出文字提示,无法支持相关功能,是“为了保证高考公平公正”,“为了确保高考的公平性”,“重要考试期间,换个话题试试”等。

但事实上,目前没有公开报道显示,国内已经有利用AI大模型在考场作弊的案例(国外大学已有识别学生利用ChatGPT作弊而被开除的案例),但确实已经存在一些大模型相关的考试虚假信息和诈骗行为,并且已经被监管部门重点关注。

这里涉及的是,今年高考前,教育部、中央网信办、公安部查处了部分商家。这些商家利用一些考生、家长的投机心理,将押题当成牟利工具,通过宣称“神预测”“精准押题”、炒作“名师押题”“AI押题”等虚假宣传手段,诱导考生、家长购买所谓的“高考押题卷”“高考猜题库”“备考攻略”等。

与此同时,当AI大模型进入更多硬件设备而非只是手机时,与考试有关的新问题也随之浮现。今年4月,《央视新闻》发出了一个疑问,“AI眼镜成考试作弊‘神器’怎么防?”而Rokid创始人、CEO祝铭明就这一问题答复是,“可能最简单的方法就是屏蔽信号或者把功能关掉”。

回到高考本身,这是我国最重要的考试之一,已经纳入国家治理的重要领域,现代教育测试学的标准性和普适性,使得高考一直被看作是教育公平与社会稳定的制度性支柱。高考题目及其解析涉及国家教育考试制度,具有高度敏感性和保密等级,任何失误或越界可能被定性为破坏考试秩序。

而一旦出现泄题或作弊的情况,都会被视为国家级事件。大模型有可能被考生用于作弊,而错误解答了真实或类似的高考试题,会持续引发公众的质疑。

事实上,监管层在今年已经明令禁止AI技术干扰正常的高考秩序。5月30日,教育部会同中央网信办、公安部发布了消息联合查处涉高考违法有害信息,重点整治的是,炒作夸大涉考不实信息,借AI技术生成发布涉考虚假信息,以及,干扰舆论和误导公众等行为。

在考试期间,涉及高考试题相关行为,可能被认定为是协助作弊,或者扰乱考试秩序,平台将面临监管和法律风险。主流国产大模型目前仍在“合规优先”的阶段,在监管本就密集的K12教育领域,冒险展示技术能力,将面临政策、伦理和市场风险多重压力。

而其实,如果从技术侧考虑,模型厂商限制相关功能,也未必是全然是“被迫”的行为。因为AI大模型的幻觉问题始终难解,同一个提问和提示词情况下,多次生成的内容也不全然一致,尤其是数理等更标准化的科目,纯属将模型能力的弱项暴露给公众。

尽管有些模型厂商已经以“解答高考题的准确率”为卖点宣传自身,但是,更多厂商为避免出现“AI答案”和“官方答案”不一致的尴尬,全部禁止作答高考题,不失为一种较为理性的决策。

不过,大模型的平台自律与避险机制,在高考结束后,就会陆续恢复对K12内容的部分支持,因为市场需求永远都在那里。

一个有意思的现象是,今年高考期间,“高考期间能用的AI”在社交平台上引起了小范围的讨论,而关注这一话题的,却是大学生群体。“正在复习的大学生天塌了”,“救救大学生吧”,“高考*的受害者出现”,因为当前也正值大学期末考试季。

这些在社交媒体上小范围的“怨声载道”,段子式的调侃,说明的是,大模型已经深深地介入了大学生的学习、成长的主线任务。

不同于K12的解题答疑,大模型在高等教育中使用场景更为丰富,但也面临着最为激烈的争议。一些学校明令禁止使用,但随着大模型的发展,有的学校和教师也鼓励学生,以负责任的方式用AI辅助学习与研究,并允许在明确声明的前提下适度使用AI。

即便如此,考试场景也是被各方排除在外的一个共识场景。

如何划定学生使用AI的边界,使用场景自然是核心要义。大模型可成为启发式学习伙伴,尤其是深度思考普及之后。而在考试场景中,尤其是K12阶段,大模型一旦越界,必然会对公平性构成实质破坏。

可以预期的是,未来一段时间,高考期间,国产大模型厂商相关功能依旧会“策略性限制”。但从长远来看,“AI+教育”的变革不会停止。AI教师已经是各大主流教育科技公司正在探索的方向之一。

教育大模型或者通用大模型的教育相关应用,正确的方向是,以启发式学习的方式,构建知识图谱导航,成为教师教学和学生学习的辅助工具,而非一次次简单答案投喂,成为考试题目的解答机器。

(0)
小多多的头像小多多创始人

相关推荐

  • 22年来首例破产!百亿信托牌照也不香了

    22年来首例破产!百亿信托牌照也不香了,对新华信托而言,只要能增资6.6亿元,就能避免资不抵债的结局,但等了两年多,都没人接盘。

    创投 2023年5月31日
  • 前三季度扭亏为盈,永辉超市继续向好

    从永辉10月27日发布的第三季度财报来看,永辉正在逐步减亏,综合前三季度数据看,永辉已经实现扭亏为盈,向良性发展回归。具体来看,永辉第三季度财报有三点值得关注:首先,2023年前三季度永辉营收达620.88亿元,归属于母公司的净利润也从亏损转为盈利,达到了0.52亿元,同比增长了9.39亿元;毛利率

    2023年10月31日
  • 主动「受罪」的年轻人,爱上了这项运动

    五一假期刚开工不到一周,好不容易去掉的“班味儿”就又死灰复燃。班味——被年轻人封为新型工伤,因为“一旦上过班,你的气质就会变了”。做剪辑的人,晚上做梦都带着字幕;客服当久了,见谁都想叫亲亲;互联网从业者,饭糊了都想复盘;有人发现,京沪高铁上的“班味”浓度,甚至已经超越了办公室。而刺鼻的“班味儿”,得

    2024年5月9日
  • 主攻智能座舱解决方案,艾博连正把AI大模型搬上车_行业动态

    当智驾平权席卷汽车行业,智能座舱的竞争也开始从功能堆砌转向体验升维,越来越多的公司入局其中。在这个充满变局的赛道中,一家成立不久的中国公司——艾博连科技(上海)有限公司,正以AI大模型为核心武器,试图重新定义人、车、环境的关系。艾博连是由上海艾拉比智能科技有限公司孵化成立的全新品牌,聚焦AI大模型

    2025年3月12日
  • 市值一夜暴涨175亿元,小鹏汽车「支棱」起来了

    小鹏汽车再次突破,拿出了史上最强财报。5 月 21 日,小鹏汽车公布截至 2025 年*季度财报。财报显示,小鹏汽车一季度的营收为 158.1 亿元,较 2024 年同期上升 141%;交付 9.4 万辆新车,较上年同期交付 2.18 万辆车增长 330%;净亏损大幅收窄至 6.6 亿元,相较于 2

    2025年5月23日
  • 新品牌车主的「饭圈」大战

    新品牌车主的「饭圈」大战,至少,他们的确让中国人意识到了,中国的造车新势力,在某些方面是可以打败历史悠久的BBA的。

    创投 2023年8月3日
  • 霸王茶姬,用「饭圈文化」收割年轻人?

    *人设背后的隐忧。“大概还需要等40分钟。”星期六的下午,霸王茶姬的热闹在商圈中显得有些特立独行。作为一家已经开业两年的老店,郑州霸王茶姬的火热还是让许多同行不解?“眷茶、coco店员都已经出来揽客了,茉酸奶,柠季等新兴品牌人也不多。”看着排号器上701的数字。许多消费者只能默默退让。无独有偶,霸王

    创投 2023年9月29日
  • 北京落地200亿AIC股权投资基金

    投资界(ID:pedaily2012)9月30日消息,据北京日报报道,近日,两只新质生产力发展平行基金在北京经济技术开发区(北京亦庄、经开区)正式设立。该基金由北京亦庄国际投资发展有限公司(简称“亦庄国投”)联合工银金融资产投资有限公司(简称“工银投资”)、交银金融资产投资有限公司(简称“交银投资”

    2024年9月30日
  • 年轻人的抠门经济学

    现在的年轻人,好像有着自己的“抠门经济学”。一边大手大脚花钱,一边自认穷鬼。90后00后最新的时髦,已经不是种草各种潮牌奢牌,而是互相讨论如何“丧心病狂攒钱”和“消费降级”。01早上喝一杯9.9的瑞幸“穷鬼”咖啡,中午吃一顿麦当劳13.9的“穷鬼”套餐,晚餐回家自制“白人饭”,吃完去折扣零食店买上一

    2023年10月2日 创投
  • 高端门窗轩尼斯深受佛山国际商会认可!又有新荣誉…_行业动态

    前段时间,佛山国际商会第四次会员代表大会与“商通世界 贸促未来”年度峰会隆重召开,高端门窗轩尼斯凭借*的品质、良好的口碑和硬核的综合实力,成功当选佛山国际商会第四届理事会常务副会长单位,这份荣誉是社会各界对轩尼斯门窗在行业内的影响力和贡献的高度认可。佛山国际商会是当地*影响力的商业组织之一,致力于

    创投 2024年1月18日
  • 开学季丨白玉兰酒店带你体验最city的新学期打开方式_行业动态

    烫头、旅游、全飞秒还有新鲜热乎的新驾照经历了充实暑假的准大学生们终于迎来了属于自己的开学季北上广,江浙沪东三省,云贵川你的大学在哪儿虽然都已经十八岁但爱操心(爱玩)的老父亲老母亲还是决定,全程护送于是由爷爷奶奶,爸爸妈妈,弟弟妹妹组成的庞大送学亲友团也随即启程送学是必须的旅游也是所以,酒店的选择离学

    2024年8月30日
  • 珮立昂携旗下全线产品首度亮相第六届中国国际进口博览会_行业动态

    2023年11月5日,第六届中国国际进口博览会在上海国家会展中心正式开幕。作为本届进博会*一家独立参展的宠物食品品牌,被授予加拿大骄傲称号的全球高端宠物食品公司珮立昂(Petcurean)携旗下全线产品正式亮相进博会,开启了自己的首次进博之旅。进博会1.2馆 珮立昂展台珮立昂于1999年成立于加拿

    2023年11月9日 创投
  • 康美药业是做什么的 非常受舆论关注-财经

    最近一段时间以来,康美药业的事情引起了很多人的关注,那么,康美药业这家公司到底是做什么的呢?这篇文章就跟大家聊聊。 康美药业股份有限公司,简称为“康美药业”。1997年,由民营企业…

    创投 2022年1月25日
  • 餐饮探店又现新玩法,大明星集体涌入餐饮小店

    当前,越来越多明星正涌入短视频探店赛道,记录在全国各地街头巷尾小店的就餐视频,为当地美食打Call。明星光环加持下,不少粉丝、游客、甚至探店博主都前往明星同款餐饮店打卡,带火了一批餐饮小店。01 争当大众“饭搭子”,大明星集体涌入餐饮小店“没想到大明星也会去我家楼下小餐馆吃饭,感觉和他们成了饭搭子。

    2024年12月16日
  • 鹤岗,被低估的消费

    鹤岗,被低估的消费,鹤岗是中国低线城市进行零售变革的一个例子。也许鹤岗走到今天,是因为一些网红机遇,但对于无数个“鹤岗”来说,零售变革是当下的必然。机会出现的方式千千万,决定其是昙花一现还是静水流深,这考验的是城市,也是城市里的人。鹤岗经验,或许可以给其他城市一些参考。

    2023年3月28日