
出品 | 网易智能陇南异型材设备厂家
作家 | 小爪
剪辑 | 凤枝
GLM-5.2发布后,外网建设者的响应不是问价钱。
低廉、能用、省钱,这些词贴在许多国产模子身上太深切。但此次筹商的口吻变了点点:它未必确实颖慧活了。
有东谈主拿它和GLM-5.1作念同份1700行Python代码审查,成果不是准确率碾压,是同等准确率下,时辰从124.8秒降到47.7秒,输出从3436个token收窄到1415个。也有东谈主把它和Kimi K2.7放在同个领导词下写Minecraft游戏页面,GLM-5.2慢了几分钟,却少了轮修问题的领导。
外网用户不是在夸它写得多。他们在说,它少鬼话、少返工,能把事情往前。
也难怪Claude这个名字直在筹商里反复出现。建设者太熟谙Claude那种嗅觉了:不细则时会问,看到风险会提醒,代码审查时能收拢问题。GLM-5.2让部分用户次在国产模子上看到相似的影子。
但另些用户迅速踩到了反面:慢、拥挤、额度破费快,甚而会用我方的默许设定秘密用户指示。
它驱动像Claude陇南异型材设备厂家,也有时候像个不太听话的版块。
先看此次发布了什么
6月13日,智谱把GLM-5.2先放进了GLM Coding Plan,莫得先开API,也莫得先放权重。
这个法例自己即是信号。它默许建设者会先在编码用具里用,而不是先在聊天框里试。
几个细节能看出智谱的定位。Claude Code的成立示例里,glm-5.2被径直放进了Sonnet和Opus的位置;套餐里它被列为阶档,对标Opus,额度也按这个档算。换句话说,智谱没把它当\"低廉替代\",而是当Claude的同位竞品在。
参数里显眼的是100万凹凸文。在代码任务里,它对应的其实是件具体的事:模子能不成吃下个稍大的面孔,能不成跟住条长的修改链,能不成在二十轮对话里还难忘三轮定下的敛迹。
加上订阅、编码用具接入、开源时辰表次给皆,此次发布不像在发个模子,像在发个居品。
建设者拿它作念了什么
此次反馈里,跑分不焦虑。要看的是建设者拿它作念了什么。
有东谈主测严格JSON输出、编程、理、长凹凸文检索陇南异型材设备厂家,也有东谈主把它放进OpenCode和Coding Plan里跑档。前边那组Python代码审查数据仅仅单个建设者样本,不是肃肃基准测试,但向很澄澈:代码审查不需要模子把每件事讲解得很满,需要它短、快、持。
另个被反复提到的细节,是模子在职务不澄澈时会先反问,而不是径直入手。这点让东谈主念念到Claude。长凹凸文不有数。Gemini、Codex、Kimi都能作念长任务。有数的是在长任务里知谈什么时候该问句,什么时候该不息。
还有条像的确的代码审查。灵验户让GLM-5.2去审Fable 5之前作念的个大,再把GLM挑出的问题交给GPT-5.5复核,15个问题里,12个GPT-5.5认为站得住。
这条互动量不,时辰点也得防御:测试作念的时候Fable 5还能用,当今Fable 5对异邦建设者还是停了,这条旅途自己复现不了。但它至少证据,GLM-5.2还是颖慧\"找问题\"这种活,不仅仅写个能跑的demo。
和Kimi K2.7的对比也证据同件事。那组Minecraft页面测试不是严格评测,不成出\"GLM-5.2赢Kimi\"。但它把个建设者的确关注的问题摆出来了:快几分钟不定焦虑,少修轮问题焦虑。
三个不同的问题
对用户来说,慢和贵常常是同种感受:等得久,额度还掉得快。但问题自己不在同层。
层是劳动体验。 有东谈主说,用OpenCode加GLM-5.2档时,试验感受梗概接近Claude Opus 4.6,但可能因为流量拥挤,速率非常慢。还灵验户径直说它\"慢得离谱\"。这类问题像基础体式和流量问题,隔热条设备扩容之后会缓解。
二层是额度绸缪。 前边那位给出正面评价的建设者也提到,几个复杂任务就破费了50的5小时额度和10周额度。模子越能作念复杂任务,越容易把用户带进破费场景。若是用户的感受是\"强但不敢多用\",套餐绸缪就会酿成问题。
三层蒙眬陇南异型材设备厂家,是模子看成。
灵验户说,GLM-5.2在Coding Plan里仍然很慢,不如预期,况且会耻辱指示。他举的场景是成立 *.anyrouter.dev,认为我方还是讲解澄澈,但模子仍然莫得解决好。还灵验户说,GLM-5.1是\"你让它作念什么它就作念什么\",但GLM-5.2会用我方的默许设定秘密用户指示,需要反复把它拉回正轨。
这就窘态了。
Claude的主动之是以受海涵,是因为它多量时候主动得对。该问时问,该提醒时提醒。但若是个模子的主动酿成秘密用户指示、替用户改默许设定,那就不再是\"像Claude\",而是像个不太听话的Claude。
这不太像个单纯靠领导词就能补皆的问题。它像工程场景里的指示对皆:什么时候该追问,什么时候该照作念;什么时候该提醒风险,什么时候不该替用户改成见。Claude花了很永劫辰才让建设者信任这种判断,GLM-5.2当今刚驱动摄取这类考验。
华文社区的响应
华文社区的反馈径直。
小红书和B站这两天冒出来堆标题:\"实测GLM-5.2和Opus 4.8:差距比我念念像的小\"、\"GLM-5.2实测:比跑分阐扬得像前沿模子\"、\"智谱GLM-5.2强到不错冒充Claude Opus?\"、\"在Claude Code中成立GLM-5.2满版的法\"。
标题归标题,正文有莫得这样神是另回事。但这些标题证据件事:华文用户的响应是问它能不成冒充Opus、能不成接进Claude Code、能不成在我方的面孔里顶上来。
B站也有泼凉水的。有标题径直写\"速率快、幻觉低、不扯淡陇南异型材设备厂家,但编程身手不敌顶模\",还有东谈主提醒\"先别全量切\",说要先看100万凹凸文若何样、额度扛不扛得住、Claude Code切昔时顺不顺。
边在喊差距比念念象小,边在问能不成真当主力用。 这和外网的反馈其实是回事:无礼弘扬测了,但还没到不错闭眼换的进度。
开源之后才是二轮
发布时,智谱称GLM-5.2已面向GLM Coding Plan用户通达,API和聊天机器东谈主劳动随后上线,模子也将以MIT契约开源。
这个时辰点也让GLM-5.2赢得疏淡关注。Fable 5和Mythos 5因好意思国出口不停指示俄顷对异邦国民暂停打听,让建设者社区重新意志到,前沿闭源模子的可用并不由建设者我方掌控。 GLM-5.2的MIT权重情愿,不仅仅\"开源社区会不会兴\"的问题,也联系到建设者是否敬佩这是条能恒久依赖的替代门路。
Reddit r/LocalLLaMA的筹商里,社区魄力不是粗浅的\"催\",像种有条目的耐性:不错明白公司先把模子放进Coding Plan,通过订阅回收部分老本,但前提是权重确实按期杀青。若是展期,明白就会酿成质疑。
若是权重这周按期放出,GLM-5.2的筹商会从劳动体验参加硬的阶段:量化、部署、理老本、长凹凸文显存、vLLM/SGLang适配、真实SWE-bench和智能体基准测试。
到其时候,相似\"47.7秒、1415个token\"这样的单点测试,才会被多东谈主复现或翻。 GLM-5.2的二轮评价,也会比这两天罪状。
真门槛不是速率,是该不该听话
GLM-5.2莫得干掉Claude。
但它次让部分国外建设者弘扬辩论,是不是不错把国产模子放进真实责任流。
昔时国产模子在国外的好感度停在榜单、价钱和开源标签上。
GLM-5.2此次还是让些东谈主无礼入尝试。速率、额度、开源都还能靠工程工夫补,扩容、改套餐、按期放权重。
难的是那条线:什么时候该主动,什么时候该听话。
这会决定GLM-5.2是次令东谈主惊喜的尝鲜,照旧个建设者无礼恒久依赖的主力用具。
本周开源之后,二轮测试才的确驱动。
文安县建仓机械厂相关词条:铝皮保温施工 隔热条设备 钢绞线 玻璃棉卷毡 保温护角专用胶
1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定陇南异型材设备厂家,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。
