智谱宣布推理模子初代版本
12月31日,海内明星年夜模子创业公司北京智谱华章科技无限公司推出基于扩大强化进修技巧练习的推理模子GLM-Zero-Preview,善于处置数理逻辑、代码跟须要深度推理的庞杂成绩。GLM-Zero-Preview是GLM-Zero的初代版本。智谱表现,现在的GLM-Zero-Preview与OpenAI的o3模子仍有不少差距,因而将来将连续优化迭代强化进修技巧,推出正式版GLM-Zero,将深度思考才能从数理逻辑扩大到更多更通用的技巧。与现有模子差别,GLM-Zero-Preview可能开端实现推理进程中自立决议、成绩拆解跟实验多种方法处理成绩。团队发明,跟着强化进修练习量的增添,模子在深度推理等方面的后果稳步晋升。团队也深刻探索了模子在推理阶段的scaling law(标准定律),跟着模子能够思考的token数变多以及更多的盘算量,模子给出的成果品质稳步晋升,表现了“自我反思跟优化、庞杂成绩剖析、实验用差别方式处理成绩”等才能,这与人类的思考决议进程相似。在逻辑推理方面,GLM-Zero-Preview擅长辨认逻辑破绽,可能模仿多种假设跟可能性。比方在7、9、11、13中怎样用3个数字相加失掉30,GLM-Zero-Preview可能辨认图中数字,经由过程反思发明谜底的要害在于9能够颠倒为6(6+11+13=30)。在数学方面,GLM-Zero-Preview存在更强的演绎与归纳才能,可能疾速处置庞杂的数学运算,解答包含代数、微积分、概率统计等范畴的成绩。以2025年考研数学一为例,GLM-Zero-Preview得分为126(总分150),到达优良研讨生程度。GLM-Zero-Preview可能供给具体的解题进程,辅助用户懂得成绩的中心思绪。GLM-Zero-Preview可能纯熟应用多种编程言语,辅助开辟者疾速编写代码。在代码调试方面可能疾速辨认过错,给出具体修复倡议。比方只要要输入指令“帮我用html写一个风趣的第一人称射击游戏”,GLM-Zero-Preview便能敏捷自力实现游戏。
申明:新浪网独家稿件,未经受权制止转载。 -->