更新时间:2026-02-14 13:55 来源:牛马见闻
相比DeepSeek V3.相比DeepSeek V3.均显著超越DeepSeek V3.
<p id="4AMU52F2">马年春节前夕,国内各家AI平台企业,(正在]掀起新一轮「百模大战」。</p> <p id="4AMU52F3">据雷科技不完全统计,今年1月以来,国内推出的新版本AI大模型包括:</p> <p></p> <ul> 文心大模型5.0 千问Qwen3-Max-Thinking 星火X2 </ul> <ul> 智谱GLM-5 Kimi K2.5 MiniMax M2.5 Deepseek V3.2(版本更新) </ul> <ul> Seedance 2.0 可灵3.0 </ul> <p class="f_center"><br><br></p> <p id="4AMU52F5">而豆包大模型2.0、千问Qwen3.5等,据称也将在马年春节期间发布。</p> <p id="4AMU52F6">以上这些新版本大模型中,来自科大讯飞的星火X2,相对另类。<strong>相比其他平台的大模型,科大讯飞的大模型,更加侧重行业应用和B端用户市场。</strong>在国产大模型愈加发力消费应用和C端用户市场的当下,科大讯飞的这份「坚守」,显得颇为难得。</p> <p></p> <h5>国产算力完成奠基后,讯飞星火开始对标「国际顶尖模型」</h5> <p id="4AMU52F7">针对星火大模型,科大讯飞董事长刘庆峰有一句经典推介语,「中国AI开发者只要用星火,出海再也不用担心卡脖子」。</p> <p id="4AMU52F8"><strong>因为,科大讯飞旗下星火大模型,是目前中国主流大模型中「唯一」基于全国产算力(华为昇腾)训练的通用大模型。</strong></p> <p class="f_center"><br><br></p> <p id="4AMU52FA">雷科技截图</p> <p id="4AMU52FB">这些年来,限制中国AI产业整体发展的一大瓶颈是被「卡脖子」的高性能芯片,及其算力平台和生态体系建设。而以华为昇腾等为代表的国产算力平台,持续进步、不断攻坚,让All In国产算力体系的讯飞星火大模型,目前每过几个月,就可以有一场技术大进展。</p> <p id="4AMU52FC"><strong>从「在别人的地基上盖楼」,转向「用自己的地基,盖自己的高楼」后,星火大模型在算力自主、算法创新、模型框架、应用落地、生态系统等多个关键领域实现了「完全自主可控」。</strong></p> <p id="4AMU52FD">在深度推理模型领域,讯飞星火最近一年经历了X1、X1升级版、X1.5等大版本更新,并于近日带来了全新的X2大模型。</p> <p class="f_center"><br><br></p> <p id="4AMU52FF">图源:讯飞星火</p> <p id="4AMU52FG">以X2为标志,讯飞星火大模型开启对标「国际顶尖模型」的新征程。</p> <p id="4AMU52FH">星火X2,采用293B MoE稀疏架构,结合权重量化、低精度KVCache、VTP(Virtual Tensor Parallel)、分层通信等多种工程化创新,<strong>实现国产大EP并行部署,通过量化单台昇腾服务器即可运行,推理性能相比X1.5提升50%</strong>。</p> <p id="4AMU52FI">X2新模型能力的显著提升,有赖于以下四大领域的技术升级:</p> <p></p> <ul> <strong>训推采样校准强化学习算法</strong> <strong>递归式高难数据合成方法</strong> <strong>多阶段RL高吞吐采样方法</strong> <strong>服务高性能部署优化算法</strong> </ul> <p id="4AMU52FJ">科大讯飞表示,相比星火X1.5,X2大模型的通用能力得到全面升级,整体能力可对标国际顶尖模型水平,其中在数学、推理、语言理解、智能体等能力上媲美国际最优;130+多语言综合能力继续提升,在拉美、东盟等地区重点语种效果保持业界领先水平。</p> <p id="4AMU52FK">官方还特别举例道,2025年11月哈佛-麻省理工数学锦标赛(HMMT)中的一道英文题目,难倒国内主流模型,但星火X2在分析思考后,不仅给出了正确答案,还给出了详尽的解题过程。而即便是西班牙语的数学题,星火X2同样可以进行解答。</p> <p id="4AMU52FL">数据来说话,在通用大模型核心能力效果对比中,相比DeepSeek V3.2、Qwen3-Max,星火X2在语言理解、逻辑推理、数学、翻译、多语言等能力方向上处于领先地位。</p> <p class="f_center"><br><br></p> <p id="4AMU52FN">图源:讯飞星火</p> <p id="4AMU52FO">在外部公开高难任务效果对比中,相比DeepSeek V3.2、Qwen3-Max,星火X2在数学(AIME 2025、HMMT Feb 2025)、综合答题(MMLU Pro)、推理(ARC-AGI-1)、智能体(Tau2-bench)等能力方向的测试基上处于领先地位。</p> <p class="f_center"><br><br></p> <p id="4AMU52FQ">图源:讯飞星火</p> <p></p> <h5>行业大模型加快场景应用落地,「星火」正在燎原</h5> <p id="4AMU52FR"><strong>针对垂直行业的AI技术应用,科大讯飞推行「1+N」的大模型组合,即1个通用底座大模型+N个定制开发大模型,从而更细化、更专业、更高效地来服务不同行业领域的企业级客户群体及其实际需求。</strong></p> <p class="f_center"><br><br></p> <p id="4AMU52FT">图源:讯飞医疗</p> <p id="4AMU52FU">科大讯飞表示,依托星火X2的算法突破、行业高质量数据集以及专业思维链的强化学习,星火行业大模型持续升级,产品应用方案取得显著进步。</p> <p id="4AMU52FV">例如在医疗领域,基于居民健康档案的智能健康分析、智能报告解读、运动饮食建议、辅助诊疗、智能用药审核等关键任务上,基于X2底座的星火医疗大模型能力,均显著超越DeepSeek V3.2、GPT-5.2和Qwen3-Max。</p> <p class="f_center"><br><br></p> <p id="4AMU52G1">图源:讯飞星火</p> <p id="4AMU52G2">针对医疗领域,除了基于通用底座定制开发垂直大模型,科大讯飞旗下讯飞医疗,还在着力建设医疗高质量数据资源平台。<strong>医疗大模型,搭档数据资源平台,科大讯飞意欲加快AI+医疗领域各项服务应用的全面落地。</strong></p> <p id="4AMU52G3">而在直接面向C端用户的个人健康助手领域,「讯飞晓医」App,目前可提供多轮主动问诊、多轮咨询问答、问用药、检查检验单解读、体检报告单解读等健康咨询服务,同时支持语音交互对话。值得一提的是,星火医疗大模型围绕个人健康助手的各项能力,已率先通过上海市医疗大模型应用检测验证中心评测验证。</p> <p id="4AMU52G4">在教育领域,基于X2底座的星火教育大模型能力,在「步骤级批改」「错因定位」等技术上进一步扩大业界领先优势,同时行业首发「错因贯穿」的个性化学习能力。</p> <p class="f_center"><br><br></p> <p id="4AMU52G6">图源:讯飞星火</p> <p id="4AMU52G7">作为企业级智能体平台,星辰Agent平台进一步强化「会思考、能执行」的智能体构建能力。星火X2的智能体能力,在长时复杂任务规划、多工具组合调用以及长上下文等方面均实现了显著提升。</p> <p id="4AMU52G8">官方数据显示,星辰Agent平台当前智能体数量已超过130万。与此同时,星辰Agent已整合语音交互、语音识别、图像理解等百余种开放平台能力,支撑快速构建企业场景中更复杂、更实用的AI智能体,包括行业细分应用场景的智能体搭建上。</p> <p class="f_center"><br><br></p> <p id="4AMU52GA">图源:讯飞星火</p> <p id="4AMU52GB">例如,面向企业采购场景的「招采智能体」,在招标文件合规检测、供应商资质核验、投标异常行为检测等核心场景,效率提升超3倍。专用智能体开发从原来的几天压缩至分钟级,亦支持企业像搭积木一样极速定制专属招采专家。</p> <p id="4AMU52GC">面向行业深度分析的星火「行业大师」产品,针对能源、农粮等行业的专业商情分析领域进行深度融合,结合产业图谱推理和分析,显著降低幻觉。商情信息洞察及辅助决策时间,从「周」降低到「天」。</p> <p id="4AMU52GD">基于通用能力「对标国际顶尖模型」的X2新底座,星火行业大模型和企业级智能体平台的AI技术和业务服务能力,也得到了全面提升。</p> <p id="4AMU52GE"><strong>伴随国产大模型在更多行业市场、细分应用场景的持续渗透,以及B端用户生态体系的不断建设,中国行业大模型应用市场的「星火」正在燎原。</strong></p> <p></p> <h5>新模型对标「国际顶尖」后,讯飞硬件AI能力显著增强</h5> <p id="4AMU52GF">去年底以来,以字节豆包AI手机为代表的消费级AI硬件产品,引发业界高度关注。大模型与硬件产品的协同配合能力,及其生态体系建设,正在成为各家AI平台企业新的竞争焦点。</p> <p id="4AMU52GG">科大讯飞,一直以来就在推行软硬件高度协同的产品发展战略。近年来,伴随星火大模型能力的不断提升,讯飞旗下各类硬件产品的AI技术应用也在全面铺开。</p> <p id="4AMU52GH"><strong>面向汽车智能座舱、翻译机、办公本等不同品类设备的应用交互场景,基于星火X2模型能力升级,星火大模型多尺寸中小模型(2B、7B、30B-A3等)的核心效果,也得到显著提升。</strong></p> <p id="4AMU52GI">例如在汽车智能座舱上,星火新模型在人人/人机对话判断、模糊意图理解、高情商回复等方面,带来显著提升的交互体验。尤其是在模糊意图交互效果上,从「完全不可用」提升至「基本好用」水平,智能交互实车评测达到「业内全面领先」水平。</p> <p class="f_center"><br><br></p> <p id="4AMU52GK">图源:讯飞星火</p> <p id="4AMU52GL">在科大讯飞AI学习机上,星火大模型全面发力学生自主学习场景,在1对1精准学、答疑辅导和互动课等领域,效果持续提升。</p> <p id="4AMU52GM">依托X2教育大模型更精准的步骤级批改能力,以及更强大的个性化学习能力,讯飞AI学习机的诊断精准率、规划合理率和辅学启发性效果得到进一步提升,同时在个性化、启发式、规划性教学上带来更好的人机交互体验。</p> <p class="f_center"><br><br></p> <p id="4AMU52GO">图源:讯飞星火</p> <p id="4AMU52GP">去年以来,国产消费级AI硬件开始加快场景落地和市场普及进程。作为主攻品类和领域,科大讯飞已经在AI学习机(教育领域)、AI翻译机和办公硬件(商务办公领域)、AI智能座舱(汽车领域)等编织了一个软硬件协同配合、高度一体化的AI硬件产品应用体系。</p> <p id="4AMU52GQ">「AI应用厂商中最懂硬件,AI硬件厂商中最懂应用」,科大讯飞正在闯出一条属于自己的新路。</p> <p></p> <h5>新「百模大战」,AI平台开始比拼特色标签</h5> <p id="4AMU52GR"><strong>国内AI产业第一轮「百模大战」,比拼通用能力表现和综合成本效率。而目前正在开打的新一轮「百模大战」,各家AI平台则在开始形成不同的赛道领域和特色标签。</strong></p> <p id="4AMU52GS">以更容易达到的AI小龙们为例,DeepSeek V3.2模型新版本,继续把长上下文与复杂任务能力往前推;智谱新一代旗舰GLM-5模型,强调Agent与编程能力;MiniMax M2.5模型,延续多模态与应用导向路线。</p> <p id="4AMU52GT">而在科技巨头企业中,与阿里、字节、腾讯、百度等2C互联网领域发家的巨头企业不同,科大讯飞一直走的都是一条「不那么热闹」的赛道,好比在AI技术平台搭建和应用上:</p> <p id="4AMU52GU"><strong>讯飞星火,不仅是目前中国主流大模型市场中「唯一」基于全国产算力训练的通用大模型玩家,也是目前市场中不多见的更加侧重行业市场和B端客户群体的垂直大模型玩家,还是软硬件高度协同配合、产品应用一体化的AI硬件早鸟玩家。</strong></p> <p id="4AMU52GV">虽然拥有不同的标签,但每一个都极具特色,汇聚在一起,足以撑起科大讯飞的AI平台生态体系。</p> <p id="4AMU52H0">按照官方说法,科大讯飞这一AI生态系统,以星火大模型为底座(根基),搭档讯飞研究院核心技术、能力星云合作伙伴等,支撑起覆盖能力层、应用层和行业层的完整AI技术应用体系。</p> <p class="f_center"><br><br></p> <p id="4AMU52H2">图源:讯飞星火</p> <p id="4AMU52H3"><strong>相比于互联网领域发家的巨头平台AI大模型,讯飞星火的劣势在消费级市场的用户规模体量和产品综合竞争力,优势在已经打出的诸多特色标签和铺就的行业应用生态体系。</strong></p> <p id="4AMU52H4">下一步,伴随国产算力平台性能的进一步提升,「完全自主可控」的讯飞星火大模型,将拥有更大的施展天地。下一步,伴随AI技术应用在各行各业的生根发芽和枝繁叶茂,主攻垂直大模型的讯飞星火,将拥有更广的施展舞台。下一步,伴随AI硬件的全面落地和逐渐普及,软硬件高度协同配合的科大讯飞,将迎来更好的时代机遇。</p> <p id="4AMU52H5">梦想正在照进现实,唯有不断踏实前行。</p>
Copyright ® 版权 所有:吉林日报
违法和不良信息举报邮箱:dajilinwang@163.com 违法和不良信息举报: 0431-88600010
ICP备案号:吉ICP备18006035号 网络经营许可证号:吉B-2-4-20100020
地址:长春市高新技术产业开发区火炬路1518号 爆料电话:0431-88601901