在人工智能军备竞赛进入白热化的2025年,腾讯突然亮出酝酿已久的王牌。据最新披露的战略规划显示,这家科技巨头即将推出名为”混元-O”的全模态大模型,这项技术突破或将重新定义人机交互的未来形态。
技术团队向钛媒体透露,混元-O将突破现有AI模型的局限,构建以语言模型为核心的智能系统。不同于传统单模态产品,这个新型大模型能同时处理文本、语音、图像等多维度信息,还能自主进行复杂推理与决策。特别值得注意的是,该模型将与机器人技术深度融合,目标打造能够理解物理世界的智能系统。
支撑这项突破性技术的,是腾讯史无前例的研发投入。数据显示,2024年该公司在AI领域的资本性支出就达390亿元,全年研发投入累计超过3400亿元。按照总裁刘炽平的规划,2025年相关支出可能突破千亿大关,占到总收入的”低两位数百分比”。
市场观察人士注意到,腾讯的AI布局呈现出明显的”双轨并行”特征。在自主创新的同时,其产品矩阵中兼容了DeepSeek等开源模型。这种策略既保证了技术迭代速度,又维持了核心技术的可控性。即将在元宝App上线的Hunyuan-Voice通话模型,就被视为对抗字节跳动”豆包”视频功能的直接回应。
行业竞争正在演变为资源消耗战。阿里近期宣布未来三年将投入3800亿元建设AI基础设施,这个数字甚至超过其过去十年相关投入的总和。这种巨头间的军备竞赛,正在重塑中国科技产业的生态格局。
值得关注的是,混元-O的研发团队由腾讯首席科学家张正友领衔。这位计算机视觉专家此前主导的机器人实验室成果,或将通过新型大模型实现商业转化。技术路线图显示,项目组正在探索模型的自我进化能力,试图突破现有AI系统的认知边界。
面对外界对技术落地的质疑,腾讯内部人士透露,混元系列模型已渗透到700多个实际场景。从智能客服到工业制造,相关技术正在创造真实商业价值。这种应用层面的积累,可能成为全模态模型成功落地的关键支撑。
在通用人工智能(AGI)的探索道路上,中国企业正展现出前所未有的进取姿态。随着混元-O的即将面世,这场关乎未来的技术竞赛,正在进入更具想象空间的崭新阶段。