腾讯混元 视觉中国 资料图
在“开源”“闭源”争议在大模型圈沸沸扬扬之际,腾讯官宣加入“开源”阵营。
11月5日,腾讯混元宣布最新的MoE模型“混元Large”以及混元3D生成大模型“ Hunyuan3D-1.0”正式开源,支持企业及开发者精调、部署等不同场景的使用需求,可在HuggingFace、Github等技术社区直接下载,免费可商用。
“开源更符合腾讯的长期主义。”当天,腾讯机器学习平台总监、腾讯混元大语言模型算法负责人康战辉在接受澎湃新闻记者采访时坦言,“开源能支持更庞大的场景落地,更适合客户实际应用,如果是单一场景会有其他选择。目前,我们做了大量探索,无论是万亿级、千亿级、百亿和十几亿级别的场景都可以实现。”
所谓的开闭源,对应两种软件开发模式:开源指开放源代码,将源代码公开发布并允许任何人查看、修改和使用;闭源则不公开源代码,只对外发布编译后的软件。
目前国内大模型厂商已经清晰分为两大流派:阿里、腾讯等更倾向于开源,百度、百川智能、月之暗面等则倾向于闭源。自从国产大模型崛起以来,对于开源和闭源的争议似乎还未有明确定论。
开源和闭源争议何在?
“今年大模型发展如火如荼,商业模式也是百花齐放。开源更多符合长期主义的选择,大模型相当于AI时代的操作系统,是底层基础设施,不是简单的产品,不存在入口、流量,需要沉下心来长期深耕。”康战辉表示。
开源PK闭源,谁能胜出?此前多位AI大佬曾就这个问题打起口水仗,例如百度CEO李彦宏曾经多次公开力挺闭源。
在今年的世界人工智能大会上,他表示,开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景,“当你处在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低,这时,商业化的闭源模型是最能打的。”
但360创始人周鸿祎、百川智能CEO王小川等人却支持开源。周鸿祎提及开源大模型时称,他一直相信开源的力量,至于网上有些名人胡说八道,大家也别被他们忽悠,说开源不如闭源好,“一句话,今天没有开源就没有Linux,没有Linux就没有互联网,就连说这话的公司自己都借助了开源的力量才成长到今天。”
阿里云CTO周靖人也公开表示,开源社区已经蓬勃发展起来了。阿里云的初衷不是把模型攥在自己手上去商业化,而是帮助开发者,开源生态对促进中国大模型的技术进步与应用落地,以及生态的蓬勃发展至关重要。
“开源与闭源表面上呈现为两种不同的技术路径,然而从本质上看,二者是商业模式层面的争议点。”人工智能专家、天使投资人郭涛向澎湃新闻记者介绍。
诸如阿里巴巴、腾讯等大型企业,其核心业务聚焦于云服务供应,该业务处于大模型产业链的上游环节。此类大厂选择模型开源的战略意图在于,凭借免费的下游产品吸引开发者,继而促进数据的消耗量,以此推动上游云产品使用量的增长。
反观选择闭源的企业,其中大部分为专注于大模型的创业公司。这些公司以人工智能为核心业务领域,期望通过大模型实现盈利,故而更为关注闭源模型的价值。当前,闭源大模型主要是依据应用程序编程接口(API)的调用频次(即使用量)来实施计费。相较于开源模式,闭源商业模式在获取收益方面看似更具优势,不过,其在短期内能否达成盈利目标仍需进一步观察。
“AGI是不归路”
目前,对AGI(通用人工智能)的追求已成为AI行业的共识,AGI最早的定义是未来会具备人类一样的自我意识,那将是对人类产生终级挑战的物种。
业内普遍认为,通往AGI的道路是Scailing Law(缩放定律),即数据越多,模型越好。康战辉告诉记者,目前Scailing Law仍然成立,但是确实有放缓的趋势,算力资源的限制也在制约大模型的训练规模不断扩大,业界都在思考怎么降低训练大模型的成本,“AGI是一条不归路。”
在他看来,中国做大模型有很多自身优势,首先在场景上非常丰富,其次,国产大模型在精细化打磨上更有能力,从长期来讲对于国内AI研发能力非常有信心。
公开资料显示,腾讯此次宣布来源的混元Large是目前开源领域参数规模最大、效果最好的MoE模型,而腾讯混元3D生成大模型则是业界首个同时支持文字、图像生成3D的开源大模型。两个模型均属腾讯自研,目前,两个模型均已经在腾讯业务场景中落地应用。
值得注意的是,此前智谱AI发布智能体功能,曾经引发AI概念股震动,对于智能体的概念,康战辉表示,智能体一定是未来趋势,将会使大模型从知识内化向外化转变,但是目前智能体的相关研究依然比较复杂,产品也相对初步,未来仍然有很大的探索空间。
还没有评论,来说两句吧...