来源:世界互联网大会
8月31日,中国首批大模型产品通过《生成式人工智能服务管理暂行办法》备案,可正式上线面向公众提供服务。首批上线的8家大模型包括百度文心一言、字节的云雀大模型、百川智能的百川大模型、清华系AI公司智谱华章旗下的智谱清言等。
今年以来热度极高的大模型,一直是全球大厂竞逐的赛道,各大科技公司均推出了自家的大模型,呈现出“百模大战”的盛况。
大模型驱动数字经济发展
8月31日起,用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”体验。百度还将开放一批经过全新重构的AI原生应用,让用户体验生成式AI的理解、生成、逻辑、记忆四大核心能力。
图源:文心一言官网
百度创始人、董事长兼首席执行官李彦宏曾表示,大模型将渗透到越来越多的领域,以大模型为关键驱动的数字经济,与实体经济深度融合,将做强做优做大实体经济,创造可观的增量价值,带来经济社会发展和产业的深刻变革。
据了解,近十年,百度累计研发投入超1400亿元,成为有着应用、模型、框架、芯片四层全栈布局的AI公司,实现端到端优化,并在各个层面都有领先业界的关键自研技术。
图源:《中国人工智能大模型地图研究报告》
同样在31日凌晨,百川智能也宣布其大模型通过《生成式人工智能服务管理暂行办法》备案,向公众开放,用户可以登录官网体验。
百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立,核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。成立仅四个月,百川智能便相继发布了三款通用大语言模型,其中包括国内首款开源可免费商用 70 亿参数量大语言模型Baichuan-7B、参数量530亿的大语言模型Baichuan-53B等。
图源:百川智能官网
科大讯飞于今年5月6日正式发布“讯飞星火认知大模型”。科大讯飞表示,到今年10月24日,讯飞星火将实现通用模型对标ChatGPT。在8月17日《麻省理工科技评论》中国发布的大模型评测报告中,讯飞星火V2.0以总分81.5分的成绩位居榜首,被称为中国“最聪明”的大模型。
全球大模型多点开花
人工智能正在从云端走向终端。从全球范围来看,谷歌、微软和苹果等厂商也在发力终端大模型,轻量化已成为大模型在终端部署的重要发展方向。
图源:DragonImages
今年5月,谷歌发布了适用边缘的大模型PaLM2。具体来看,PaLM2大模型一共有四种规格,分别是Gecko(壁虎)、Otter(水獭)、Bison(野牛)和Unicorn(独角兽)。其中,Gecko非常轻量,可在移动设备上工作。一个更轻量但具有更高质量的模型能够显著提高推理效率并降低服务成本,使模型的下游应用程序适配更多应用程序和用户,使AI边缘部署成为可能。
7月,苹果正式宣布启动开发AppleGPT,加入终端AI大模型战局。据了解,AppleGPT是苹果公司基于其自研的Ajax框架开发的AI工具,目前已在苹果公司内部展开小范围内测。
图源:Pixabay
同时,微软开源了DeepSpeedChat训练模型、Meta开源LLaMA,在AI开发者中快速兴起基于LLaMA的训练风潮,加速Lora等训练方法的渗透。据了解,Deepspeed与Lora模型给中小开发者提供了低成本、快速训练专属于自己的“小模型”的完整工具,加速建立大模型梯度分布的格局。
芯片厂商方面,高通在MWC 2023大会发布全球首个运行在Android 手机上的Stable Diffusion终端侧演示。据介绍,Stable Diffusion模型参数超过10亿,高通利用其AI软件栈对模型进行量化、编译和硬件加速优化,使其成功在搭载第二代骁龙8移动平台的手机上运行。
图源:Pixabay
大模型“应用”与“监管”并进
今年3月,硅谷创业公司OPEN AI推出的新型AI聊天机器人工具ChatGPT 3.5展现出了令世人惊艳的对话能力。仅用两个月时间,ChatGPT月活跃用户就达一亿,成为史上用户增速最快的消费应用。
面对生成式 AI 带来的机遇和挑战,各国对如何监管 AI 有不同的意见。中国、美国、欧盟等国家或地区迅速做出反应,而新加坡、印度则宣称,暂时不打算监管 AI。
8月15日,中国的《生成式人工智能服务管理暂行办法》正式施行,这被认为是全球首部生成式 AI 立法。
图源:Pixabay
在落实规范细则同时,《办法》进一步鼓励生成式人工智能技术在各行业、各领域的创新应用,支持各类组织在生成式人工智能技术创新、数据资源建设、转化应用、风险防范等方面开展协作,推动生成式人工智能基础设施和公共训练数据资源平台建设。
业界人士表示,随着《办法》的施行, AI 大模型有望从拼参数逐步进入到拼原生应用、拼产业落地的阶段。