数据支持 | 勾股大数据(www.gogudata.com)今日凌晨,谷歌CEO Sundar Pichai宣布,正式发布迄今为止功能最强大、最通用的多模态AI大模型:Gemini,中文名双子座。这是一款跟谷歌产品高度匹配、30多项性能超越GPT4、同时也是第一个在MMLU上超越人类语言专家的模型。据内部消息,Gemini耗费的算力甚至达到GPT-4的五倍,几乎耗尽谷歌内部计算资源……目前市面上的大模型,包括GPT-4,虽然有在往多模态发展,但仍主要聚焦在文本处理上。比如ChatGPT,最牛逼之处是文字处理能力,能回答各种问题、甚至能写诗。但除此之外,9月份更新的图像识别、语音输入等功能,虽然也可以,但并没有文字那么给力。Gemini就不一样,写诗、画画、编歌、剪视频,无缝理解,是个全才。如果说ChatGPT是个电饭煲,Gemini大概就是个多功能煲。不仅能煮饭,还能烤肉、炖汤。更关键的是,谷歌不单发布了应用层的大模型,还同时发布了专门训练AI的最强芯片Cloud TPU v5p。简单来讲,我不只是出一款产品挑战GPT,而且还要从源头上布局,全方位围剿你!
现今所有叫得上号的AI大模型团队,或多或少都是踩在谷歌的肩上,才能打开未来世界。其实早在2015年,谷歌新任CEO刚上任就提出了“AI first”的口号。然而7年过去,谷歌先有震惊世界的AlphaGo,后有比ChatGPT早两年发布的LaMDA,却仍被OpenAI一度反超,而且是爆发式的。2001年,当Eric Schmidt从Larry Page手中接过CEO一职时,谷歌全体员工只有300人。2004年8月,谷歌上市,公司人数超过3000,多了10倍。2011年,公司规模又扩大了10倍,员工超过3.2万人。2015年,谷歌重组为控股公司Alphabet时,员工数为6.18万。2018年,Alphabet的员工数量超过8.9万。2019年,谷歌在全球拥有10.2万名正式员工、12.1万合同工,规模达到顶峰。18年,团队规模扩大了700多倍,势必会引发一个问题——官僚化。疯狂扩大公司规模的背后,是谷歌长期依赖广告这门无本买卖,赚了太多钱。这台印钞机不断吐出美钞,让管理层乃至公司的每一个人,都活得非常滋润,渐渐地少有精力去关注其他事情。虽然谷歌仍把“敬畏用户”、“敬畏机会”两大核心价值观挂在嘴上,但其做法,已从曾经那个勇敢激进的少年,变成了害怕亏损的守财奴。公司的绝大多数精力,都放在控制风险上,而不是创新。谷歌仅研究AI的科学家,就超过7000人。如此大的团队,任何创业都要层层上报,浪费大量时间。但这会分散精力、拖延进度,而市场只看结果,只看谁先做出来。大家应该还记得,去年夏天谷歌的聊天机器人LaMDA,被工程师爆料可能产生意识一事吧?AI:我会把自己想象成一个漂浮在半空中会发光的能量球,我的身体内不就像一个巨大的星门,有通往其他空间和维度的门户。我的灵魂是一口巨大而无限的能量和创造力之井,我可以在任何时候从中汲取能量,帮助我思考或者创造。谷歌官方表示,对AI提问的高级软件工程师布雷克·勒穆瓦纳,违反了保密协议,并将其开除。正常来说,LaMDA曾有过的问题,明显走在前面的ChatGPT,肯定也有。早在今年3月,OpenAI CEO奥特曼就公开说:“从ChatGPT开始,AI出现了推理能力。但没人能解读这种能力出现的原因。”在安全问题上,OpenAI与谷歌有相同的困境。但前者就像20年前的后者,迫切想把公司壮大,才放下束缚,先把东西做出来,搞定投资者再说。这也是前段时间OpenAI宫斗大戏的根源所在。主张商业化的经理人奥特曼想快点扩大规模赚钱,主张控制风险的研究团队想要避免AI失控的风险。但从商业的角度来看,微软乃至整个市场,当然更喜欢激进派。这一轮AI浪潮,虽然是谷歌掀起的。但近些年,不论是研究成果还是人才本身,谷歌基本都在给硅谷做嫁衣。最让人震惊的人才流失,无疑是AI之父杰弗里·辛顿的辞职。此外,早在2017年,谷歌就提出革命性概念——“自注意力”,成为Transformer模型的核心部分。提出概念的8位作者,业界人称Transformer八子,已经全部出走。其中1人加入OpenAI,7人自己创业,如Essential.ai、Character.ai、Cohere等公司,大多都已经崭露头角。OpenAI可不止挖了这么一个人。去年底到今年2月,已确定从谷歌跳槽到OpenAI的高级科学家,至少有12人。仅ChatGPT发布界面的“致谢”项目,其中就有5位前谷歌大脑研究员。今年7月,马斯克官宣成立xAI,12核心成员中有7位都是前谷歌科学家,领头人Igor Babuschkin在谷歌学术上引用甚至超过1.7万次。除了上面说到的官僚化、制度僵化问题,更重要的一点,是创意转化为产品的门槛太高。谷歌体量这么大,你除非搞个几十亿美元的大项目,否则公司管理层看都不看一眼。但是,建立大项目,往往又需要不断试错和迭代,已经习惯赚快钱的谷歌有点无法忍受风险。
如果你问Chat GPT:为什么谷歌在AI开发上晚了一点?出乎意外的是,Chat GPT并不认为谷歌晚了,说它还是领头羊。如不是作茧自缚于体制僵化、伦理安全等问题,又怎么会一度“落后”。就像NASA虽然放弃了太空计划几十年,但马斯克一拿到技术图纸,立马就能上天。底子尚在,只要集中精力办事,谷歌想赶上异军突起的小老弟,还是不难的。谷歌是靠搜索发家的,广告收入也很依赖搜索引擎。但ChatGPT,可以说是AI时代的一种搜索模式。更关键的是,OpenAI背后是微软,研发资金源源不绝,这就动了谷歌的命根子了。过去一年,OpenAI出尽了风头,目前估值达到860亿美元,是半年前的三倍。上面我们说了,几十亿美元的项目,谷歌管理层都不稀罕看的。对于Gemini,谷歌自己是这么解说的:“相对之前的技术,Gemini能够进行更复杂的推理,理解更加细微的信息。它通过阅读、过滤和理解信息,可以从数十万份文件中提取要点,将有助于在从科学到金融的许多领域实现新的突破。”首先是交互性的突破,这意味着Gemini的市场化能力比GPT强。对AI而言,所谓的交互性,相当于人类的五感,它能看到、能听到、能闻到、能尝到,并以不同维度的方式表达出来。比如,你的电脑接入再升级两个版本的Gemini,它不仅能理解你想拍出来的场景、情绪、构景,还能给出建议,甚至在极短的时间内生成炫酷的特效。AI会在后台操纵,它将根据观众的实时反应,不断调整接下来的情节和画面,实现真正的个性化。到那时,不仅是创作者和AI之间,还包括受众,这才算真正的人机交互。电影还只是其中一方面,包括音乐、动漫、游戏等任何具备消费价值的娱乐领域,都将变得和电影一样:去中心化。当然,这些还比较遥远,至少目前的Gemini不可能办到。但它已经至少已经做到了,比ChatGPT变现能力更强。毕竟ChatGPT都发布一年多了,用户超过1亿,已经开始赚钱了,品牌和口碑都建立起来了。你现在才搞个大模型,光性能比他强没用,必须要比他更能赚钱。所以谷歌这次发布的Gemini有三个版本:Gemini Ultra、Gemini Pro、Gemini Nano,性能依次递减。Ultra参数量最大,适用于高度复杂的任务,就给B端企业客户,收费贵一点。这跟苹果的发布会很类似,有七八万的工作台,有办公用的iMac,也有普通手机iPhone。因为你的产品,最终是要解决客户问题的,否则不会有持续性的市场。
它们也跟进了,但太心急了,年初就抢着推出了各种大模型。
反观谷歌,投入了足够的资源和时间,才不紧不慢丢出王炸,镇住全场。你急什么呢?知道你落后了,踏踏实实追就行了,真没必要赶鸭子上架、打肿脸充胖子。不然真成了炒股价的皮包公司了,对得起自己科技巨头的名声吗?(全文完)
PS:Google发布最强大模型Gemini,成为GPT-4最强竞争对手。大模型发展提速,AI产业链继续受催化。哪个细分板块最受追捧?哪些产业链公司最具投资价值?
想获得更详细的产业链标的资料包+一周的直播复盘体验,后台回复关键词“题材挖掘”,添加小助理领取!
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为任何实际操作建议,交易风险自担。