行业新闻
凌乱、决裂、兼并:2024年AI的信奉之战
作者: [db:作者] 点击次数: 发布时间: 2025-01-15 09:08
文 | 硅谷1012024年,硅谷的天生式AI年夜战涓滴不比2023年减色,只是这一年的AI战斗更残暴更直接:巨子们岂但拼模子才能,还拼爆款产物,同时持续投入数百亿美元拼算力建数据核心;而多少家一年前仍是明星名目的始创企业却由于资金烧光,直接被巨子兼并。在学术界,技巧首领们对AI的将来仍然争辩不休、骂战一直:GPT5仍然不踪迹,Scaling law乃至被以为曾经遇阻“撞墙”。但是2024岁尾,谷歌Gemini 2.0的宣布,以及OpenAI连续12天宣布更新,却让各人对2025年AI的停顿又有了一些新的等待...这期内容咱们将回想下天生式AI在硅谷的2024年有哪些drama,又有哪些切实的技巧停顿跟道路摸索,以及2025年的AI会怎样开展。咱们将联合与技巧年夜佬的采访谈天,从巨子的AI规划道路、产物落地、陨落的明星公司跟徐徐升起的新星们,以及业内对2025年AI瞻望这多少条主线来开展,看看从前一年都产生了些什么。01 OpenAI的宫斗与新技巧道路 Chapter 1.1 OpenAI宫斗闭幕OpenAI在2024年的drama并不少:2023岁尾的董事会风云之后,2024年OpenAI的高层仍然非常不稳固,人才活动性很年夜。结合开创人、首席迷信家Ilya Sutskever在蒲月离任。之后他发布开办本人的始创公司Safe Superintelligence,疾速融资了10亿美元。跟Ilya一同离任的另有超等对齐团队的要害技巧人物Jan Leike。之后在玄月,CTO Mira Murati也发布离任,有新闻称她正在为她新的始创公司融资。OpenAI别的的高层变化另有结合开创人兼ChatGPT开辟的中心引导者John Schulman——他于8月参加了敌手公司Anthropic。同时,结合开创人、前总裁Greg Brockman在休了三个月的长假之后回到了OpenAI。至此,OpenAI现在11位结合开创人到现在曾经只剩下了Sam Altman,Greg Brockman及Wojciech Zaremba三位。OpenAI用了一年的时光来处置高层之间的人际抵触,现在终于临时稳固下场面。坏新闻是少数的开创成员都曾经分开,好新闻是这场宫斗终于停止。Sam Altman有了稳固的权力,接上去或者能够更顺遂地推动他设想中的AI开展偏向,包含将OpenAI从非红利构造酿成赚钱构造来更好融资,推出更多能够贸易化的产物等。现在OpenAI 已发布转型为大众好处公司(public benefit corporation)。2024年10月,Sam Altman为OpenAI实现了新一轮66亿美元的融资,公司估值离开1570亿美元。但OpenAI烧钱之狠也是引人注目的:《纽约时报》取得的融资文件表现,OpenAI2024年估计收入到达37亿美元,但估计盈余将到达50亿美元,而2026年盈余可能会高达140亿美元,这一预算还不包含给员工的股票鼓励兑现。固然OpenAI许诺投资人收入在成倍增加,估计在2029年到达1000亿美元,实现红利,但依照如许的烧钱进度,OpenAI在2025年的两年夜趋向会是必定:第一是年夜范围融资;第二是更保守的贸易化。而这实在跟2024年OpenAI的道路也是雷同的。2024年,OpenAI没能如预期宣布GPT5,这让市场中不少人扫兴,但惊喜的是4o的多模态停顿。别的,o1跟近来o3的宣布让人看到模子才能退化的别的一种道路。Chapter 1.2 o1与o3:AGI另一条道路在2024年5月初,OpenAI宣布多模态4o功效,正式与谷歌等竞争敌手进入AI多模态之战,能够及时对音频、视觉跟文本停止推理。现实证实,4o宣布之后,特殊是在收费版本中供给无限的4o功效跟4o-mini之后,ChatGPT的订阅人数年夜幅回升,仍然在2C范畴上远超竞争敌手。2024年12月,ChatGPT的周活泼用户曾经超越3亿人。在9月,OpenAI宣布了别的一个让业界惊喜的更新:o1。简略来说,o1学会了人类的“慢思考”,包含应用头脑链(Chain of Thought,简称CoT)来停止重复的思考、拆解、懂得、推理,而后给出终极谜底。这使得AI的推理才能在处置迷信、编码、数学及相似范畴的庞杂成绩时有了奔腾的提高。o1这个外部代号为“Strawberry”的强盛模子更新,让咱们看到了在预练习上堆参数的“鼎力出奇观”之外的、经由过程推理阶段的算法冲破找到一条新的通往AGI的途径。咱们在2024年硅谷华源科技年会上采访了多位技巧年夜牛,都十分看好o1的道路。此中,OpenAI前保险研讨副总裁Lilian Weng在2024华源科技年会上对硅谷101表现,o1的宣布能将OpenAI所界说的“五层超等人工智能”,从最低级推动到了更上一层级:“五层超等人工智能”分辨是:对话conversational AI,推理reasoning AI,自立autonomous AI,翻新innovating AI,构造organizational AI。 Lilian Weng OpenAI前保险研讨副总裁 : 跟着咱们转向强化进修(RL)练习来增强AI的推理才能,咱们近来宣布了AI的五个品级,比方会话AI(谈天呆板人)、推理AI、代办AI等。咱们确实发明这能辅助AI在这个五层框架内,到达下一个程度,这也是为什么咱们将模子系列从新定名为o1。 近来宣布的o1团体模子,凭仗在推理才能上的明显晋升,展示出十分不错的成果,但在产物方面,咱们仍需更多尽力。 李沐 亚马逊前AI首席迷信家;BosonAI开创人: 制造o1模子是由于年夜言语模子更多是即时天生的,假如想履行很多其余庞杂的义务,你须要将其剖析为多个义务,以便它们能够逐个实现,人们称之为代办或任务流。 而o1实验本人处理成绩,比方在后盾将成绩剖析为小步调。这时你须要衡量的是耽误的成绩,由于后盾处置可能须要破费一分钟。以是我以为对特定的利用场景来说,这种做法确定是无效的,特殊是假如你不介怀耽误的话。 我以为这种方式同时还很好地下降了本钱:由于模子能够逐渐履行良多步调,这让模子练习变得更轻易。以是,为了取得更好的推理品质,在耽误上做一局部就义。这很可能是一种趋向。在o1宣布之后,OpenAI岁尾的12 DAYs持续宣布了。不得不说Sam Altman是营销的一把妙手,这12天的的马拉松式宣布,扫尾的时间抢了亚马逊re:Invent宣布AI功效的风头,时期也跟谷歌的宣布时光堆叠,把媒体眼光一直紧紧控制在本人手中。这12天的宣布运动中,除了前多少天的o1正式版、天生视频模子Sora在历经10个月之后终于开放给大众、以及集智能写作、代码写作跟定制化AI agent为一体的AI任务台Canvas之外,别的的更新比方说ChatGPT Search进级、与苹果Apple Intelligence的合作等等,看上去就十分不痛不痒,乃至感到是在给12天的宣布会充数。直到最后一天,OpenAI给出了一个王炸:o3。o3是2024年9月宣布的o1的下一版本,由于o2波及别的公司的版权商标成绩,以是OpenAI直接把这个更新跳了一个数字。o3在数个测试上的才能,无论是顺序员编码比赛(Codeforces)中超越99%的人类顺序员,仍是博士程度的迷信成绩(GPQA)曾经超越个别人类博士生,仍是最难的前沿数学测试,仍是形象推理才能基准测验ARC-AGI,o3比o1的晋升能够说是惊人的,而这个版本的更新仅仅用了三个月的时光。这让AI业界的不少人信任,OpenAI在o1跟o3这个强化推理这个范式改变是无效的,这让担忧AI年夜模子曾经“撞墙”的人们略微松了口吻:至少AI模子的开展还在推动。各人也能懂得之前Sam Altman说的“there’s no wall”(墙不存在)的推文了。有采访高朋以为,在2025年,预练习上的“拼参数”会连续,但后练习的推理才能摸索会同时停止。如许的“钟摆”科技道路开展,就像之前英特尔提出的Tick-Tock打算一样,会成为双重并行的开展主旋律。 邱谆 (Jonathan Qiu) 华映资源海内合资人: Tick-Tock的意思是右边是数据驱动,左边是规矩驱动,双方会往返跳动。一会是用更好的数据集去练习它,但同时用更好的算法去推进它,以是就是在算法跟数据双方Tick-Tock(摇晃)。由于当初o1跟o3更多的仍是算法,然而之前包含 GPT 实在也是数据集的驱动。以是,在(数据跟规矩)这双方的摇晃的时间,应当会摇出下一个年夜的 breakthrough(冲破)或许milestone(里程碑)。在2024年岁尾,OpenAI给全部工业奉上了一份圣诞惊喜。固然o1跟o3十分昂贵,o1 pro的订阅价钱是每月200美元,而o3停止一次低算力盘算的本钱高达20美元,高算力就更不必说了,要在现阶段年夜范围商用多少乎是弗成能的。但这也给市场打了一针冷静剂:AI开展并不放缓,而Scaling Law仍然无效。算力本钱会下降,而OpenAI在2025年会持续按着卷参数以及卷推理算法的两种并行道路去摸索AI的下一步。假如o3的道路能将咱们带到“五层超等人工智能”的第二层,那什么冲破能将咱们带到再下一层自立autonomous AI呢?不晓得OpenAI在2025年是否给咱们这个谜底。接上去咱们聊聊OpenAI现在最微弱的多少个敌手,起首就是谷歌。02 穷追不舍的谷歌:规划AI Agent 2024年12月尾,OpenAI停止12日宣布会时期,谷歌停止了多少个重磅宣布。假如OpenAI不压轴的o3,岁尾的风头多少乎全都市被谷歌抢走。谷歌起首在12月12日宣布了多模态年夜模子Gemini的第二代Gemini 2.0,谷歌CEO Sundar Pichai在宣布布告中表现,假如说Gemini 1.0是用于构造跟懂得信息,那么Gemini 2.0则是让信息变得更有效。怎样懂得Pichai说得第二代Gemini能让“信息变得更有效”呢?起首,Gemini2.0在多模态功效上更强盛。谷歌现在对外开放的新模子是Gemini 2.0 Flash,在呼应时光上比上一代的1.5 Flash机能更强、耽误性更低。在多模态上,2.0 Flash支撑图片、视频跟音频的输入以及多模态的输出。紧接着,12月16日,谷歌宣布了新一代视频模子Veo 2,十分冷艳,直接对打Sora。细节咱们不开展了,现在的论断是:Sora在最开端公然到终极对用户宣布的这10个月中,包含谷歌在内的竞争敌手曾经遇上来并在多模态才能上做得更强了。12月20日,Google Brain团队担任人Jeff Dean发布Gemini 2.0 Flash Thinking的推出——直接对标OpenAI的o1道路,展示出谷歌外部对头脑链技巧(CoT)的才能,而且Gemini 2.0 Flash Thinking的思考速率会比o1-mini要快。最后,谷歌还夸大了Gemini年夜模子系列对AI Agent的规划。在2024年5月的谷歌I/O年夜会上,十分冷艳到我的名目“多模态虚构助手Project Astra”,也有相称的停顿。在Astra Gemini 2.0的demo中测试职员应用手机跟AI来停止及时交互,包含疾速提醒公寓年夜楼的保险暗码、随时对大众交通道路停止讯问等,人们也能够带着智能眼镜停止更沉迷式的多模态交互。我团体以为,智能眼镜在一些场景下比手机更合适作为agent进口的交互硬件,由于它能够捕获人们的眼光,作为音频视频跟屏幕的浮现载体,而用户也能失掉7*24小时永久在线的休会。以是掉败了多年的Google Glass是不是终于能活过去了呢?兴许在2025年咱们会有新的谜底。看得出来,Sundar Pichai十分器重Project Astra,以为它“展现了通用AI助手的曙光”,而谷歌Gemini年夜模子依附长文本的才能,能让Project Astra记着长达10分钟的会话内容来供给特性化的效劳。同时,借助Gemini 2.0,Project Astra能够应用Google Search、Google Lens跟Google Maps ,从而真正让一个AI agent在一样平常生涯中施展助手的感化。固然现在来看,这个名目还在比拟晚期的阶段,假如咱们看看之条件到的OpenAI界说的五个AI层级,Agent能自立举动实现义务曾经是第三个层级了。这也展示出谷歌对AI agent的押注,而这个赛道也被良多人以为将在2025年是个极端炽热、面对暴发的赛道。对谷歌来说,尽力押注AI agent也很天然:假如谷歌最赢利的产物,也就是“搜寻”将会被AI交互推翻,那么AI agent的进口、屏幕、交互、模子反应都是谷歌必需要盘踞的领地。 邱谆 (Jonathan Qiu) 华映资源海内合资人: 假如你是 AI application(利用),你就是Copilot(副驾驶);AI agent(智能体)是主动驾驶, Copilot 就是帮助驾驶。 良多application(利用)把本人叫agent之后不在算法下面有真正的翻新,也不数据。假如就做agent,我团体感到下一步仍是要往数据的角度去走,agent也须要数据。我感到下一步 2025 年,可能会在这多少个层面。Chapter 2.2 长文天性力:NotebookLM在2024年,被谷歌卷起来且处于业界当先位置的另有它的“长文本”的才能,这个长文天性力指的是让年夜模子懂得超长的高低文。而基于这个才能,谷歌在2024年也衍生出了一些爆款AI产物,包含NotebookLM。2024年2月15日,谷歌的Gemini 1.5 Pro把长文天性力卷到100万tokens;5月,谷歌发布更是将长文天性力翻了一倍到200万tokens。同时,谷歌新宣布的论文,描写了一种新的留神力技巧“inifini-attention”(无穷留神力),能使Tranformer年夜模子在无限算力情形下处置无穷长度的输入。 Bill Jia 谷歌CORE ML/AI工程副总裁: 假如咱们不算Gemini的模子,那么在业界现有的最好的年夜型言语模子,容许的Token(AI处置文本的单位)数目大概在10万到20万之间。假设一个token相称于一个单词,则大抵能够包括统共10万到20万个词作为给AI的提醒词。 而谷歌的Gemini模子将高低文窗口从开始进的20万扩大到了100万到1000万——这多少乎是一个50倍到100倍的增加。对年夜型言语模子来说,这个高低文窗话柄际上是一项十分有效的技巧:高低文窗口越年夜,你能够向模子供给的输入就越多。 Gemini模子在现实利用时,就可能支撑如许一个宏大的高低文窗口,因而,咱们能够将大批相干信息输入Gemini,如许一来,对话就会感到十分在点子上。这也是Gemini模子可能发生十分好对话后果的局部起因。在如许的长文本技巧下,谷歌2024年的一个爆款利用名为NoteBookLM。NotebookLM是基于Gemini 1.5 Pro的长文本懂得跟多模态才能而衍生出的条记治理东西,一推出就敏捷取得了浩繁硅谷科技年夜佬们的盛赞,包含Andrej Karpathy、Sam Altman,都公然为这个产物站台。NotebookLM最冷艳、出圈的功效之一是音频概览,也能够被称之为AI播客。有谷歌的Gemini底座年夜模子的多模态跟长文天性力支持,NotebookLM的AI播客功效能够将文档、视频或许音频总结天生一男一女对话的方法,让用户用“听内容”的方法获守信息,在播客podcast这种媒体情势无比风行的硅谷构成了病毒式传布的景象级别产物。固然答复的内容比拟浅易,交互也比拟像相声中的捧哏,但NotebookLM在对内容的抓点跟总结才能长短常精准的,天生的两位AI主播的对话也十分天然流利,AI感很低,我也大略能感触到这个产物之后的潜力仍是会十分年夜。12月中旬,谷歌宣布NotebookLM Plus,新参加audio overview功效、容许用户在播客旁边打断AI主播,提出倡议或成绩停止交互,同时用户还能够自界说播客作风跟主题。NotebookLM之前的中心团队担任人Raiza Martin,计划师Jason Spielman跟中心工程师Stephen Hughes曾经从谷歌告退出来本人创业。外界猜想他们会本人从新做一个NotebookLM的产物用于更好的贸易化,但很风趣的是,有的VC投资人并不看好这个名目。 邱谆 (Jonathan Qiu) 华映资源海内合资人: 你能够懂得他是个产物翻新。NotebookLM是Google Labs出来的,但Google本人是有底座模子的。Notebook LM用的底座实在也不是Google Gemini,而是谷歌本人外部的一个定制化底座。以是,假如你不是那么懂底座,纯第三方的来用谷歌Gemini API,你未必能做得出来NotebookLM。 产物翻新之上要联合对底座的懂得,否则光是产物翻新,我感到可能不克不及跑得特殊远。总的来说,谷歌Deepmind跟Google Brain傍边人才密度不会亚于OpenAI,技巧也不会落伍太多,但2024年谷歌仍然是一个“追逐者”的姿势。究其基本,OpenAI的贸易形式是一个年夜模子供给方,以是必定要保障模子的当先性,但谷歌是完整差别的贸易形式,它的重要义务是保障技巧不落伍且当谷歌搜寻被AI推翻时,本人是筹备好的。以是在多模态的AI第二轮年夜战中,OpenAI是防御者,而谷歌仍然是防备者,下一场硬仗无论是第二层的reasoning,仍是第三层的autonomous AI agent,2025年都市十分出色。接上去咱们再来说说别的多少个重要年夜玩家。03 Anthropic:受开辟者欢送却不敌OpenAI Anthropic是OpenAI除了谷歌之外的最在意的竞争敌手了,与谷歌不太一样的是,Anthropic作为年夜模子的供给方,是OpenAI直接的竞争敌手。2024年在融资上,Anthropic从亚马逊取得了新一轮40亿美元的融资,使得公司估值到达400亿美元。产物更新上,10月22日,Anthropic宣布Claude3.5 Haiku,同时进级了Claude 3.5 Sonnet。从外界反应来看,Anthropic的模子在技巧上长短常强的,特殊是Claude在编码义务中表示杰出,尤其是在庞杂代码天生跟处理计划主动化方面,十分遭到工程师们的推重。Anthropic的贸易形式现在更2B跟2D,对企业跟开辟者群体更受欢送,但2C方面就不太幻想了。12月尾,Anthropic从用户与Claude的对话中随机拔取了100万条,停止剖析跟总结后发明,用户在Claude.ai上的重要应用场景排在第一位的,是网页跟挪动利用开辟,占比为10.4%。这是由于背地的软件开辟职员重要应用Claude履行调试代码、说明Git操纵及观点等义务。良多开辟职员以为,Claude 3.5 Sonnet会十分合适须要深度懂得跟庞杂推理的利用顺序,而OpenAI的模子对较简略的义务可能更具本钱效益。而Claude AI的2C谈天呆板人,在iOS跟安卓挪动利用顺序上收入100万美元的里程碑,用了整整16周,而这个门槛OpenAI的ChatGPT用了三周就到达了。固然快于微软的Copilot跟Perplexity,但间隔OpenAI依然有很年夜间隔。之前媒体的报道说,Anthropic在2024年的收入会超越10亿美元,比之前猜测的要高良多,阐明市场仍是十分买账Anthropic的模子才能,特殊是近来他们又挖了良多OpenAI的中心职员从前。看上去,这个OpenAI的最年夜竞争敌手在2025年会持续在2B跟2D范畴上发力,而对2C花费者端来看,临时不会对OpenAI跟谷歌带来太年夜的要挟。咱们再来说说马斯克的xAI。04 xAI:入局虽晚但万事俱备 xAI在2024年做了三件年夜事:搞定了算力、搞定了融资、开源了本人的年夜模子。假如另有别的趁便的事,就是马斯克数次把OpenAI告上了法庭。12月24日,马斯克旗下的xAI发布实现60亿美元的C轮融资。英伟达,AMD,a16z,红衫等公司跟机构参加,也标明业界对xAI的潜力的看好。要晓得在半年之前的2024年5月,xAI刚实现60亿美元的B轮融资,足以阐明马斯克的融资才能。除了钱之外,马斯克仍是第一个搞定年夜范围算力集群的:2024年,xAI位于美国田纳西州孟菲斯市的数据核心正式投入应用,历时122天建成创下记录。这个名为“伟人”(Colossus)的数据核心外面安排了英伟达的10万块GPU芯片,成为寰球开辟跟运转人工智能技巧的范围最年夜、算力最强的芯片集群之一。而马斯克说当前另有打算持续拓展到20万块GPU的范围。在年夜模子上宣布上,Grok的速率实在是要比竞争敌手慢一些的。在8月中旬,xAI宣布了Grok-2跟Grok-2mini两款AI模子的测试版,比此前宣布的Grok-1.5有了十分年夜的提高。10月,xAI宣布了首个利用顺序编程接口(API)。现在,xAI API只有一个模子,称为“Grok-beta”。实在xAI固然入局晚了些,但上风仍是十分多的:除了下面咱们说到的算力跟融资之外,xAI另有交际收集X跟特斯拉的独家数据,以及呆板人Optimus等名目的联合潜力。相称一段时光以来,Grok的谈天呆板人只向马斯克旗下的“X”用户供给,但在2025年很可能马斯克会片面开放Grok。除了iOS顺序在测试之外,网页版Grok.com也曾经筹备停当,写着coming soon(筹备停当),感到2025年xAI会正式参加战局。马斯克也在X上说,Grok3很快会宣布,而且将是一次严重奔腾,咱们也刮目相待。05 Meta:年夜获全胜或赤贫如洗 接上去咱们说一下脸书(Facebook),这家公司在2024年挺有意思。除了开创人扎克伯格近来的渐变抽象跟婚姻八卦之外,脸书毫无疑难是2024年的科技年夜赢家之一:单从股价就能看出来,2024年涨了70%阁下,Meta的员工们应当都很高兴。固然Meta不像OpenAI跟谷歌那么在年夜模子火线厮杀,但Meta的战略也十分的暧昧:在AI研发上不落伍,且规划下一代的AI利用,联合在硬件、交际媒体以及告白中。在年夜模子方面,脸书在2024年连续更新Llama开源模子。12月6日,Meta宣布新款Llama开源模子:70亿参数的Llama 3.3、又称Llama 3.3 70B。扎克伯格说,下一步就是来岁Llama 4的表态。Llama 3.3能实现与2024年7月宣布的4050亿参数的Llama 3.1同样的机能,但本钱比后者更低。Llama 3.1是迄今为止最年夜的Llama开源模子,直接对标Anthropic的Claude 3.5 Sonnet跟OpenAI的GPT-4o。除了在年夜言语模子上的停顿外,Meta也始终在摸索除了“年夜言语模子”(LLM)之外的别的AI门路:2024年12月11日,Meta新宣布了Large Concept Model(LCM),翻译过去是“年夜型观点模子”。它跟LLM年夜言语模子逐字猜测差别,LCM的观点是能直接在高纬度语意空间中运算,就像人类思考的方法,并不是一个字一个字地去思考,而是以”观点“跟”意思“为单元。以是LCM是Meta完整冲破LLM架构的一个翻新的实验。现在Meta表现这年夜幅度晋升了AI在多言语跟长篇内容处置上的效力,但处置的后果跟正确度仍然须要晋升跟改良,以是LCM能否是比LLM更好的一种范式,咱们刮目相待。别的,因为Meta 2024年在智能眼镜上的实验胜利,以及旗下Facebook、 WhatsApp、 Instagram、Messenger、Threads等宏大的用户群体,另有AI跟告白联合的远景,市场十分看好Meta现在在AI年夜战中的地位。Jefferies的剖析师乃至将Meta选为步入2025年天生式人工智能的“赢家”。不少二级市场的讲演以为,Meta下一代与AI联合的Orion AR眼镜将成为新一代硬件进口,Meta在2024年推出的Ray-Ban Meta很开端的将AI功效引入此中,遭到市场好评。可能在2025年,下一代智能眼镜上Meta就会引入屏幕表现,届时就会开释出更强盛的AI交互功效。说到智能硬件,苹果在2024年宣布了Apple Intelligence三件套,咱们之前有具体聊过,但由于端侧模子跟agent的开展可能还不到能让硬件工业与AI联合得特殊好的水平,苹果在AI停顿并不年夜。良多人以为苹果终极仍是要本人开辟底座年夜模子,不克不及完整靠接入OpenAI的ChatGPT,而等硬件与AI联合的那一天,就是手机与智能眼镜的市场年夜战了,现在押注得最年夜的Meta跟苹果将终有一战。说回Meta的别的AI产物规划:在AI Chatbot方面,Meta旗下的多少款王牌交际媒体都曾经差别水平的引入了AI对话框,扎克伯格也在12月表现,Meta的AI数字助理“每个月有快要6亿的活泼用户”。由于Meta不供给自力的AI利用,以是消息或许业界个别不将Meta的Chatbot直接与ChatGPT或许Claude去做直接对照,但就这些活泼用户的基数而言,Meta的AI产物是有很年夜上风的。而最后一点就是AI在告白上的利用潜力。Meta在12月表现,现在超越100万的告白商在应用Meta的GenAI东西,他们在一个月之内制造了超越1500万条告白。固然现在AI天生的素材还不那么精巧,但无论是从告白题目跟案牍的多个版本,仍是主动调剂告白巨细,仍是应用文生图、文生视频跟文生音乐更高效的制造告白,AI都有十分年夜的潜力。同时,也有剖析以为,Meta可能会在自家的开源模子Llama长进一步开辟出企业级客户效劳的营业,也将会是一块很年夜的蛋糕。在2024年,小扎十分踊跃的呈现在各个媒体采访中,一遍又一遍论述着Meta的将来,不再是纯真的Metaverse,而是新一代的AI交互,一个融会了AI,混杂事实跟元宇宙的将来。2024年9月,开端在抽象跟穿搭上年夜转型的扎克伯格穿了一件T-shirt,下面写着“Aut Zuck Aut Nihil”,这个细节被媒体捕获到。这个短语是拉丁短语“Aut Caesar Aut Nihil”的变形,意思是“要么是凯撒,要么什么都不是”;而扎克伯格的“Aut Zuck Aut Nihil”仿佛是在宣战:要么赢全部,要么赤贫如洗,All or Nothing。06 “年夜而全”的亚马逊 最后多少家科技巨子中,再说说亚马逊。亚马逊的道路跟别的多少家都不太一样,采用的是一个卖铲子买卖的形式。他不拼模子、拼算力、拼芯片,固然各方面都有自研的产物,但把他们整合在一同,再加上市道上全部的好货色,打个包卖给客户们,帮甲方降本增效,做好2B的买卖,也长短常聪慧的做法了。在12月召开的亚马逊云科技re:Invent年夜会上,亚马逊的最新战略十分明白:第一,岂但有自研芯片的集群,也有与英伟达芯片配合的算力运转核心;第二,不但供给满意万亿参数年夜模子练习跟推理需要的自研芯片产物,包含与Anthropic绑定配合的十万张亚马逊Trainium自研芯片AI盘算集群,另有为中小企业跟始创公司供给能降本增效的效劳与技巧;第三,除了亚马逊最新的自研模子Nova系列,种种纯文本、多模态年夜模子都有,同时在亚马逊Bedrock上还供给上百种市道上最受欢送的模子抉择给客户筛选;第四,在本人的三层AI架构上参加种种模子蒸馏、处理AI幻觉、保险技巧等效劳。对良多须要用到AI的始创公司,要算力并纷歧定须要本人买卡,要用模子并纷歧定要本人练习。就像须要萝卜青菜也并不须要本人去务农种菜,能够去超市直接买,就看终极的本钱账是否算得过去了。这也表现出,亚马逊押注2025年市场对算力的需要只增不减。而跟着需要逐步从练习转移到inferencing推理,算力市场的更多翻新效劳以及基建会进一步齐备。除了亚马逊云科技,芯片公司自身,像英伟达,AMD,英特尔等芯片公司自身,以及高低游的电力公司以及数据核心效劳公司也会持续是市场存眷的核心。接上去再总结一下2024年那些陨落的硅谷明星始创企业们以及徐徐升起的明星公司。07 陨落的明星始创企业们 2024年,有三家硅谷明星始创企业敏捷跌下神坛。第一家是Character.ai,建立于2021年,应用年夜模子天生种种人物跟脚色作风的对话。2023年5月,Character.AI在苹果App Store跟Google Play Store宣布了挪动利用顺序,第一周下载量就超越170万次,并被Google Play评为2023年度最佳AI利用。但是,2024年年终,公司被反复爆出融资艰苦,贸易化不顺遂,开端追求收购。2024年8月,Character.AI发布,谷歌曾经批准向Character.AI付出模子受权费,并将让Character.AI结合开创人兼CEO Noam Shazeer、总裁Daniel De Freitas、以及30名Character从事模子练习跟语音AI任务的员工,参加谷歌参加Gemini AI名目,谷歌为此付出的价钱是25亿美元。别的一家公司是Inflection.ai,这家公司做年夜模子,下面叠加“团体AI朋友”用处的谈天呆板人Pi,主打感情陪同市场。一度市场对inflection.ai的模子技巧十分承认,但也是由于年夜模子过于烧钱而资金链不跟上。2024年3月,微软挖角了Inflection 的开创人跟多少乎全部员工,建立了一个新的花费者AI部分,并付出了约6.5亿美元购置其技巧允许。最后一家公司是Adept,也是Transformer原作者出来创业的奢华开创团队。2024年6月,亚马逊与AI agent公司Adept告竣协定,雇佣这家始创公司的年夜局部员工,并付出约3.3亿美元以受权其技巧。这三家公司的“变相收购案”也在成为硅谷科技巨子拓展AI幅员的新形式:既避开把持羁系,又能收人才收技巧。不外这三家公司一个独特点:都同时在开展底座年夜模子跟做产物,但如许的道路被证实太甚于烧钱,模子太难以连续。这就让我想到后面说到NotebookLM团队的人出来本人创业,被投资人以为不底座模子的才能、只能挪用谷歌Gemini的API,以是不被看好。做年夜模子吧,太烧钱;不做年夜模子吧,不技巧壁垒跟护城河。这么一看,AI时期的创业真的太难了。 邱谆 (Jonathan Qiu) 华映资源海内合资人: 以是你怎样去把控这个节拍?我感到Perplexity这家公司实在仍是把控得很不错的:他到明天也不完整从新练习本人的底座。我感到他会有那么一天的,然而他要掌握这个节拍,别步子迈得过年夜,还没到那一天的时间,就曾经把钱给烧完了。这个是比拟伤害的,也是 AI 创业比互联网可能更难一点的处所。08 “当红炸子鸡”名目 Chapter 8.1 Perplexity再总结一下2025年被以为是徐徐回升的明星AI名目。起首是后面Jonathan提到的Perplexity:2024年岁尾,公司实现了新一轮5亿美元的融资,估值到达90亿美元。这家公司建立于2022年,能够说从新界说了寰球第一个对话式AI搜寻引擎,月活泼用户曾经到达1500万人次,日活泼用户200万人,连英伟达开创人黄仁勋也为它站台,称天天都市应用。Perplexity的聪慧之处在于,本人不练习模子,而是应用多种年夜型言语模子,包含GPT、Claude、LLAMA、Mixtral等,以及来自多个搜寻引擎的排名旌旗灯号跟第三方数据供给商的数据。它的中心竞争力在于检索、排序跟编排的数据整合才能,以及谜底天生才能。但跟着AI搜寻市场的竞争日益剧烈,像OpenAI曾经推出了SearchGPT,谷歌也会在AI搜寻上跟进,Perplexity在2025年会遭受更剧烈的竞争。贸易变现方面,除了付费版本之外,公司曾经打算引入告白,这会怎样从新界说AI搜寻的形式呢?咱们也刮目相待。Chapter 8.2 Physical Intelligence2024年,硅谷另有别的一家公司十分受人注视:Physical Intelligence。我最开端听到这家公司是从OpenAI结合开创人以及特斯拉FSD前担任人Andrej Karpathy的口中。他曾在一个小型的聚首上分享说,有良多名目找他投资,他许可的起因只是为了辅助友人,究竟他的名字在天使投资人的那一栏能帮良多名目更轻易拿到投资。但为数未几的他至心想投资且看好的名目,就当属Physical Intelligence了。这家公司经由过程AI模子为呆板人打造“年夜脑”,在2024年11月实现新一轮4亿美元的融资,估值离开20亿美元,投资者包含亚马逊开创人贝佐斯另有OpenAI。同时,在11月初,Physical Intelligence宣布了首个通用基本模子π0,也被是以为具身智能开展上的主要一步。Physical Intelligence表现,π0将使得呆板人变得更轻易编程跟应用,使其可能更高效地履行多样义务。现在,Physical Intelligence的π0模子曾经可能履行一些简略的多义务,如折叠衣物、组装盒子、静态地将物品放入容器等。 邱谆 (Jonathan Qiu) 华映资源海内合资人: 2024 年最年夜的停顿,我会投给o1跟π0。 我感到π0更多是 training data driven(数据驱动)的道路;o1更代表的是algorithm(算法)驱动的道路。 π0确定也要在算法上持续做迭代,也可能在推理侧引入一些方式。固然难一点就是推理,由于具身智能的推理侧要在端侧产生,可能对算力的请求会更高一些。具身智能以及AI呆板人模子还在十分早的阶段,由于数据跟算法都是挑衅,但信任在2025年会有新的停顿。同时,斯坦福的呆板人核心在2024年停业了,我也去加入了停业典礼,无机会咱们去那边采访一下跟各人分享最新的名目跟有意思的停顿。09 2025年的将来 因为篇幅起因,另有良多科技巨子的停顿、始创企业跟新趋向咱们没措施逐一罗列,包含AI视频天生的始创公司Pika跟Luma,音乐天生始创公司Suno,近来很火的AI编程利用Cursor跟Devin,李飞飞博士的World Labs、该有2025年终惹起一片震动的DeepSeek等,之后无机会咱们具体做成独自选题来聊。总的来说,2024年的硅谷十分出色,有凌乱,有质疑,有开张收购,也无为了AGI信奉持续战役的科技从业者们。固然2024年呈现了o1、o3的道路,但更年夜模子、更强的才能仍然是被市场合等待的。 马腾宇 VOYAGE AI开创人 斯坦福年夜学盘算机迷信与统计学助理教学: 我始终都在等待更好的技巧,纷歧定要GPT-5,也可能是Anthropic Claude的4、5、6代,或许是xAI、Mistral。 我以为,固然现阶段的GPT-4能够做的事越来越多了,然而更年夜、更强的模子在某种意思上会让模子的应用变得更轻易。以是,假如有了GPT-5或许Claude 4、5,那么基于GPT-4的一些自我工程可能就不再须要了。 Bill Jia 谷歌CORE ML/AI工程副总裁: 对那些有资源、有资本、有工程才能的至公司来说,他们会持续构建年夜模子。年夜模子在良多差别方面表示得更好,特殊是在通用处景中。 而后基于年夜模子,人们会构建种种差别的垂直模子。刚开端垂直模子也比拟年夜,但跟着包含蒸馏模子、量化模子等技巧,模子会变得更小然而更无效率、更有性价比,并且模子品质不会降落太多。 我以为这两条主线将会连续很长一段时光,盼望有第三种并行尽力的偏向,那就是寻觅差别的模子架构,由于当初的模子基础都是基于Transformer的,另有一些基于diffusion模子用于天生图像等旁边任务。我盼望能有其余非transformer、非diffusion的模子架构呈现,让天生成果更无效、更高品质、同时下降本钱。假如在这方面能有所冲破,将再次对AI行业发生宏大的影响。在硅谷的AI生态中,曾经衍生出了多个派别:有更年夜的模子、年夜模子衍生出的垂直模子、不信奉Transformer而在摸索别的通往AGI门路的研讨者,同时也有利用、硬件、agent智能体、呆板人、无人驾驶,另有“卖铲子”的英伟达、数据核心、电力高低游等等,这些生态在2024年失掉了进一步的坚固与规划,而在2025年,咱们会看到更多技巧的停顿。固然,硅谷只是AI开展的此中一个主力疆场,寰球别的市场的AI也有十分疾速的开展,明天咱们只是略微总结了一些硅谷的情形,也欢送各人给咱们留言最值得提的公司,技巧或许变乱,这对咱们团队更进一步摸索AI工业十分有辅助。2025年,咱们会在硅谷持续为你带来更多的AI前沿剖析。前往搜狐,检查更多 义务编纂: 上一篇:年青人曾经离不开AI了 下一篇:没有了