Agent 与自动化 5.0 · 必读 2026-02-26 · X

2026年AI趋势观察:模型飞轮、应用爆发与个人发展

长文系统分析 2026 年 AI 趋势。模型两条线:大语言模型智力线(推理模型→agentic能力→agent team内化)和多模态生成线(技术门槛被内化到模型)。数据飞轮驱动模型持续变强。应用层机会:通用/垂直 Agent、Agent 基建(API/MCP/Skills)。多模态创作门槛消失(ComfyUI 不再需要学)。对个人建议:判断力 > 代码流利度,品味是真正的护城河。

打开原文回到归档

2026年AI趋势观察:模型飞轮、应用爆发与个人发展

公众号: Kenny 肯尼
发布时间: 1970-01-01 08:33:46
原文链接: https://mp.weixin.qq.com/s/D98rfJX1NZmAD4xxs1h-Xg

全文约13,200字,阅读约35分钟

最近几个月,陆续有同事朋友找我聊天,有的是对工作现状的迷茫,有的是想了解外面AI到底发展到什么程度了,有的纯粹就是半夜情绪上来需要人聊聊。我发现大家的感受出奇地一致——强烈的割裂感。

一边是自媒体上铺天盖地的"炸裂"、"震惊"、"颠覆",好像明天世界就要变了;另一边是回到日常工作和生活,好像AI作用依然有限,该开的会还是在开,该扯的皮还是要扯,该甩的锅还是要甩。

我自己从大厂出来后,离开过去那个成熟精密但慢的体系,感受会比之前强烈很多。如果说25年是AI应用层元年;到了26年,AI应用真的爆发了。说实话,连我自己都会焦虑,因为实在太快了。

有点像坐在一辆不断加速的火箭上——推背感不是开始的瞬间,而是越来越强,快到让你有点恐惧。23-24年的时候,我的注意力还能cover住大部分信息,到26年基本上cover不住了,大量的信息我也不知道。

本文源于一次飞书会议分享会,具体分为几个部分:先讲模型进化的底层逻辑——大语言模型的智力线和多模态生成线各自怎么发展,为什么会越来越强,然后应用层的机会在哪里,最后讲在这个大背景下,个人应该如何做职业选择和能力准备。

大家基于这套逻辑,再去审视那些铺天盖地的信息,看看哪些是噪声,哪些是对你来说真正重要的信号。构建自己的认知框架,比追逐每一个热点更有价值。

一、模型进化:两条线,一个飞轮

我们先从模型的发展讲起。很多人觉得大模型离自己很远,是算法和研究员关心的,但实际上,理解模型怎么进化,是你判断行业趋势和个人选择的基础。就像移动互联网早期,你要理解4G、GPS、智能手机、摄像头意味着什么,才能抓住后面的机会,否则只会把PC网页塞进一个4寸小屏幕,愁着怎么在小屏里塞广告位。

模型发展分为两条线:一条是大语言模型的智力线,一条是多模态生成线。两条线背后的逻辑是相通的——数据飞轮驱动模型持续变强,技术门槛不断被内化到模型中。先讲智力这条线。

大语言模型的智力线

1\. 三个关键节点

这条线有三个关键节点,每一步都在为下一步积累数据和能力。

第一个节点是推理模型的突破。24年9月OpenAI的o1出来,让模型在回答问题之前先自己想一想,即思维链CoT。然后是25年1月的国产平替DeepSeek R1,接着是Claude 3.7、Gemini 2.5,这些都是推理模型。

推理模型催生了第一批agent产品——Manus、Genspark、Lovart等,基于用户的prompt,模型会思考,会规划,然后调用手头的工具去干活,而不是简单地回答问题。这是AI native应用层真正开始的起点。

但那时候很多agent产品其实是在做大量的补丁,用户体验也不好,干活能力很差,所以25年上半年这些agent产品有很多争议。

第二个节点是agentic能力的提升。到25年11月Claude 4.5出来之后,vibe coding的人群大大增加。之前用Claude 3.7做vibe coding还是挺麻烦的,到了4.5明显好用了很多。再加上Codex 5.2、Gemini 3(它在前端做得特别好,加上AI Studio不需要安装直接在线就能用),AI coding开始进入更大众的人群。

这里很核心的是模型的agent能力开始起来了。为什么?因为之前的推理模型催生了agent产品,这些产品去调用工具、思考规划、拿到用户反馈,形成了一个loop,积累了很多高质量的数据。基于这些数据再去训练模型,模型就把这些能力内化进去了。

第三个节点是agent team的出现。之前做agent的同学应该都经历过一个讨论:到底做single agent还是multi agent?如果任务对context要求非常高、需要强共享,一般做single agent;如果任务可以拆解成多个步骤,multi agent架构更合理。

但到了现在——Claude 4.6、Codex 5.3、o3这些模型,它们把multi agent架构内化到模型里面去了。之前那套脚手架是我们人为界定的,agent干完活什么时候交给另一个agent,配合不一定好,并且每一个任务都分给n个带有角色的子agent,过于机械了,纯浪费token。

当这套脚手架内化到模型之后,模型基于具体的任务和context,来判断是否要建子agent去执行单独的子任务,建多少个子agent,子agent之间的上下文通信、互相交流变得更加自然,真的很像人一样在协作。用过Claude 4.6、Codex 5.3做vibe coding的人,应该能明显感受到这次提升有多大。

从这三个节点,你能看到一个核心规律:模型与脚手架的关系是一个循环——模型先出来,变成agent去干活,单个agent不够就做multi agent,然后又把这套东西内化到模型里变成agent team。在这个循环下面,模型就会变得越来越强。

2\. 数据飞轮:模型自我进化的引擎

如果把上面这个规律放到更大的范围来看,你会看到一个飞轮。

模型变成agent之后,在一个环境里面给它很多工具,它去执行,执行之后拿到反馈。这个反馈可能是代码能不能跑起来,或者基于人的反馈——用户是否满意。大家做过vibe coding都知道,经常会骂AI干得不行。

你这个骂,其实就是在生产环境里产生高质量数据:用户的起始prompt是什么、agent做了什么事情、它思考了什么、它规划了什么、调用了什么工具、产生了什么结果、用户对过程当中的纠正——所有这些都是非常真实的训练数据。

基于这些数据再去训模型,模型就会变得更强。然后再做更强的agent、完成更复杂的任务、拿到更多样的数据,如此迭代。这个飞轮的路径,现在已经看得非常清晰了。

我们最开始讲模型训练说的是算力、算法、数据,到现在,数据是最重要的。

更进一步,AI的自我迭代已经开始了。现在大量的Claude Code都是用Claude Code自己去迭代的,OpenClaw大量是用AI写的代码。产品经理的很多需求单是让AI写的,调agent的system prompt可能也是AI写的。

我记得25年上半年问了一圈大厂里的程序员,AI coding在他们工作中占比大概30%;到下半年,在初创公司里AI coding的占比可能是99%以上。甚至连高端的科研领域,孙天祥团队做的FARS都开始让AI自己搜集信息、做实验、写论文了。

最近大家用OpenClaw(小龙虾)的话应该有感受,它的自我迭代是另外一种——你给它一个目标,它7x24小时不断运行,有一个非常长的memory,所以它可以自我迭代变成一个越来越懂你、越来越强大的助理。不是像我们之前的产品,给它一个任务完成了就结束,下一个任务重新开始。

我们正在看到一个明确的趋势:物理世界的事件和数字流程正在被token化。Agent基于这些token作为context,进行规划,调用工具完成一个个任务,拿到更多的数据,再喂回模型。这条路在coding领域已经跑得非常通了,接下来会逐渐向其他行业泛化。

3\. 从coding到一切:智力的泛化

这个泛化已经在发生了。最开始模型是聊天,聊天完了开始coding,coding变得好了,它又可以操控更多的工具、完成更多的任务,已经泛化到其他的白领工作。

举几个具体的例子。AI写的需求单,程序员看起来会更好——结构清晰、边界条件考虑得全。AI写的需求单,AI看起来也更好。比如登录组件的需求单,这是产品经理最不想写的——非常无聊但又非常复杂,登录支持什么接口、报错了什么样子、各种边界条件。这些AI写得比我们好非常多。

未来三年,各种更基于文本的工作,会逐渐被AI增强或替代。岗位不会消失,但能力模型的要求会不一样。三年后依然有产品经理这个岗位,只不过大量我们过去花时间的工作——竞品分析、需求单、数据分析——都可以让AI来做,而且做得更好更快。

与此同时,服务agent的基建正在快速搭建。API、MCP、skills这些——有个说法是skills是给agent用的APP。Agent的智力在很多纯粹的任务上已经超过人了,但它要想在这个世界上干好活,还需要基建的支撑。

这有点像,在座各位都是非常聪明的人,但如果把你丢到一个完全陌生的行业,你不一定能干出什么东西来,因为你不知道这里的knowhow是什么,工具也不知道在哪。

现在agent也是一样,我们人类的物理世界和软件系统全都是为人而设计的,agent只能通过browser use之类绕过的方式去操作,非常低效且容易出错,还会被当机器人拦截。

接下来为agent服务的基建会快速起来。今年有大量的公司做这方面的事情。你会看到一些传统软件公司股价在大跌,而为agent服务的基础设施公司股价在大涨,比如cloudflare。

按照这个路径推演,大量的工作任务会被agent完成,围绕agent会出现大量的服务、工具、数据的供给。Token消耗量在今年可能会几十倍、几百倍地增长。我了解到有些团队,人均一天的token消耗是10亿,非常恐怖。

多模态生成线:当技术门槛消失之后

前面讲的是大语言模型的智力线,接下来讲模型进化的另一条线——多模态生成。这部分大家从日常感受会更直观一点。

1\. 各模态都在加速,而且速度超出预期

图像生成这边,Midjourney、Nanobanana这些已经是超大规模的应用了。大家平时在电商、海报、各种营销场景应该大量在用,不用像之前一样去手画,也不用招很多模特、布光、棚拍。

视频模型进步得比我想的更快。最近Seedance 2.0出来,是那种让人震惊的程度——不是AI圈内的震惊,而是让好莱坞的一些导演都震惊了。

我看到一个评论特别搞笑,说它让影视行业的人也体会到了程序员被AI支配的痛苦。我之前在剪映醒图做图像视频生成模型的应用,完整经历了整个行业的演变过程,每发一个版本效果都明显提升,真的非常快。

音乐的话,现在Spotify上有很多火的音乐,没有标注是AI,但实际上就是AI生成的,已经超过了大部分音乐人。音色克隆、TTS都已经真假难辨。

2\. 核心变化:工具和技术正在被模型吃掉

在这些模态的加速背后,有一个共同的关键变化:很多工具和技术没有那么重要,因为它们已经被内化到模型里面了。

比如大家用Seedance 2。0的时候能感受到,你不需要像之前做AI视频那样——对每个分镜讲究特别多,不断在打磨分镜、抽卡。23年的时候我们培养AI创作者,当时测算整个世界上ComfyUI用得溜的也就几千个人,门槛太高了。

现在大家也不需要学ComfyUI了,因为分镜设计、运镜节奏、动作连接这些导演的knowhow,已经被内化到模型里面去了。你写个简单的prompt,模型就懂你要什么。

这意味着什么?创作的门槛正在消失。以前做一个15秒的视频,你要先生成分镜、修图、处理关键帧、开卡、再剪辑,整个流程走下来很累。现在可能一段提示词反复调几次就行了。门槛降低,创作群体就会扩大,内容越来越卷,用户对最终结果的要求也会越来越高。

传统影视工业里很多岗位会被压缩——舞美、灯光、布景、群演,他们可能本身工作跟AI没什么关系,但因为AI在这块变得更强,莫名其妙工作就更难找了。

但对于导演来说反而是个好事,你不需要去融很多钱、招演员、搞场地,可以直接把你的想法变成一部短片。很多时候想法才是最重要的。

电影是技术非常复杂的工业,需要很多角色、很多资源,所以你看到演员明星导演,有名字的就那么几个,而且来来回回就是那么几个。但真的全国就他们几个人有才华吗?不是的,技术的门槛限制了外部人员的进入。你有再多的才华,没有机会和资源也没用。

短剧把技术资源门槛下降了,几万几十万就可以拍一部,不像电影动辄几千万几亿,而短短几年,短剧市场规模破千亿,电影这么多年只有500亿。

3\. 往下推演:内容行业会发生什么

技术门槛消失,产能就会爆炸。这是一场内容行业的生产力革命——小作坊也能做出电视剧和电影级别的内容了。

推演下去,一方面是利好抖音、番茄这些平台。大量的电影、动画片、电视剧,内容越来越好,用户的阈值越来越高,越来越沉迷。但另一方面,内容创作者会面临前所未有的内卷。

跟朋友晨然讨论,这有点类似于当年流行音乐爆炸的过程。以前大部分人听的歌是同样的歌,就像以前大部分人看的电影是同样的电影。后来流行音乐产能爆炸了,大家听的歌都不一样了,头部爆款不再出现。

其实自媒体已经让类似的变化开始了——以前是电视的大众明星,现在是很多小博主。现在AI带来的这波生产力革命,真正让电影级的内容也走向碎片化和去中心化。

但这里有一个更根本的问题——现代人已经越来越无法集中注意力了。甚至连电影学院的学生都没有办法坐在教室里看完一整部电影而不去刷手机。这个现象越来越普遍。当观众变了,电影这个东西可能就不会再维持现在的形态。

所以最终受益的可能还是做供给、分发、消费的内容平台。只要视频这个媒介、这个载体不变,最后获利的一定是载体背后的平台。现在的短视频形态有可能已经接近终局了,但我希望看到一种新的内容平台形式。

对创作者来说,技术门槛消失之后,考验的是你到底要拍什么、给谁看。审美、创意、故事——这些底层的东西不会变,反而因为技术不再稀缺而变得更加重要。

二、应用层的机会地图

前面讲的是模型两条线各自的进化——大语言模型从推理到agent team,多模态从单点突破到技术门槛消失。这些变化落到应用层,具体在哪些方向形成了机会?

这里不是全局扫描,更多是基于自己关注到的几个方向,大家也可以跟自己关注的地方做一些对照。

1\. 生产力Agent:最明确的主航道

Agent是今年最明确的主航道,也是机会最多、团队最多、钱最多的方向。

通用agent这边,从去年的Manus起来,到现在的Claude Code、OpenClaw、Claude Cowork,国产的有阶跃的桌面助手、Cherry Studio等等。这是一个非常共识的赛道,所以也会非常拥挤,但它可能会成为一个偏入口级的机会。

按照前面的逻辑,很多工作任务都会被agent完成,那么我们每个人都会需要一个自己的agent——它拿到你的context、你的意图、你的偏好,然后带领一堆工具和服务帮你去做事情。这个地方大厂、创业公司都不想放弃,尤其是Manus被Meta以几十亿美金收购之后,完成了从idea到落袋为安的闭环,会有更多人进来。

垂直agent是我看到机会最多的方向。因为这个世界上有多少个岗位,可能就有多少个垂直agent;有多少行业就有多少个agent。招聘、调研、旅行、催收、合规、猎头……这些垂直agent的流程相对明确,数据也比较明确,AI提效之后带来的收益很直接。

很有意思的是,美国这波AI创业,C端跑出来的其实不多,大量都是B端的机会。这些垂类agent的ARR增长非常快,做起来也没有那么难。甚至资本会大量收购传统的中介agency,他们有渠道有数据有know但受限于人力,比较难规模化,被收购后,通过AI进行改造,规模迅速扩大,虽然天花板不一定高,但是是明确的收入。

这里有一个认知上的转变:过去我们做的很多agent,本质上是在补模型的不足——模型不够强,就用agent的脚手架去弥补,做的都是些非常工程基建的事情。但现在模型变强了之后,你应该做一些更大胆、更有想象力的事情,而不是还停留在补丁思维里。但这个其实很难,现在往前看可能还是一片迷雾。

Agent infra是新的基础设施层。如果agent变成入口,那怎么服务这些入口?过去抖音是流量入口,你在上面供给内容和商品。现在AI变成入口,它是要干活的,所以供给不一样——不是娱乐视频,而是工具、服务和数据。

具体来说:

  • 怎么给agent提供数据(API vs 爬虫,各有各的问题)?
  • 怎么提供更好的工具(agent用的工具跟人用的软件不是一回事)?
  • 怎么处理context(比如最近GitHub前老板出来做了Entire,用Git协议协助agent做coding的context处理)?
  • 怎么做memory?

这些都是agent的infra,有很多机会,但门槛也有一定要求。

这里有一个关键认知:不同行业之间的差距极大。Coding领域agent已经极强了,但很多传统行业连基建都没有。我最近去一些企业做咨询,发现他们很多任务其实可以被AI完整地很好地完成,但他们不知道,顶多问豆包。

比如帮金融、律师行业做咨询,我做的事情就是帮他们装一个Claude Code,然后把文档文本任务按需求让Claude去干。大家看到结果的时候是真的震惊——震惊到他们开始认真思考怎么裁员了。

你可以这么想:大厂已经是人才密度最高的地方了,但你经常会发现身边很多同事其实没那么聪明。那再想其他行业,人才密度是没有那么高的,老板很难给出大厂一样的工资,人才就不会那么好,干活经常让老板不太满意。AI在任务层面已经可以比很多行业的大部分从业者做得更好了,但这些行业不知道,信息差意味着很多机会。

2\. AI互动平台:寻找消费侧的增量

前面agent更多是在供给侧——生产力带来生产关系的变化。但更大的机会照理来说应该在消费侧。消费侧带来极大的增量之后,又会在供给侧引发更大的增量,这是移动互联网验证过的逻辑。

但我们目前在AI的消费侧还没有看到一个超级大的机会。类似微信、抖音、美团这样的平台级机会还没出现。我目前关注到两个方向。

第一个是AI陪伴。22年Character.AI就做出来了,当时数据极好,后面又下去了。字节做了猫箱,MiniMax做了星野,但好像也没有做大。我不是目标用户,没有直观感受,从产品经理的视角,之前以为这个赛道不太成立了。

但其实现在有非常多AI陪伴类的小应用,生意非常赚钱——小而非常赚钱。我了解到乙女陪伴类的付费率是20%-30%,这是超乎想象的,移动互联网时代超过5%就非常了不起了。

不过合规是个问题——做大了就要合规,合规了就容易变得无聊。所以现在是大量的小的机会,很多极小的团队在做,能养活团队、能赚钱。

第二个是AI互动——可以理解为在博一个更大的机会。不恰当的比喻,这是做AI版的抖音,目前看到天使轮超过1000万美金的非模型公司,大概率就是在做这个方向。

这里涉及到几条技术路径。一种是做实时视频生成。异步生成(像Seedance那样写prompt等结果出来)还是在抖音的短视频范式内,但如果生成速度足够快,零点几秒就出来,那就变成实时了,可能催生全新的交互方式和平台形态。另一种路径是通过AI coding来生成——比如最近的Loopit,写个prompt直接生成一个可以玩的小游戏。

从我对模型的推演来说,纯粹的多模态生成效果天花板应该更高,但时间还没到。最终出来的形态是直播、游戏、短视频,还是他们的综合,目前还不清楚不知道。大家都在探索,故事都好讲,但最难的是上手玩好不好玩。用户不为故事买单——就像最开始抖音大家也觉得就是一个一阵风的小东西,但它好玩、简单好玩。

3\. AI硬件:context的物理入口

AI硬件也是我聊了一些团队后觉得很有意思的方向。

Plaud的成功是个标杆。现在一年大概2-3亿美金收入,而且是盈利的。它做的事情非常简单——手机背面贴一个像充电宝一样的录音壳,想录的时候直接一按就好了,不需要你打开一个软件再去操作。硬件在获取物理世界的context,以及在用户交互的简单性上有极大的优势。

而且Plaud打了一个很好的样——AI让硬件从一锤子买卖变成了订阅制。它的软件付费率和续费率非常高,对营收的贡献极大。所以带动现在大量的人在做语音转录相关的AI硬件。

还有视频领域的可穿戴设备。美团出来的孙洋做了Looki,挂在身上,全天候把你看到的context记录下来,然后给agent做分析和记录。字节背景的潘宇扬做了OdyssLife,一个项链,有摄像头,拍摄你吃饭的内容做营养分析。

这些都是在用硬件帮你收集真实生活的context——因为AI很多时候表现不好,是给的context不够,目前主要依赖人的prompt和电脑里已有的文件,这些context相比用户的真实生活中,其实还是非常不够。

还有一些展示和交互类硬件:智能镜子做美学分析,客厅屏幕展示AI管理的日历,挂画把亲人照片生成写真还能聊天。这些东西不难,但卖得还挺好的,用户付费意愿比软件强很多。

AI硬件的门槛和机会在于:做AI的不懂硬件,做硬件的不懂AI。大疆这种硬件巨头,很多对软件的理解比互联网要差非常多。两者结合有天然的壁垒。做几台demo,做1万台试水,做10万台量产,对供应链要求完全不一样,对团队的要求也不一样,这个圈子不是你随随便便跑到深圳就能进去的。

如果你有硬件的经验和供应链的资源,可以考虑做AI硬件,尤其是做出海——美国人是很难做硬件的,因为深圳在中国。

三、个人在这个时代如何不掉队

前面讲的是趋势,接下来讲大家最关心的——在这个大的局势下,你应该怎么办?

先总结一下前面的趋势:AI在吞噬工具,也在吞噬工具人。

你来想一下,假如你现在做的事情,很多任务是不是可以让Claude Code帮你完成?它完成的效果是不是还不错?如果你的大部分任务都能被完成,那你就处于一个比较危险的位置。

以及,我们身边的很多同事,说实话很多公司里面存在大量的工具人。每个公司的老板都不希望组织变得臃肿——增加一个人的成本不只是工资,工位、社保这些都是显性成本,更重要的是隐性的管理成本:管10个人跟管100号人难度完全不一样。如果AI逐渐在任务上完成得更好,组织就会变得更加精干。这对老板来说是好事,对打工人来说可能就是个坏消息。

有一个判断方式:如果你的工作过程数据已经线上化,AI大概率会干得比你更好。程序员最先受到冲击就是这个原因——代码全都在线上,AI把这些数据一学就可以做得比大部分人更好。关键就在于数据是模型进步的最大要素。

人跟人之间的差距会急剧拉大。以前手搓代码的时代,程序员之间差距两三倍顶天了。但AI时代,可能是几十倍甚至上百倍的差距——这个差距在大厂里你看不出来,出来了才能感受到。

我前段时间认识一个人,他同时让30个agent帮他写代码,内存买了128G,因为16G根本不够用。每个月在Claude上的支出是几万块,一天能发布十几个版本。字节已经算移动互联网里面非常快的了,一周一个版本,但人家一天十几个版本。

用AI已经不是用一个工具了,而是在驱动一个团队帮你干活。那谁用AI用得好?我观察到两类人特别突出:一类是非常年轻的人,没有包袱,本身就很AI native;另一类是做技术leader的人——懂架构同时也懂管理,驱动AI干活的效果就非常好。

AI会变得极强,成为很厉害的放大杠杆,但对人的要求也越来越高,人+AI带来的产出差距也越来越大。

还有一点:个人喜不喜欢,在这个时代还是挺重要的。变化太快了,有很多机会来,如果你不喜欢,硬卷也卷不出来。不是所有人都要往同一个方向卷,找到你自己有热情的切入点,才能持续下去。

1\. 大厂:去高浓度AI业务

如果你在大厂,我的建议是尽可能去AI是核心的业务团队。字节的豆包、剪映、Coze、飞书里的AI业务,阿里的千问,腾讯元宝这些。虽然这些地方也会很卷,也可能很乱,但你在一个AI是业务最核心的团队里,能拿到更多的信息,AI上的共识更容易达成,实践机会更多。

如果你过往没有很好的AI背景,我非常推荐去这些业务。熬撑至少半年或一年,你会比在一个传统业务里自己琢磨有效得多。

进不去核心AI业务怎么办?你要尝试在自己的业务里做一些AI项目。这个很重要——如果你不做,首先你是没有认知的。你会看到大量信息,包括今天我分享的这些,但这些不是你自己的信息,对做决策没有太大帮助。有点像读书的时候上课听了都会,一做题就不会了。看遍巴菲特、查理芒格的书,但自己不在股市下注,永远学不会投资。

还可以自己做side project——帮业务提效,或者自己觉得好玩就做。看AI信息、自己build产品、做一个有规模的AI产品——这三个层次对人的认知要求完全不一样,不是只做一个就够了。

移动互联网已经没有新故事了。去年的外卖大战算是最后一波回光返照,已经没有任何新的东西了。现在的共识就是要去做AI,AI又是一片蛮荒,很多领域刚刚开始。能做AI就去做AI。

如果考虑城市选择:深圳偏AI硬件,杭州偏AI做生意类的,上海偏大一点的AI业务,北京偏模型和应用。不同城市的AI生态差异很大,选对城市也是选对生态。

2\. AI初创公司:一个非标准化的世界

如果在大厂核心业务进不去、自己业务做AI方案也做不出东西来,可以考虑去AI初创公司。但大部分人没有AI初创公司的经历,可能会踩一些坑。

我讲几个简单的判断标准。

第一个:这家公司有没有提供无限量的token?如果不提供,说明这个公司不是AI native的。无限量token非常贵,但如果它是AI native公司,这些token可以转化为公司的效益,所以它才愿意提供。

第二个:梯子挂了,这个公司能不能正常运行下去?如果所有人都发现没办法干活了,说明这是一个非常AI native的公司。

求职方式跟大厂也不同。不一定是标准化的写简历投递走面试流程,可能是熟人介绍、信任背书,或者你的作品背书。人的介绍很重要,因为在更不确定的更开放的阶段,对一个人的人品和综合素质要求更高。简历会骗人,面试也会骗人。GitHub主页或side project可能比简历更重要——因为创业公司做的事情跟大厂太不一样了,你在大厂投放系统做得多精细,不一定有用,后面那些系统都没有。

AI初创公司的真相是:外面看起来很高端——Meta、Google、字节背景,但实际上也很草台。有很厉害的地方,也有很粗糙的地方,这是一个更加真实的状态。大厂有很多标准和流程,让你很难受,但实际上它保证了你的下限。创业公司没有这些流程,人就变得特别重要。

日常也完全不同。大厂里一天可能有20个deadline追着你,但创业公司有时候一天只做两件事,有时候又忙到疯。没有"价值证明",没有"没有问题要制造问题"。节奏感跟大厂完全不一样,有的人会不适应这种"没人管你但你必须自驱"的状态。

薪资不一定降。现在有些字节系出来创业的,融的钱很多,你甚至还能涨薪,但大部分可能是需要降现金换更多的期权。期权大部分情况下是废纸,公司上市或被收购,概率极低,可能1%都不到,像字节、小红书这样有回购的也极罕见。但你收获的经验和成长速度是真实的——因为你在做大量你没做过的事情。

3\. 创业:拿钱相对容易,团队最难

现在拿钱是相对好拿的时候,VC依然有FOMO的情绪。如果你有一定履历,比如在字节的剪映、豆包、抖音这些好的业务,加上你的事情想清楚了——有一定的天花板,故事不错,有靠谱的切入点——那钱是好拿的。

如果拿不到红杉、高瓴、IDG这些机构的钱,可以先做一轮亲友轮。跟认识的人、信任你的人说你想做什么,大家觉得可以就投个几万或几十万,当打交个朋友,钱就是打水漂的心态。但如果成了,这几万块可能拿到了1%的股票,后面拿到机构的钱就翻了几十倍上百倍。亲友轮几十万其实够做出一个demo了。

但最难的是团队。互相信任、彼此互补——这8个字我有极深刻的感受。没有信任的话,遇到困难一下就分崩离析了。如果按大厂里那种关系——大家都防着彼此——是不可能一起创业的,一遇到问题就甩锅。

怎么找co-founder?最靠谱的方式是找以前合作过的人——字节的人找字节的熟人,腾讯的找腾讯的,或者找你在项目里配合过、知道能力项和人品的人。只有真正一起干过活的才知道对方到底行不行。

但也要注意:很多早期"元老"过了5-10年可能能力跟不上了,上下铺兄弟、室友同学不一定是最优选择——找人要看当下的能力匹配,不是只看关系远近。

方向大概率会换。你看到很多AI公司产品做得挺好,但实际上之前已经换了好几个方向了。这不是例外,是常态。张一鸣最开始也换了好几个方向。

Founder的核心工作:找钱、找人、找方向、为团队降噪。因为团队会拿到很多噪声,你要把它收敛下来,让大家在一个特定范围内好好做事情。另外founder会非常孤单——压力太大只能跟下面的人讲的话,人心就慌了。最好有自己的founder圈子,很多你遇到的问题网上没有答案、AI也没有答案,问一下可能就知道了。

如果要选,一定要出海。国内人穷企业穷,大厂又太强,做国内非常艰难。出海这个世界很大——美国搞不定还有东南亚,东南亚搞不定还有拉美、中东,还有日本(人多钱多)。能拿美元拿美元—,国内有些VC的钱附带比较苛刻的条款,本质是债不是投资。

4\. 一人公司:小而美的可能

一人公司现在很火,但已经被有点神话了,需要真实看待。

首先你要有build的能力。Vibe coding + 工程化 是必须掌握的基本技能。有了这个能力,你可以做一些小生意——有很多小需求,对公司来说不值得做,但对个人来说已经足够了。比如月赚几千到1万美金,在大厂里面多少人月薪能到1万美金?没多少的。

具体形态:小工具、小插件、AI工具导航站接Google Ads赚广告钱。跟大厂做的事情完全不一样,我自己也不太擅长。因为我们太习惯依附一个大体系做宏观的、大的生意了,这种小的要么看不上、要么不知道怎么做。它其实没有那么难,但关键是你要挖掘到那个需求点。

品牌和自媒体非常重要。现在AI coding起来之后,很多工具的门槛极低,大家可以快速复刻。有多夸张?你做一个APP出来,已经有专门的agent可以两三天就把你的APP复刻出来。那为什么人家用你的?因为你有品牌。有时候内容就是品牌,做产品的同时做自媒体——产品不一定赚钱,但通过影响力可以触达更多人,甚至卖课也可以赚钱。

为什么自媒体在AI时代变得更重要?因为供给侧门槛降低之后,产品本身的壁垒越来越弱,内容就是品牌,品牌就是影响力,影响力就是你在注意力经济里的杠杆。创始人做自媒体,那你自己就为公司剩下一笔推广费。做内容关键不是每篇输出精品内容,而是持续做——持续输出本身就是一种筛选和积累。做一人公司一定要做自媒体,这可能说得有点绝对,但非常非常重要。

四、能力转型与冷静判断

1\. 每个岗位都需要的四种能力

很多人问我:AI时代,设计师怎么转?运营怎么转?产品经理怎么转?测评做久了会不会变成工具人?

大家都逐渐看到,AI时代岗位的边界在模糊。同一件事,算法、产品、设计、运营其实都能干;也有的事,目前谁都干不好,都在边学边干。

那什么能力是共通的?我总结了四个:

第一,Build的能力。至少能做出demo。过去的专业积累门槛太高了,限制了大家。但现在这个门槛降低之后,一些底层能力更好的人反而会脱颖而出。

第二,对模型的理解。模型是什么、能做什么、不能做什么、怎么让它表现更好。这个认知不是看几篇论文就行的,要上手去用。

第三,对用户需求的理解。无论产品形式怎么变,满足用户价值这个本质没有变。需求是什么、用户是谁、怎么满足、怎么归因、怎么优化——这些没变,只不过一些具体技能变了。

第四,对行业趋势的把握。信息获取和判断的能力。大厂很容易形成信息茧房。你身边都是算法研究员,你可能不知道这个世界有多大的参差不齐,不同行业的差距是非常大的。能看到不同世界之间的差距,本身就是一种稀缺的能力。

关于测评这个问题很多人问到。测评是非常好的AI产品入门,是基本功。但如果你长期一直只做测评,从实际来说会变成工具人。模型越来越强,强到你不一定能评测出差异是多少——现在已经是这样了,很多时候你得用非常难的任务才能区分差异。测评是入门,但最终你还是要往业务走——这个应用怎么变得更好、更多用户、更好的留存和付费,你能带来什么贡献。

2\. 几个冷静的判断

最后讲一些相对冷静的东西。在FOMO情绪之外,需要一些更接近真实的判断。

裁员不会一夜发生,但招聘会持续收紧。不会是一夜之间大裁员——当然现在也有亚马逊一夜裁员上万人之类的——但从更大面来说不会这样。它对很多公司来说就是不再倾向于招那么多人了,会招更少的人。对个人来说就是工作更难找。

大家可以问自己:大厂那么多年薪百万的人,你实际做出的工作产出,投入的精力有多少值得年薪百万?大部分人做的事情其实非常单薄。我们应该让AI帮做那些机械性的工作,自己去做更有价值的事情。一个业务里真正提供核心价值的人没有几个,大部分人做的都是基础工作。

Agent盈利目前困难,但趋势向好。为什么难?因为agent太贵了,token消耗非常高。但模型成本在下降,三年来百万token的成本下降了多少大家有目共睹。芯片、存储、电力、数据中心都在快速铺开。

这里涉及到定价逻辑的转变——到底是基于工具定价还是基于人定价?工具逻辑是几美刀或几十美刀一个月,但现在已经出现几千美刀的月消耗了。几千美刀其实是人的逻辑——同样的价格,如果你觉得它是工具,50刀好贵;但如果是一个人在帮你干活,100刀200刀都不贵。

成熟组织的AI提效收效有限。在一个非常成熟的组织里,分工已固化,流程已锁死,每个环节的要求都已经固定了。你会发现跟AI很不match。有效的方式是做一个封闭的AI项目,在这个项目里每个人的边界被打破,大家都做一些各自不擅长的、不确定的事情。

这里有个很有意思的规律:当你做的事情你不擅长时,你会更加依赖AI;当你做的事情你很熟练,你就会觉得AI不大行。所以要让自己进入不舒适区,你才会真正体会到AI的价值。

如果你是管理者,想让团队用上AI,最好的方式非常简单——给想用AI的人无限量的token,就够了。Token确实很贵,但用起来才有感觉,让一部分人先用起来,然后带动其他人。这是成本最低、效果最好的AI培训方式。

认知的获取只有通过付出成本的决策。看资料、听分享——包括今天这篇文章——你投入的成本太低了,投入几十分钟、几个小时就结束了,所以吸收的信息非常浅。如果你的成本是因为做错了决策导致用户流失、数据下跌,那你就会真正去思考最本质的东西。

写在最后

这是一个比移动互联网更快的浪潮。

我问过一些经历过移动互联网和PC互联网周期的人,他们都说AI这波比之前两个大浪潮都要更快、更可怕。共识形成的速度也在加快——从半年到一两个月、到一周,现在有时候几个小时就达成了。

短期我们可能高估了AI,因为整体的FOMO情绪非常严重,这会带来割裂感。中期我们大概率是低估了AI。长期我不知道这个社会会变成什么样子。

AI的渗透极度不均匀——coding领域已经翻天覆地了,但很多行业还浑然不觉。这既是割裂感的来源,也意味着有大量的机会。

总结一下,对于我们个人来说:

  • 尽可能去高浓度AI业务,或者在自己业务里做AI项目
  • 如果在大厂做不了,可以考虑AI初创公司,但要理解它的非标准化
  • 如果想创业,拿钱相对容易,但团队最难——互相信任、彼此互补
  • 如果做一人公司,build能力是必须的,品牌和自媒体是杠杆
  • 无论什么岗位,都要有build能力、对模型的理解、对用户需求的理解、对行业趋势的把握

奇点临近,浪潮已来。与其焦虑,不如构建自己的认知框架,找到自己在当中的位置。

说一句诚实的话:我做了三年AI,之前做的大部分东西现在回头看都没什么意义了。但不要紧——你的认知是真实成长了的,每个阶段都有每个阶段的活。如果你想着"我现在做的东西就是终局",那心态就不太对了。接受过去的工作会被淘汰,然后继续往前走,这本身就是一种能力。

AI作为生产力的变革,会带来极大的繁荣,但也可能带来短期的技术阵痛,不确定短期是3年还是10年,要么拥抱这波红利,迅速起飞,要么就要撑到足够久。

吃好喝好,活下去最重要。