经纬张颖:AI的远与近

来源:混沌学园   2023-07-11 14:51:37

AI可以被定义为是变革性的风口。


(资料图)

今天大会的主题是AI,没有想到有一天我会在混沌的平台上讲AI。有点意思的是,我之前还在说,在语言概念上,“混沌”可能正是当下市场在接入AI 以后呈现出来的那个最初形态。

我们知道,凡是一定数量的个体都拥有一个共同的名字,它们就有一个共同的“理念”或者“形式”。我们用这个同一性质去统领形态各异的东西。比如白猫黑猫都是猫。但是AI非常复杂,好像还很难用一个同一性去表述它,它可以是模型、算法、手机上的APP应用,也可以是一个具体的机器人。所以AI兴起之后,有很多哲思的东西变得很微妙也很有新的趣味。

回到我们风险投资机构,我们定义一个概念,或者大家感兴趣的,我们定义一个风口,是一时的还是变革性的,它的理念就在于它是不是一个孤立的赛道,还是能带动一整条产业链的,比如智能电动车,就带动了动力电池、汽车芯片、自动驾驶等等方向,所以我们才称之为是变革性的风口。AI在这个理念上,它具备变革性风口的形式特征:包含了基础设施层、模型层和应用层,每个方向上都有颠覆性机会。

作为一个应当算是资深的投资人,面对一个新兴赛道,我也会感到“混沌”,所以我这十几年来基本建立了一套以学习、交流为核心的反馈纠错机制,去对一个赛道进行学习和思考。但是这次的AI,迭代实在太快,让我多少也会感受到学习上的焦虑。我印象非常深刻的就是今年3月的第三周,连续出现了GPT-4、百度文心一言、Microsoft Copilot、斯坦福大学的Alpaca 7B、清华大学的ChatGLM-6B……那段时间,你我应该一样,我们的朋友圈都被AI刷屏了。

带着被动的焦虑和主动的渴望,最近几个月我跟60多名AI领域的创业者,或是准备把AI切入自己业务的高管进行了密集的聊天,多多少少也有一点思考和判断,今天在这里分享给大家。虽然站在三年后看不一定都对,但还是希望能给大家一些启发。

一、对AI发展的一些判断

1. 对AI发展的态度,不FOMO,也不JOMO

今天人工智能很多能力的涌现,不是从去年底ChatGPT出现才开始的,而是从2017-18年就开始的新一轮数据和算力革命,是技术累积的量变到质变。

先说说我们的态度,我们既不会因为FOMO而仓促出手,也不会因为JOMO而过于保守,科技行业的投资就是这样,太JOMO了会错过科技大浪潮的板块性机会,太FOMO了又可能会被泡沫反噬。

相比美国OpenAI+微软+英伟达的模式,中国最终能成功的大模型公司,不管在联盟、商业模式、C/B端收入贡献等方面,都会有很大的不同,未来发展需要时间。

我一直在内部强调要“喧杂中冷静,冷静中持续激进”,有必要分清楚什么阶段是风口,什么阶段是价值。整体上,我们觉得这是一条长期之路,如果拿移动互联网的黄金十年来比较,最优秀的公司其实成立于2010年之后的3~4年内,现在AI才刚刚开始。

2. 可能成功的AI公司,都应该打造自身的数据飞轮

对AI产业链的一个经典划分,是基础设施层、模型层、中间层和应用层,应用场景的横向划分可以主要分为ToC和ToB。在当下,我们认为未来真正能出现一家AI新公司,去挑战现有巨头,还得是敢于从ToC场景里寻求突破的,因为C端能带来的数据飞轮效应,可能是在AI早期决胜的关键。

不知道大家有没有注意到,现在最头部的AI公司比如OpenAI、Character.AI,都是既做模型又做产品,这与移动互联网非常不同,LBS、4G/5G等移动互联网的基础技术,和上层应用比如淘宝、滴滴还是相对分离的。

这不是一个偶然现象,是市场发展阶段导致。AI确实还处于早期的技术创新期,这个阶段的典型特征是需要用技术来驱动产品,比如ChatGPT的创新之处就是用一个聊天界面,直接将大模型触达用户。这是在技术渗透S曲线的早期,需要通过不断提升技术效果,才能够把产品做好,逐渐接近渗透率大幅提升的临界点。在这样的阶段,数据飞轮就变得无比重要。

我前几天和Moonshot AI创始人杨植麟交流,他认为最好的情况就是模型不断为用户提供服务,然后用户不断为模型生成新的数据。Midjourney一个很成功的地方是,它在自己最核心的流程中嵌入了用户反馈,因为每一个用户都必须强制在AI生成的4张图里,选出最符合自己预期的1张,这就是一个巨大的数据飞轮。而对ChatGPT来说,虽然也有这样的反馈机制,但并不在其核心流程里。

所以在产品设计上,如何形成反馈闭环非常关键,数据飞轮会不断优化模型能力,这种差距最终会决定能给用户提供多少价值。无论是ToC或ToB的公司,打造反馈闭环、形成数据飞轮也是理所当然的一个选择。而对一些从零开始的小公司,这件事可能会很难,但也因为你们没有包袱,所以也有机会。

3. 有专业壁垒的垂直模型也许是机会所在

前Google创始人Eric Schmidt有一个观点,他认为未来会是多个垂直模型或者多个垂直助理,包括各种高价值、专业化的AI系统。这是因为很多高价值、特定领域的工作流程,特别且必须依赖于丰富的专有数据集。比如彭博最近推出了Bloomberg GPT,彭博就是把模型做小,参数量在50B左右,相比于GPT-3的175B小了很多,虽然削弱了通用性,但在金融领域就是更强。

在国内AI与产业融合节奏上,也会有一些特有的机会,特别是在实体经济、先进制造、智能驾驶等领域,国内的发展有可能会更快,会出一些更创新的模式、应用场景,大概率政策的支持也会非常明显。

AI时代可能会颠覆SaaS时代的很多想法。我们在当下会去看一个AI应用有多少是GPT等大模型的能力,有多少是自己的能力。如果壁垒太低,很多产品可能活不过GPT的一次迭代升级。我们也在不断地思考哪些是新观察点。

在这场AI的浪潮中,我们多重视数据的重要性都不为过。因为,从全球来看,数据都在变得更稀缺。根据一篇联合研究《Will we run out of data?》,由人类原生的数据,未来可能会越来越稀缺,而高质量的自然语言数据,最快可能在2026年就会被大语言模型耗尽。

这意味存量互联网的数据有限,对于国内的相关公司来说,大家也许会先达到一个标准水平,但之后如何改进,就要看怎么能持续获取合法合规、合商业逻辑的数据源,真正的价值会变成可持续性的高质量数据。基于此,国内的大模型公司与各行业原始数据源头部公司的合作、绑定,可能会更深、更平等,甚至在某些领域数据源会更强势,这种背景下,大概率会出现不同角度、立场、行业为主的大模型公司,模型+算力+数据+场景,将是成功公司最本质的四个维度。

4. 大模型产品的两个方向:个性化&场景化

如果我们再看远一点,大模型产品的下一步可能是两个方向:

个性化:给它装上“记忆”。

之前大语言模型一个缺失的地方是,它缺乏记忆更新,每次当你重新打开ChatGPT,它并不记得你们的上一次对话。有些AI公司正在这个方向上寻求突破,比如估值10亿美金的Character AI,和估值3.5亿美金的Rewind。

在我们接触的AI创业团队中,不少团队都希望产品有记忆能力,并且带来用户的个性化。由于包含人类的情感,对你需求的理解,对你个性化的满足,这是AI比以前移动互联网时代更进一步的革新,令AI可以真正成为人类的工作助理或是陪伴者,这也带来了AI Infra比如向量数据库的机会。

场景化:给它装上“手”和“眼睛”。

如果你觉得ChatGPT只能问一些问题,还干不了太多事,那你需要去试试OpenAI Plugin,这是OpenAI新推出的一个应用商店,上面几百个插件涵盖了衣食住行、社交、工作学习等各种日常所需场景,可以说是给大模型装上了“手”。

比如一个叫Klarna Shopping的插件,它的功能是比价,你只需要输入问题:“请比较不同购物网站上索尼单反相机的价格”,ChatGPT就能给你答案。再比如KAYAK,它可以实时搜索航班、住宿和租赁汽车信息,根据你的预算提供旅行推荐。比如订酒店,你只需要问它:“请在纽约现代艺术博物馆附近找一家预算为每晚300美元的酒店。”

OpenAI正沿着类似苹果“硬件+App Store”的模式,迈向更高的战略系统地位,看到OpenAI Plugin上百花齐放的App,是不是有点类似曾经移动互联网创业的感觉。

而“眼睛”,则是多模态,我们日常不仅仅是通过纯语言来交流,通过眼睛获取的信息比例非常高。像漫威电影里贾维斯、《光环》游戏里的科塔娜那样的高级AI,需要多模态的介入,这是重要的发展方向。

要想装上“记忆”、“手”和“眼睛”,离不开大模型成本结构的下降。我们看到今年4月之后,训练+推理成本都在迅速降低。而中国创业者一向在应用层会有很好发挥,在未来半年到一年,将以月为单位出现更多应用创新,我们也会很关注在技术和产品上领先的团队。

二、AI的冰与火,实践尝试的意义永远大于坐而论道

一个我被问到过的小问题,但我认为很有必要拿出来聊一下。这个问题是:“现在AI看似很热,但好像大多都是在讨论、在聊、在分享,而实际真正使用和应用的并不多,你怎么看这个问题?”

我想先举两个很有意思的数字对比。一个数字是从今年3月到5月,召开业绩电话会议的标普500指数的公司中,有110家公司的高管提到了AI,这是过去十年的3倍。另一个数字是摩根士丹利最近做了一个2000多人的调研,结果竟然是有80%的人没有用过ChatGPT或是谷歌的Bard。

大家发现这两个数字的对比,有意思在哪里了吗?显然,摩根士丹利调研的群体,大概率就是在这一轮热潮中讨论过、分享、演讲、提到过AI的那群人。而这不是个例,现实世界的情况,应该和这组数字对比的体感差不多,一面是大家都在谈论AI,另一面是真正用过AI产品的人不多。

一个可能的原因是当前那些动不动十几亿美金估值,成千上万块GPU的故事,大量的专业词汇,都显得过于高大上了,一下拉远了我们和AI的距离,让我们敢于谈论,但怯于实践。所以,AI真的离我们这么远吗?

事实上,AI正在很多地方发挥实际作用,我特别想举几个很接地气、有意思的小例子,来给大家一些直观感受。这些例子的意义和价值,就是让我们各位有意参与的创新创业者,亦或可能的个人和企业用户,可以更加积极地投身到AI实践当中。

1. 通过拥抱AI而获得实际的数据增长:Notion和Character.AI

Notion是一家十年前成立的公司,我不知道在座的各位同学有没有使用过。它是一款个人笔记软件,可以用来写博客、社交媒体文案、会议纪要、工作邮件等等。在去年底第一波接入ChatGPT后,这个产品一下子引爆了,因为它上述的这些功能与ChatGPT融合后,生成的内容只需要简单修改就可以直接使用,它的应用场景被大大简洁、高效、强化了。

这种应用场景的实现,直接的结果就是Notion只用了一个月就做到了1000万美元ARR收入。

Character.AI也是一个很有意思的应用,它是一款基于AI大模型的聊天机器人。相比ChatGPT和New Bing而言,记忆功能是Character.AI一个很强的特点,ChatGPT在你下一次跟它开启聊天时,是不记得上一次你们聊了什么,但Character.AI记得。所以,你可以在上面创建和训练自己的个性化人工智能,也可以选择已有的公共虚拟角色,比如埃隆·马斯克、苏格拉底等等,你可以和马斯克聊火箭,可以和苏格拉底谈哲学。

这种应用场景的实现,直接的结果就是在移动端不到一周的时间内,被下载了170万次,是ChatGPT 3倍多,在4月有接近2亿的访问量。不仅增长很快,用户在Character.AI上的停留时间也很长,每次访问时间达到了25.4分钟。

这在未来,也指向了有一定角色意识的虚拟人,虽然伦理上可能还有一些问题,但离实现并不远,通过软硬件的结合,会有很大的想象空间。

2. 专业化、垂直模型的先行场景:DoNotPay和法律应用

由于大模型在文本处理方面是最成熟的,所以在文本很多的法律行业有天然优势,这在海外已经被验证。

美国有一家叫DoNotPay的热门公司,它主要提供针对“小官司”的AI法律服务。对于很多小事,大家往往也不会去打官司,因为性价比太低。DoNotPay利用AI将整个法律流程数字化,个人很容易操作,并且只收取少量费用。比如你想停掉健身房的会员费,在美国很多地方都缺少人工客服,而且需要很繁琐的手续来退费。用DoNotPay,就可以帮你找到正确的联系方式,写完备的申诉邮件,帮你退费。而这种场景只是DoNotPay上百个帮人解决切实痛点的法律场景中的一个而已。

你可能说美国和国内不同,那再举一个国内公司在法律领域使用AI的例子。我们有一家食品消费类被投公司,他们就在法务环节用到了AI。他们的法务部门每天最头疼的事情,确认某种营销话术能不能对外说,这种判断在之前非常依赖于个人经验,耗时耗力,效率不高。他们用AI试了3~4个月,效果非常好,即便再经验丰富的人也很难达到AI的判断质量和效率。AI甚至能告诉你涉及哪些法律条文,以及曾经类似的判决案例是什么,非常便捷。

这些场景其实都非常普遍,只是我们还没有特别便捷的入口去应用,但这就是机会。

3. 虽然很小,但意义重大的例子:医疗领域的应用

再换一个更加普遍,但专业度可能更高的场景,我前不久看了一篇公众号文章,讲了一个美国急诊科医生的经历,他在凌晨3点治疗一位96岁的老年痴呆症患者,由于她的肺部有液体,所以呼吸困难。患者的三个孩子也都是70多岁的老人,他们也在急诊室里,情绪激动、言辞激烈,他们根据自己的经验开始不断提出要求,但这些要求实际上对这位96岁的患者是非常错误的。

由于还有好几个病人同时需要处理,如果这位医生去和这些70岁以上情绪不稳定的家属解释、争论,非常花时间并且影响治疗。这位医生给ChatGPT-4下了一个“为什么不能给严重肺水肿和呼吸困难的人进行静脉输液,并且用富有同情心的语言来解释”的指令。ChatGPT写了一篇非常好的回答,医生让护士把这篇回答念给这些家属,听了这篇有道理、有逻辑、有同理心的解释之后,家属们激动的表情融化为了平静的同意。

这个例子我印象很深,像急诊室这种时间紧迫的时刻,如果ChatGPT能为每位患者平均节省5分钟,每年急诊室就诊人数超过1.3亿人次,这意味着每年可以节省1000万小时的时间,即便我的这个计算很理想主义,但即便数字再缩小十倍,那也极为有意义。

这其实是一个非常小的场景,不涉及到付费和业务流程,但这就是拥抱AI最细的颗粒度。

4. 一些ToB场景的例子

刚才提到的基本都是ToC的例子,离大家都很近。而在很多ToB场景中,AI其实也在快速应用。

比如电商场景中营销物料的生成,质量上不会显著低于人工,但成本会降低1~2个数量级;在消费品行业,AI可以自动化生成多个专业级产品概念,供客户在产品研发初期选择使用,启发早期灵感;在人力资源领域,AI可以高效地根据HR的需求,自动化筛选某个岗位的所有简历,大大提升HR的工作效率;在编程领域,如今GitHub上有41%的代码是AI生成的,这个过程仅用了6个月……这些场景可能离在座的一些人相对远,但离一些人一定也非常近。

所以,回到这个部分的开头,为什么我说这个问题值得被拿出来聊一下?因为我们大多数人还停留在坐而论道的状态,我们热切于讨论和学习,因为我们有FOMO的情绪,但更有意义的可能就是去亲自实践一下,在生活中、在工作中、在产品中,去做一些尝试性的实践,这样我们才能真的不被这个新的AI时代所抛弃。

三、关于AI创业的几点建议

最后,主持人在大会上问我,“在经历过那么多次真真假假的风口后,你能不能给台下想拥抱AI的创业者一些建议?”

最近也有不少朋友问过我类似的问题,我也认真思考了一下,结合最近与几十位创业者的交流内容,我觉得不算建议吧,也是我自己在做的事情,供大家参考。

1. AI的学习和应用,大家一定注意,用起来、有效迭代大于一切。这点其实在刚刚的第二部分已经有提到。多说一句的话,一个简单的关键点就是要学会写提示词,知道如何提问非常关键,怎么能更好地与AI互动也是一门学问。

2. 大家可以尝试形成正确的底层工作逻辑,或者设计正确的AI改变工作生活的流程,按节奏确定目标和复盘。比如公司业务流程梳理,合适AI工具的使用,最合理合适的切入点。在自己的人脉圈,去找到最合适的人、公司、产品、服务,让自己都能真正意义上迭代认知。每个技术的演进,从开始萌芽到形成市场,都是有周期的,不同的时间点,不同的策略,不同的产品,不同的业务线渗透。创始人最怕的是弄错了所处的阶段、踏错了时间点节奏、花错钱。

3. AI浪潮在这个阶段,一定是技术驱动为先和定义产品为重的。未来的应用与模型能力结合更紧密,所以对模型的理解与差距,会决定产品与用户体验,有技术创新基因和能力的小团队,必须拼命奔跑。

4. AI创业,不但要能用好市面上的AI工具,更要从AI效率、变革的角度,去组织公司架构。更好地运用AI工具,一定会带来更高效的人均产出,AI时代如果还是落后的组织架构、人才密度,那说明创始人的迭代和对AI的真正理解都没有到位。

5. 如果你是在做ToC产品,那数据飞轮带来的正反馈效应非常重要。这个飞轮需要从第一天的产品设计里面就重视起来,更好的数据才能产生真正的飞轮效应。像很多我们看到的优秀的产品,不管是Character.AI还是Midjourney,他们的反馈机制设置都非常好。这个反馈会让你的数据飞轮形成正向的循环,不断螺旋上升。同时要重视产品的记忆性和个性化,这可能是AI时代最大的产品特性之一。

6. 在当下AI相关如此火的状态,也对创始人提出了更高、更全面的要求。创始人需要综合思考技术、市场情况、投资人预期、货币存量,这些因素都需要找到平衡点,并进行一定的前置预判,要能够综合把握自身和公司全面成长的速度,以及对各种风险都要有前瞻意识。

7. AI创业一定要把握好融资节奏。

这点需要展开说一说。目前的总体情况是,美国非常热,中国其实才刚刚开始。根据PitchBook Data的数据,美国在2023年前五个月,就有127亿美元的投资额,而去年全年也才48亿美元而已。最近最大的一笔融资是Inflection,13亿美元融资,估值40亿美元,而Inflection成立也就才一年半。最大的一笔收购也在最近诞生,Databricks以13亿美金收购了MosaicML,比其估值溢价了快6倍。

但对于国内来说,大家现在是看得多下手少,雷声大雨点小,为什么会这样?

第一点是在今天的大环境下,资金变得更加珍贵。对于创新型公司,特别是那些需要资金有很大容忍度,商业模式还没有被验证,失败率比较高的细分赛道的公司,今天市场上可以给到这些公司的钱,我感觉比3年前少了10倍。

第二点是从发展方向上来说,目前还比较混沌。市场上真正拿到融资的大模型公司不算很多,做中间层的稍微多一点,应用层更多些。从时间线来看,ChatGPT出现后国内也迅速跟进,大厂、科研院所、创业公司等等各方势力都很快推出自己的大模型,大家的目标都是要做中国版的OpenAI。而后来开源模型的发展,以及OpenAI开放API接口改变了很多,开源导致对自有大模型的拥有成本降低,开放接口使得在大模型之外,不少中间层、应用层的创业机会凸显。

所以,长期来看,我乐观地认为各个方向都有机会,只是现在还不是那么清晰,当然不清晰本身就是机会。那对创业者来说,无论是基础设施、模型层、中间层、前端应用,开源模型或闭源模型,都会各有各的场景与优势。当然,我个人的观点还是如前所述,最终国内最优秀的AI公司,极有可能是既做模型,又做应用的。

四、结语

总而言之,新事物出来往往会有两个极端,我们不要神化AI,但也不可忽视它。有用的东西终将会留下和发展,不以个人的意志为转移。

虽然现在大部分公司还没有通过AI产生可观收入,也还没有大量实践诞生,但一切都在紧锣密鼓地进行中,未来6~8个月是重要的窗口期。经纬的不少被投公司,也都在积极尝试,比如猿辅导在很多业务环节都在尝试切入AI工具;再比如幂律智能,他们与国内的大模型公司合作,共同训练了法律领域垂直大模型PowerLawGLM……我们正处于AI渗透商业的早期,很多产品还在研发和内测中。事实上,像我们的一些智能电动车生产公司,已经将AI应用在了包括制造、客服、营销等多个环节,它是一种生产力环节的渗透。

按照OpenAI创始人Sam Altman的说法,未来模型性能每18个月提升两倍。虽然目前AI还不能代替人,但我们能看到AI在各个生产力环节的参与,它降本提效的能力也会逐渐发挥出来,我们看到很多创业者都是无比兴奋的。如果我们想十年后,AI很有可能会消失于无形,渗透进我们工作、生活的各个角落,并改变世界,所有公司也都会变成AI公司。

最后我想到一个很有意思的话题,有人总是觉得AI如果发展得非常迅猛,它最后大概率会变成人类的灾难。但我之前和很多人讨论过这点,这个判断的前提其实还是从我们的一些固有观念出发去思考AI,认为它会对“统治、占有”这些人类根深蒂固的顽疾有继承性、一致性。但其实如果我们从另外的角度去想,也许AI的思维完全和我们不一样,它对这些也许根本没兴趣。

当然我的意思也不是说,在AI发展的过程中,我们不需要任何的监管或者警惕。相反,我觉得在初始阶段,对使用AI的人的约束和监管可能是更加有必要的。随着发展,再往后,我们需要的也许是跳出固有思维,也许AI最后会颠覆掉我们现有的观念也不一定。这点也许是我们今天参与这个新时代的人,最应该去拭目以待的事情。

但反正对我们做投资的来说,winning is so sweet because most of the time we lose,有这个心就好。

精彩推送