作者:Alex Xu,Mint Ventures研究合伙人
截止目前来看,本轮加密牛市周期是商业创新上最为乏味的一轮,缺少上一轮牛市DeFi、NFT、Gamefi这样的现象级热潮赛道,导致整体市场行情缺少产业热点,用户、产业投资和开发者的增长都比较乏力。
这也反映在目前的资产价格上,整轮周期来看,大部分Alt coins对于BTC的汇率持续失血,其中也包括ETH。毕竟智能合约平台的估值是由应用的繁荣程度决定的,当应用的发展创新乏善可陈,公链的估值也很难抬升。
而AI作为本轮较新的加密商业门类,受益于外部商业世界爆炸式的发展速度和持续不断的热点,仍有可能为加密世界的AI赛道项目带来不错的注意力增量。
而在笔者4月发布的IO.NET报告中,梳理了AI与Crypto结合的必要性,即加密经济方案在确定性、调动配置资源和免信任上的优势,可能是解决AI随机性、资源密集和人机难辨三个挑战的方案之一。
在加密经济领域的AI赛道,笔者尝试再通过一篇文章,对一些重要问题进行讨论和推演,包括:
加密Ai赛道还有哪些萌芽中,或将在未来爆发的叙事
这些叙事的催化路径和逻辑
叙事相关的项目标的
叙事推演的风险和不确定性
本文为笔者截至发表时的阶段性思考,未来可能可能发生改变,且观点具有极强的主观性,亦可能存在事实、数据、推理逻辑的错误,请勿作为投资参考,欢迎同业的批评和探讨。
以下为正文部分。
在正式盘点加密AI赛道的下一波叙事前,我们先来看一下目前的加密AI的主要叙事,从市值排序来看,超过10亿美金的分别有:
算力:Render(RNDR,流通市值38.5亿)、Akash(流通市值12亿)、IO.NET(最近一轮一级融资估值10亿)
算法网络:Bittensor(TAO,流通市值29.7亿)
AI代理:Fetchai(FET,合并前流通市值21亿)
*数据时间:2024.5.24,货币单位均为美金。
除了以上几个领域,下一个单项目市值超10亿的AI赛道会是哪个?
笔者觉得可以从两个视角来推测:“产业供给端”的叙事和“GPT时刻”的叙事。
从产业供应端来看,AI发展的四个推动力为:
算法:优质的算法能更高效地执行训练和推理任务
算力:无论是模型训练还是模型推理,都需要GPU硬件提供算力,这也是当下主要的产业瓶颈,行业缺芯导致中高端芯片价格高企
能源:AI所需的数据计算中心会产生大量的能源消耗,除了GPU本身执行计算任务所需的电力之外,处理GPU散热的也需要非常多的能源,一个大型数据中心冷却系统就占总能源消耗的40%左右
数据:大模型性能的提升需要扩大训练参数,这意味着海量的优质数据需求
针对上述四个产业的推动力,算法和算力赛道均有流通市值超过10亿美金的加密项目,而能源和数据赛道尚未出现同市值体量的项目。
而实际上,能源和数据的供给短缺或许将很快来临,成为新一波的产业热点,从而带动加密领域相关项目的热潮。
我们先来说能源。
2024年2月29日,马斯克在博世互联世界2024大会上谈到:“我在一年多前就预测过芯片短缺,下一个短缺的将是电力。我认为,明年将没有足够的电力来运行所有的芯片。”
从具体数据来看,李飞飞领导的斯坦福大学人工智能研究所(Human-Centered Artificial Intelligence)每年都会发布《AI指数报告》,在该团队2022年发布的、针对21年AI产业的报告中,研究小组评估认为当年AI耗能规模只占全球电力需求的0.9%,对能源和环境的压力有限。而2023年,国际能源署(IEA)对2022年的总结是:全球数据中心消耗了大约460太瓦时(TWh)的电力,占全球电力需求的2%,并预测到2026年,全球数据中心能耗最低也会有620太瓦时,最高会达到1050太瓦时。
而实际上,国际能源署的估测仍然保守了,因为目前已经有大量围绕AI的项目即将上马,其对应的能源需求规模远超其23年的想象。
比如微软和OpenAI正在筹划的星际之门(Stargate)项目。这个计划预计在2028年启动,2030年左右建成,该项目计划构建一台拥有数百万个专用AI芯片的超级计算机,为OpenAI提供前所未有的计算能力,支持其在人工智能尤其是大型语言模型方面的研发。该计划预计耗资超过1000亿美金,比当下的大型数据中心成本还要高出100倍。
而仅仅星际之门一个项目的能耗就高达50太瓦时。
也正是因为如此,OpenAI的创始人山姆奥特曼在今年1月的达沃斯论坛上谈到:“未来人工智能需要能源突破,因为人工智能消耗的电力将远远超出人们的预期。”
在算力和能源之后,快速增长的AI行业的下一个短缺的领域很可能是数据。
或者说,AI所需要的优质数据的短缺已经成为现实。
目前人类从GPT的进化中,已经基本摸清了大语言模型能力增长的规律——即通过扩大模型参数和训练数据,就能指数级别提升模型的能力——且这一进程短期还看不到技术瓶颈。
但问题是优质且公开的数据在未来或许将越来越稀少,AI产品在数据上可能会面临跟芯片、能源一样的供需矛盾。
首先是数据所有权的争端增加。
2023年12月27日,《纽约时报》正式向美国联邦地方法院起诉OpenAI和微软,指控它们未经许可使用了自己数百万篇文章用于训练GPT模型,要求它们对“非法复制和使用独特价值的作品承担数十亿美元的法定和实际损害赔偿”,还要销毁所有包含《纽约时报》版权材料的模型和训练数据。
此后的3月底,《纽约时报》发表了一篇新的声明,矛头不仅指向了OpenAI,还瞄准了Google和Meta。《纽约时报》这份声明中说,OpenAI通过一款名为Whisper的语音识别工具转录了大量YouTube视频中的语音部分,然后生成文字,作为文本来训练GPT-4。《纽约时报》表示,现在大公司训练AI模型时使用小偷小摸的手段已经非常普遍,并表示这样的事谷歌也在做,他们也把YouTube视频内容转成文字,用于自己大模型的训练,本质上侵犯了视频内容创作者的权益。
《纽约时报》与OpenAI作为“AI版权第一案”,考虑到案件内容的复杂性和对内容和AI产业未来的深远影响,未必很快能得出一个结果。最终可能的结果之一是双方庭外和解,财大气粗的微软和OpenAI支付一笔大额补偿金。但未来更多的数据版权摩擦势必将抬高优质数据的综合成本。
此外,作为世界上最大的搜索引擎,Google也曝出正在考虑对自己的搜索功能收费,只不过收费对象不是普通大众,而是AI公司。
谷歌的搜索引擎服务器里保存着大量内容,甚至可以说是自从21世纪以来所有互联网页面上出现过的内容谷歌都保存着。而目前AI驱动的搜索产品,海外的如perplexity,国内的如Kimi、秘塔,都对这些搜索到的数据通过AI进行加工,再输出给用户。搜索引擎对AI的收费,必然提升数据的获取成本。
实际上,除了公开的数据之外,AI巨头们还盯上了非公开的内部数据。
Photobucket是一家老牌的图片和视频托管网站,在2000年代初曾拥有7000万用户和近一半的美国在线照片市场份额。随着社交媒体的兴起,Photobucket用户数量大幅下降,目前仅剩200万活跃用户(它们每年要支付399美金的高昂费用),而根据用户注册时签署的协议和隐私政策,超过一年没用使用的账户会被回收,还支持Photobucket对用户上传的图片和视频数据的使用权。Photobucket首席执行官Ted Leonard透露,其拥有的13亿张照片和视频数据对训练生成式AI模型极具价值。他正在与多家科技公司就出售这些数据进行谈判,报价范围从每张照片5美分到1美元不等,每段视频超过1美元,其估计Photobucket可提供的数据价值超过10亿美金。
专注于人工智能发展趋势的研究团队EPOCH,根据2022年机器学习对数据的使用和新数据的生成情况,再考虑计算资源的增长,曾经发表了一篇关于机器学习所需的数据的情况报告《Will we run out of data? An analysis of the limits of scaling datasets in Machine Learning》,报告的结论是高质量的文本数据大约会在2023年2月到2026年之间用尽,图像数据则会在2030年到2060年间用尽。如果数据的利用效率不能显著提高,或出现新的数据来源,目前依赖于海量数据集的大型机器学习模型趋势可能会放缓。
而就目前AI巨头们纷纷高价采买数据的情况来看,免费的优质文本数据真的已经基本用尽,EPOCH在2年前的预测是比较准确的。
同时,围绕“AI数据短缺”的需求的解决方案也在出现,即:AI数据提供服务。
Defined.ai就是一家为AI公司提供定制化真实高质量数据的公司。
它的生意模式是:AI公司给Defined.ai提供自己对于数据的需求,比如就图片而言,质量方面需要分辨率达到多少以上、避免模糊、过曝、内容真实。内容方面AI公司可以根据自己的训练任务,定制特定的主题,比如需要夜里的照片、夜里的锥桶、停车场、指示牌,用来提高AI在夜景下的识别率。大众都可以领任务,拍完上传由公司审核,然后把符合要求的部分按张数结算,价格大约是一张高质量的图片1-2美元,一个十几秒的短片5-7美元,一部10分钟以上的高质量影片100-300美元,文本是千字1美元,领分包任务的人可以得到其中20%左右的费用。数据提供可能会成为“数据标记”之后的又一门众包生意。
全球范围的任务众包分配、经济激励、数据资产的定价\流通和隐私保护、人人可以参与,听起来就特别像一门适合Web3范式的商业门类。
芯片短缺引发的关注渗透到加密行业,让分布式算力成为了截止目前最热门、市值最高的AI赛道类别。
那么AI产业在能源和数据上的供需矛盾如果在未来1-2年中爆发,加密行业目前有哪些叙事相关的项目?
先来看能源类的标的。
已经上线了头部CEX的能源类项目非常稀少,仅有Power Ledger(代币Powr)一个。
Power Ledger于2017年立项,是一个基于区块链技术的综合能源平台,旨在实现能源交易的去中心化,推动个人和社区直接交易电力,支持可再生能源的广泛应用,并通过智能合约确保交易的透明和高效。最初Power Ledger基于以太坊改造而来的联盟链运行。2023年下半年,Power Ledger更新了白皮书,并推出了自己的综合型公链,该公链基于Solana的技术框架改造而来,便于处理分布式能源市场中的高频微交易。目前Power Ledger的主要业务包括:
能源交易:允许用户点对点地直接买卖电力,特别是来自可再生能源的电力。
环境产品交易:比如碳信用和可再生能源证书的交易,以及基于环境产品的融资。
公链运营:吸引应用开发者在Powerledger区块链上构建应用,公链的交易费用以Powr代币支付。
目前Power Ledger项目的流通市值为1.7亿$,全流通市值为3.2亿$。
相比能源类的加密标的,数据赛道的加密标的数量则更丰富一些。
笔者仅罗列目前自己关注的,并已经至少上线了币安、OKX和Coinbase其中一家CEX的数据赛道项目,且按照FDV从低至高排列:
1.Streamr – DATA
Streamr的价值主张是构建一个去中心化的实时数据网络,允许用户自由地交易和分享数据,同时保持对自己数据的完全控制。通过其数据市场,Streamr希望使数据生产者能够直接向感兴趣的消费者销售数据流,无需中介机构,从而降低成本并提高效率。
在实际的合作案例中,Streamr与另一个Web3车载硬件项目DIMO合作,通过装载在车辆上的DIMO硬件传感器收集温度、气压和其他数据,形成天气数据流传输给需要的机构。
与其他数据项目相比,Streamr更侧重于物联网、硬件传感器的数据,除了上面提到的DIMO车载数据之外,其他项目还有赫尔辛基的实时交通数据流等。因此,Streamr的项目代币DATA也曾经在去年12月,Depin概念最火热的时候一度创造出了单日翻倍的涨幅。
目前Streamr项目的流通市值为4400万$,全流通市值为5800万$。
2.Covalent – CQT
与其他数据类项目不同的是,Covalent提供的是区块链数据。Covalent网络通过RPC从区块链节点读取数据,然后对这些数据进行处理和组织,创建一个高效的查询数据库。这样,Covalent的用户们可以快速地检索到他们需要的信息,而不必直接从区块链节点进行复杂的查询,这类服务也被称为“区块链数据索引”。
Covalent的客户以B端为主,其中既有Dapp项目,比如各种Defi,也包括很多中心化加密公司,比如Consensys(Metamask的母公司), CoinGecko (知名加密资产行情站)、Rotki (税务工具)、Rainbow (加密钱包)等,此外传统金融行业中的巨头富达、四大会计事务所安永,也是Covalent的客户。根据Covalent官方披露的数据,项目的来自于数据服务的收入已经超过同领域的头部项目The Graph。
Web3行业由于链上数据的完整性、公开性、真实性以及实时性,有望成为细分AI场景和特定“AI小模型”的优质数据来源。Covalent作为数据提供方,已经开始为各类AI场景提供数据,并推出了专门面向AI的可验证的结构化数据。
比如为链上智能交易平台SmartWhales提供数据,利用AI识别出盈利的交易模式和地址;Entendre Finance则通过Covalent的结构化数据,经过AI处理用于实时洞察、异常检测和预测分析等。
目前来看,Covalent提供的链上数据服务的主要场景仍以金融为主,但随着Web3产品和数据类型的泛化,链上数据的使用场景也将进一步拓展。
目前Covalent项目的流通市值为1.5亿$,全流通市值为2.35亿$,相对于同赛道的区块链数据索引项目The Graph,具有比较明显的估值优势。
3.Hivemapper – Honey
在所有数据素材中,视频数据的单价往往是最高的。Hivemapper可以为AI公司提供包括视频和地图信息在内的数据。Hivemapper本身是一个去中心化的全球地图项目,旨在通过区块链技术和社区贡献来创建一个详细、动态且可访问的地图系统。参与者可以通过行车记录仪(dashcam)捕捉地图数据并将其添加到开源的Hivemapper数据网络中,并基于贡献获得项目代币HONEY的奖励。为了提高网络的效应和降低交互成本,Hivemapper构建在Solana上。
Hivemapper最早成立于2015年,最初的愿景是使用无人机创建地图,但后来发现这种模式难以扩展,从而转向使用行车记录仪和智能手机来捕捉地理数据,降低了全球地图制作的成本。
与Google map等街景和地图软件相比,Hivemapper通过激励网络和众包模式,能更高效地拓展地图覆盖范围、保持地图实景的新鲜度、提升视频质量。
在AI对数据的需求爆发之前,Hivemapper的主要客户包括汽车产业的自动驾驶部门、导航服务公司、政府、保险和地产公司等。如今Hivemapper则可以通过API为AI和大模型提供广泛的道路和环境数据,通过不断更新的图像和道路特征数据流的输入,AI 和 ML模型将能够更好地将数据转化为能力的提升,执行与地理位置、视觉判断有关的任务。
目前Hivemapper – Honey项目的流通市值为1.2亿$,全流通市值为4.96亿$。
除了以上三个项目之外,数据赛道的项目还有The Graph – GRT(流通市值32亿$,FDV 37亿$),其业务与Covalent类似,也提供区块链数据索引的服务;以及Ocean Protocol – OCEAN(流通市值6.7亿$,FDV 14.5亿$,本项目即将与Fetch.ai和SingularityNET合并,代币转换为ASI),一个开源协议,旨在促进数据和数据相关服务的交换和货币化,将数据消费者与数据提供者连接起来,从而在保证信任、透明和可追溯性的前提下共享数据。
在笔者看来,加密行业里“AI赛道”的元年是GPT震惊世界的2023年,加密AI项目的暴涨,更多是AI产业爆炸式发展带来的“热度余波”。
虽然GPT3.5之后GPT4、turbo等的能力不断升级,以及Sora在视频创作能力的惊人展现,包括OpenAI之外的大语言模型也快速发展,但不可否认的是AI的科技进步给大众带来的认知冲击正在减弱,人们开始逐渐使用AI工具,大规模的岗位替代似乎还未发生。
那么,未来AI领域是否还会再现“GPT时刻”,出现让大众震惊的AI跨越式发展,让人们意识到自己的生活和工作都将因此被改变?
这个时刻可能是通用人工智能(AGI)的降临。
AGI指的是机器拥有类似于人类的综合认知能力,能够解决各种复杂问题,而不仅限于特定任务。AGI系统拥有高度的抽象思维、广泛的背景知识、全领域的常识推理和因果关系理解、以及跨专业的迁移学习等能力。AGI的表现与各个领域最优秀的人类无异,就综合能力来说则完全超越最优秀的人类群体。
实际上,无论科幻小说和游戏、影视作品之中的呈现,还是在GPT迅速普及之后的大众预期,社会大众对超越人类认知水平的AGI的出现早有预期。或者说,GPT本身就是AGI的先导产品,是通用人工智能的预言版。
而GPT之所以有这么大的产业能量和心理冲击,在于其落地的速度和表现超越了大众的预期:人们没想到,一个能完成图灵测试的人工智能系统真的到来了,而且速度这么快。
实际上,人工智能(AGI)或许将在1-2年内再次复现“GPT时刻”的突然性:人们才刚刚适应GPT的辅助,就发现AI已经不仅仅是一个助手,它甚至能独立完成极具创造性和挑战的工作,包括那些困住人类顶尖科学家几十年的难题。
在今年4月8日,马斯克接受了挪威主权财富基金首席投资官Nicolai Tangen的采访,谈到了AGI出现的时间。
他说:“如果把AGI定义为比最聪明的那部分人类还要聪明的话,我认为它很可能在2025年出现。”
也就是按照他的推断,最多就是还需要1年半的时间,AGI就将降临。当然,他加了一个前提条件,就是“电力和硬件都跟得上的话。”
AGI的降临的好处是显而易见的。
它意味着人类的生产力水平将大跨步地上一个台阶,大量困住我们几十年的科研难题将迎刃而解。假如我们把“最聪明的那部分人类”定义为诺贝尔奖得主的水平,也就意味只要能源、算力、数据足够,我们可以拥有无数个不知疲倦的“诺奖得主”,全天候攻关那些最难的科学问题。
而实际上诺奖得主并不是几亿分之一那样珍贵,他们在能力和智力上大多是顶级大学教授的水平,但是因为概率和运气选对了方向,持续做了下去并拿到了结果。和他水平相当的人,他同样优秀的同僚们,也许在科研的平行宇宙中也获得了诺奖。但是无奈的是,具备顶尖大学教授并参与科研突破的人员还是不足,因此“遍历所有科研正确方向”的速度仍然很慢。
有了AGI之后,在能源和算力充分供给的情况下,我们可以有无限个“诺奖得主”水平的AGI在任何一个可能的科研突破方向进行纵深探索,技术的提升速度会快几十倍。技术的提升,会导致我们如今认为相当昂贵稀缺的资源,在10到20年间成百倍地增加,比如粮食产量、新材料、新药、高水准的教育等,获取这些的成本也将成倍下降,我们得以用更少的资源养活更多的人口,人均财富迅速增加。
这听起来似乎有点耸人听闻,我们来看两个例子,这两个例子笔者在此前关于IO.NET的研报中也使用过:
2018年,诺贝尔化学奖得主弗朗西斯·阿诺德在颁奖仪式上才说道:“今天我们在实际应用中可以阅读、写入和编辑任何 DNA 序列,但我们还无法通过它创作(compose it)。”仅仅在他讲话的5年后,2023年,来自斯坦福大学和硅谷的AI创业企业Salesforce Research的研究者,在《自然-生物技术》发表论文,他们通过基于GPT3微调而成的大语言模型,从0创造出了全新的100万种蛋白质,并从中寻找到2种结构截然不同、却都具有杀菌能力的蛋白质,有希望成为抗生素之外的细菌对抗方案。也就是说:在AI的帮助下,蛋白质“创造”的瓶颈突破了。
而在此前,人工智能AlphaFold算法在18个月内,把地球上几乎所有的2.14亿种蛋白质结构都做了预测,这项成果是过往所有人类结构生物学家工作成果的几百倍。
变革已经发生,而AGI的降临会进一步加快这个过程。
另一个方面,AGI的降临带来的挑战也是非常巨大的。
AGI不但会替代大量的脑力劳动者,如今被认为“受AI冲击较少的”体力服务业者,也会随着机器人技术的成熟和新材料的研发带来的生产成本降低而受到冲击,被机器和软件替代的劳动岗位占比会迅速提高。
届时,两个曾经看起来非常遥远的问题会很快浮出水面:
大量失业人口的就业和收入问题
在AI无处不在的世界,如何分辨AI和人类
而Worldcoin\Worldchain正在尝试提供解决方案,即用UBI(全民基本收入)系统为大众提供基本收入,用基于虹膜的生物特征把人和AI进行区分。
实际上,给全民发钱的UBI并非没有现实实践的空中楼阁,芬兰、英格兰等国都进行过全民基本收入的实践,而加拿大、西班牙、印度等国亦有政党正在积极提案推进相关的实验。
而基于生物特征识别+区块链的模式进行UBI分配的好处在于这个系统的全球性,对人口有更广泛的覆盖,此外还可以基于通过收入分配拓展而来的用户网络,构建其他商业模式,比如金融服务(Defi)、社交、任务众包等,形成网络内商业的协同。
AGI降临带来的冲击效应的对应标的之一是Worldcoin – WLD,其流通市值为10.3亿$,全流通市值为472亿$。
本文与Mint Ventures之前发布的诸多项目和赛道研究报告不同,对于叙事的推演和预测具有较大的主观性,请读者仅将本文内容作为一个发散性的讨论,而不是预测未来的预言。笔者上述的叙事推演面临很多不确定性,导致猜想错误,这些风险或影响因素包括但不限于:
尽管围绕AI的能源需求猛增,但以英伟达为代表的芯片厂商正在通过不断的硬件升级,以更低的功耗提供更高的计算能力,比如在今年3月英伟达发布了集成了两个B200 GPU和一个Grace CPU的新一代AI计算卡GB200,其训练的性能是上一代主力AI GPU H100的4倍,推理的性能是H100的7倍,需要的能耗却只有H100的1/4。当然尽管如此,人们希望从AI中获得的力量渴望远远没到尽头,伴随着单元能耗的下降,随着AI应用场景和需求的进一步扩张,总能耗可能反而是上升的。
OpenAI内部一直存在一个传闻中的项目“Q*”,该项目在OpenAI发给员工的内部信息被提到过。 根据路透社援引OpenAI内部人士的看法,这可能是 OpenAI 在追寻超级智能 / 通用人工智能(AGI)道路上取得的一项突破。Q*不但能够凭借抽象能力解决以前从未见过的数学问题,还能够通过自我创造用于训练大模型的数据,而无需现实世界的数据喂养。如果该传言为真,AI大模型训练受限于优质数据不足的瓶颈将被打破。
AGI降临的时点是否真的如马斯克所说,会在2025年到来尚不得而知,但这只是一个时间问题。但Worldcoin作为AGI降临叙事的直接诶受益标的,最大的隐忧可能来自OpenAI,毕竟其是公认的“OpenAI影子代币”。
5月14日凌晨,OpenAI在春季新品发布会展示了最新的GPT-4o与另外19个不同版本的大语言模型在综合任务得分中的表现,仅从表格来看,GPT-4o得分1310,视觉上似乎比后几名高出了一大截,但从总分来看,其仅比第二名GPT4 turbo高了4.5%,比第四名谷歌的Gemini 1.5 Pro高了4.9%,比第五名Anthropic的Claude 3 Opus高了5.1%。
从GPT3.5初登场时震惊世界的时刻仅仅过去了一年多,OpenAI的竞争对手们已经追到了非常接近的位置(尽管GPT5尚且没有放出,并预计在今年发布),OpenAI未来是否已经能保持自己的行业领先位置,这个答案似乎正在变得模糊。如果OpenAI的领先优势和统治地位被稀释乃至赶超,那么Worldcoin作为OpenAI的影子代币的叙事含金量也会下降。
此外,除了Worldcoin的虹膜认证方案之外,越来越多的竞争对手也开始进入这个市场,比如手掌扫描ID项目 Humanity Protocol刚刚宣布以10亿美元估值完成 3000 万美元新一轮融资,LayerZero Labs也宣布将在Humanity上运行,并加入其的验证者节点网络,使用 ZK 证明对凭证进行身份验证。
最后,笔者虽然对AI赛道后续的叙事进行了推演,但AI赛道与DeFi等加密原生赛道不同,其更多是AI热潮外溢至币圈的产物,目前诸多的项目就商业模式而言并未跑通,很多项目更像是AI主题的Meme(比如Rndr类似于英伟达的meme,Worldcoin类似于OpenAI的meme),读者应审慎看待。