人工智能不可避免地会出现在我们生活的方方面面。最近一年元宇宙的火爆推动了人工智能发展,同时在大流行病毒变种的疫苗解决方案以及气候变迁碳中和领域,人工智能更是发挥了中流砥柱作用。
我们需要回答一个选择题,今后的 AI 是由 Big Tech 控制(如今发生在 Web2 中),还是向所有人开放和使用?
我们Stability AI 是第二个选项,正引领这个潮流,通过人工智能系统确保开放的未来,让我们所有人都能发挥潜力。
在AI领域我们具有竞争力,拥有取得成功所需的三个要素:
我们团队,社区和合作伙伴正在构建可以释放无限创造力的技术,帮助解决目前世界的混乱局面(大流行造成的困境,碳中和目标),并引导人类走向更美好的未来。
我们的目标是在全球范围内建立“Layer 1 of AI - 人工智能的第一层”,协调全球开源人工智能生态系统并扩大访问范围。很多人只是口头上支持人工智能的民主化,而我们正在付出行动。
我们已经在与全球最大的人工智能实验室竞争。现在是时候通过可扩展、可持续的模式来发挥这独特的优势了。
其他关键点:
我们将使世界变得更幸福、更稳定。
当前尖端人工智能模型开发的版图很小。
2021年在AI领域有许多初创公司被投资,相比2020年翻了一番,达到 93 亿美元。
这种投资需求不太可能减弱,因为我们看到AI领域产出的模型也匹配这个行业增长的基本面,并且它是市场上少数存在的[结构性增长领域](https://www.forbes.com/sites/robtoews/2022/03/27/a -wave-of-billion-dollar-language-ai-startups-is-coming/),其它行业几乎没有可投资的机会。AI领域的最近几轮公开融资如下:
Anthropic 的重点在解决一个棘手的问题,即如何确保达到人类水平及以上的人工智能不会杀死我们所有人(AI Alignment)。该团队对是否获得微软的资金产生分歧后,该组织脱离了 OpenAI。作为一家非盈利的公益公司,他们的资金不是商业性的,而是主要来自对这些领域感兴趣的人,最引人注目的是SBF参与了最近一轮。它是我们潜在竞争对手之一,当然我们有不同的方法来解决 AI 安全和对齐问题。
Stability AI的大部分模型托管在HuggingFace ,仅 EleutherAI GPT 模型就下载了超过 1000 万个模型。他们目前处于领先地位,目标是成为“机器学习的 GitHub”,这非常令人钦佩。我们是HuggingFace在开源 AI 领域的一个主要合作方,但他们的管理者和开发人员在突破边界和降低准入门槛方面比较谨慎保守。
Cohere 是一家大型语言模型 API 公司。他们之前筹集了 7000 万美元,目标打造为文本操作和创建的一站式 API。面对越来越复杂的开放源代码模型(目前由我们引领)和准入许可,同时还要与 OpenAI 和其他项目竞争,很难看出他们将如何保持利润。也许工程师的前向部署能改进一点。
Adept AI 是从所有主流AI实验室中衍生出来的项目,专注于自然语言机器人过程自动化,即制作一个可以随心所欲操作软件的智能聊天机器人。下面是他们早期工作的演示。微软将 GPT、Turing 和 Codex 应用于 PowerAutomate ,Adept AI将面临来自微软的激烈竞争。
character.ai和其他一些怪兽级组合即将推出,因为许多开发人员从更大的实验室中分拆出来独立发展。
目前我们构建可以读写、看和画、听和说的人工智能应用,甚至比我们人类自己都好,这些应用将在未来几年继续增长。
很多其它项目的机器学习工程师不愿参与社区和客户的沟通交流而改进模型,这导致其中许多应用将只是 API 游戏,我们的模型因为持续学习了解社区和客户,这是我们的一个次要优势。
例如我们在 Primer 的朋友和其他人有一个更具可持续性的模型,在 B2B 和 govtech 环境中进行前向部署和定制。所以我们将重点放在其他地方以实现可持续优势。
以太坊是世界计算机,我们正在寻求建造世界超级计算机。
Web3 中大多数更先进的 AI 公司都使用我们的 GPT-Neo 模型等模型,这些模型来自我们在 Eleuther AI。几乎所有的 AI 艺术 NFT 都是由我们的扩散模型和笔记本驱动的。
虽然有 RNDR 网络的补偿,还有 Gensyn 等公司,以及元宇宙剧如M² by Improbable,现实是我们是这个领域中唯一一个在推动创新的去中心化深度技术组织。我们将支持该领域的任何开放式创新。
人工智能正变得越来越复杂,但使用的门槛也越来越高。
训练大规模模型需要花费数百万美元的计算成本,例如 GPT-3,它可以用来写诗或创造整个书面世界的内容,但这个领先语言模型据估计需要花费 1200 万美元来训练。
即使你有钱来训练这些大型模型,你也需要专业知识和超级计算机来完成这项工作。我们有计算能力、数据和顶级人才来竞争。
我们正在构建一个基础设施层,以支持和激励致力于开源 AI 的组织,消除目前他们面临的障碍,迫使许多有天赋的人才进入AI相关的私营机构。
我们的模型基于两个支柱:
首先,我们将社区创建的模型托管在联合国以及其他机构,同时我们可以通过我们的私营公司实施的开源框架,确保用户数据隐私和数据优化。
其次,我们计划推出一个 Web3 经济模型,通过该模型,生态系统的所有贡献者都将被治理代币激励,从用户到研究人员都将收到可以兑换计算和用于治理的代币。这将是驱动世界超级计算机的代币。凭借跨部门服务的统一身份和钱包基础设施建立起来的经济规模具有强大的网络效应,甚至不一定需要区块链网络(类似Coinbase ,Open Sea)。
我们的目标是为社区和个人提供自由和独立的AI技术,让他们围绕一个共同的愿景组织起来,帮助这些社区和个人寻求发展;这样借鉴 Web3 生态系统方法同时利用了分层复杂系统设计的经验去改进了它。
Stablily.AI部署的模型支持和发展在线社区,这些社区可以创建有助于推动研究在现实世界中实用的模型和产品。我们相信每个个体都应该有自己的文化内涵和开放包容特质,并在社区治理、底层基础设施和产品方面提供支持,以使他们能够蓬勃发展和快速成长。
我们运营管理每个社区,以帮助社区成员快乐和繁荣,奖励他们为社区做的贡献。
我们与社区成员合作,利用我们的基础设施(尤其是数据和计算)构建尖端 AI 模型。
我们共同创造产品,进而发展每个社区。这使他们能够从技术贡献者发展为最终用户,所有数据、代码或其他元素的贡献者都通过代币经济模型获得奖励。
社区治理和搭建公共堆栈的经验教训使我们能够建立一个充满活力的生态系统。我们通过开发一个通用的身份和钱包框架来打通底层和应用。
今天很少有普通人与尖端的人工智能互动。数百万人与这些技术交互将成为一种标准模式,我们的愿景是想通过大力推广它成为全球标标准。
该模型借鉴了 Web3 生态系统模型,如果想通过它扩展至我们想要的影响力级别,那么这种模型是目前来看唯一可执行的方法。灵活性和独立性兼备的共同使命通过这个模型传递给快乐、富有成效的社区/个人 。
我们的社区如下:
Eleuther AI最初是一个为创建 GPT-3 的开源版本而建立的项目,该项目已扩展到拥有一个 15,000 人的社区,专注于大型语言模型和语料对齐。
Stablity.AI提供了就业机会、赠款和大规模计算,以帮助加速 Eleuther AI 的工作,现在正着手帮助更好地组织它并维护已完成的工作。
Eleuther AI路线图中包含一个大型语言模型扩展框架以及从叙事质量到 RLHF(Reinforce learing from humban feedback)工作的数十个其他项目。我们还致力于在一系列模式和语言中构建更好的数据集。
我们还将帮助为 Eleuther AI 建立一个慈善组织结构,目前这个组织还没有开始筹建。
LAION 是一个拥有 4,000 名成员的社区,它创建了最大的开放标记图像数据集 LAION 5b,其中包含 58 亿个图像文本对,总大小为 240 Tb。在这个服务器上,重点是图像,从 OpenCLIP 到潜在扩散的各种图像模型。该项目前是被一家德国慈善机构所有,Stability.AI提供全面的运营和开发人员支持以及计算服务。
MidJourney是我们支持的独立组织,负责实施我们创建的图像模型并使其发布上线应用起来。它目前拥有近 15,000 名社区成员,其中活跃成员多达5,000 名;我们帮助他们解决了计算成本,并支持测试版的有机地扩展。我们希望通过今年8月份即将上线的新计算的应用程序积极扩展这一点,引入审美评分和偏好学习,以便使用所有用户输入的数据,为每个用户改进系统体验。我们为 MidJourney 提供战略顾问和模型支持,其重点不是为了其本身而扩展,而是通过改进系统为尽可能多的人对这些新模型的访问。
目前我们的BioML 服务器拥有1000多名用户,希望通过专业机构和学术支持积极扩大业务。人工智能在健康保险和医疗领域的巨大潜力,但在数据集、模型和其他我们正在开发的领域完全缺乏协作。
我们有许多新兴垂直社区,从一个核心小组开始,每个小组最多 100 人,从音乐到教育。我们还认为,对于研发而言,最佳实验室规模是 2 到 12 个,并且同时我们也正在建立水平社区,例如,我们的运营、产品和基础设施部门也在大力支持开源 AI 博士研究员社区。
在短短一年多的时间里,我们的生成媒体已经从模糊、融化的图像发展到与人类输出无法区分的图像。
例如,当被要求绘制“Dorian Gray 的肖像”时,AI 在 30 秒内完成了一幅画。
这是训练我们最新的图像模型之一进行实时生成的示例;更多图像生成示例 可以在我们的空间库中找到;在这些模型的开发领域只有两个主要参与者。
一个是 OpenAI,目前只有 1,000 名 beta 测试人员可以使用他们的 尖端 DALL-E 2 模型,它的代码和模型不太可能曾经公开发布过。它创造了相当美妙的图像。如下图这是 DALL-E 2 的问题:
您不得使用乌克兰一词来生成图像,否则您的帐户可能会被永久禁止使用。
在接下来的几周内,我们将发布更复杂的模型,从高度艺术化到逼真的模型,可以与 DALL-E 2、ImageGen 及其他产品竞争。
在这一年中,我们将发布音乐、3D 和其他模型。这将构成 Ready Player One/Holodeck 体验的基础,用户可以在 Metaverse 中创建他们可以想象的任何东西。
这将是一个开放的人工智能系统,新产品/技术的体验是通过我们的模型来创建、组织和导航。而 Meta 的所有交易打折47.5%,像没有腿的巨人一样。事实上,我们是元宇宙中Meta AI 和其他大科技公司主导 AI 的唯一可行替代方案。
在艺术领域,我们支持独立实验室 MidJourney 的发展,并将继续为 15,000 名及更多用户提供支持。此外,我们还支持其它一系列产业,包括在心理健康、教育和创意产业方面。
大约一年前,Wombo Dream 开始使用我们模型,之后成为应用商店中排名第一的应用,现在有 200 万并发用户。我们通过提高产品质量和发挥我们的技术专长,相信我们可以接触到数以千万计的用户,同时每个用户都有自己的身份和钱包。
我们统筹资源组织创建独特的数据集,为社区提供更优质的模型,保护数据隐私的同时,与联合国教科文组织及其他地方的合作伙伴合作,释放全球创造力。
我们还将这些模型带入我们工作的贫困地区,让难民和孤儿创作他们自己的艺术品,这些艺术品将在苏富比或佳士得拍卖,并生成 NFT,以提高全球知名度。
在过去几年中,Stability AI 联合创始人 Joe Wolf 带领 Imagine Worldwide团队在马拉维、Rohingya难民营和其他地方实施了 Global Learning X-Prize。在随机对照试验中,我们看到这个根本未优化的系统可以在全球一些最恶劣的条件下,比如在没有互联网的情况下,在 13 个月内每天 1 小时教授识字和算术。
核心社区由100 名全球专家组成,以严格的产品和项目管理流程在运行,我们将重构这个集成了硬件和软件的系统,它是一个在联合国托管的开放系统,可应用于任何教育系统。它将以人工智能为核心,并根据学生的需求进行定制,从学生数据中学习,同时保护他们的隐私。
我们有权限部署它以支持马拉维的 Imagine Worldwide,并将寻求通过与世界银行及其他机构的合作伙伴联络合作来扩大规模。
这些平板电脑(可能与我们在亚马逊的合作伙伴一起)可以加载医疗保健和其他服务,让贫困地区学生看到光明,为他们提供真正的人生变化和上升机会。
前面提到的生成媒体和教育就是数十亿美元的机会,我们具有出色的团队、独特的上市路线、原始数据集和部署模型后的技术门槛(这是重要的护城河)。
我们正在建立从音乐到心理健康再到气候等领域的社区,这些社区借鉴上述方法并略微调整。
同时,我们将支持我们的核心团队、社区和合作伙伴开展广泛的前沿研究,以增强全球开源生态系统力量。这包括来自广泛大学合作伙伴的研究和数十个较小的研究计划。在接下来的几个月里,我们将扩大规模,以支持数千名独立研究者/学术研究人员以及数百个项目。
我们敏锐地意识到这些领域的问题,并设计了 Stability AI 来帮助解决其中的每一个。
在对齐方面,我们将与Conjecture 密切合作,以确保我们的项目和支持不会落后于时间表。我们主要关注实用的人工智能,对于那些无法访问但可能会增加能力的潜在用户我们也特别欢迎他们加入。
我们在学术界和支持独立研究方面充满雄心壮志,也应该有助于创造一个吸引更多人才加入联盟的渠道,这也是我们正在大规模融入我们的项目的东西,从中学生到博士研究生。
在安全和偏差方面,根据我们社区的工作,我们正在开展一系列举措,从改进数据集到将人工智能系统部署到南半球等数据代表性严重不足的地区。我们不仅将帮助这些地区的个人和社区发挥其潜力,还将创造更好的模型,不仅培养了和西方世界的情感,同时保护个人用户的隐私并奖励他们。
与大多数初创公司相比,我们拥有一项关键的优势战略资产:Ezra-1 UltraCluster 中全球最快的超级计算机之一,而且我们以市场价值大幅折扣购入。
这是 2022 年 8 月将在 4,000 台 A100 上完全部署的 UltraCluster 的示意图,这些 A100 由 Petabit 规模的无阻塞网络基础设施连接。
每个 P4d 节点由 1 Tb RAM、8 Tb NVMe SSD、8 NVIDIA A100 组成。合并后的 UltraCluster 拥有 48,000 个内核、576 Tb RAM、4 Pb NVMe SSD、4,000 个 A100。我们有 10 Pb 的高速 FSx Lustre SSD 存储,我们可以扩展到 100 Pb 以上。
JUWELS Booster Module拥有 3,744 台 A100,目前是全球最快的超级计算机Top500榜单)第8位;我们8月份部署的UltraCluster将超过它。
对于目前的硬件部署阶段,我们已经耗资 1 亿美元使用 752 台 A100,将其放在上文榜单中比较,超过 [英国最快的超级计算机,Cambridge-1](https://www.hpcwire.com/2021/07/06/nvidias- cambridge-1-supercomputer-is-now-uks-fastest-supercomputer/)。
部署完4000台A100后,我们估计这将提供 50 Petaflops 的混合精度性能和超过 2 Exaflops 的 AI 计算。这应该能够在一周内训练 GPT-3 级别的模型,而 BigScience 可能会在 Jean Zay 超级计算机上为他们的版本使用近一年(3 个月的训练)。
这是全球最大的灵活没有使用限制的超级计算机,我们将用于协调全球人工智能研究。在接下来的三年里,我们已经就价值九位数的资产价格进行了大幅折扣谈判(详情请咨询)。
在最坏的情况下,我们可以提议向学术界出售完全托管的模型培训服务,以填补斯坦福大学 HAI 国家研究云提案中概述的空缺:这可以很容易地以市场价格甚至打折来出售它,这意味着我们可以出售四分之一的计算资源给我们的合作伙伴获得收入来支付剩余的超级计算费用。
虽然这些数字令人印象深刻,但有两个因素需要牢记:
首先,竞争才刚刚开始,因此我们还将持续扩展我们的计算能力,以使开源 AI 能够与封闭的私有 AI 竞争并最终胜过它们。我们正在以类似的折扣讨论更多、更大的超级计算资源。
其次,我们可以通过我们的学术合作伙伴访问各种其他超级计算机,例如 JUWELS Booster(全球第八快)和 Summit(第二)。随着我们组织越来越多的开源 AI 社区,我们可以快速利用这些资源。
Stability AI 正在进行第一轮股权融资,以满足未来 18 个月的项目运营资金需求。这将使我们能够锁定并增强开源 AI 领域的资源协调。我们相信,如果运营进展顺利的话,该模型可以胜过封闭的大科技公司主导的同质化模型。随着大型科技公司创新缓慢遇到瓶颈,现在是构建Stability AI的远景的理想时机。
在今年的融资过程中,我们将获得其他资金来源,从赠款到政府资金,再持续不断的增加轮股权融资。人工智能在元宇宙和医疗保健应用中是热点,我们应该从人工智能的大规模应用中顺势而为,相反的是其它科技行业遇到瓶颈而市场平淡甚至衰退。
我们的短期财务规划还包括四分之一的计算资源收入来支付剩余三个季度的成本。如果我们愿意,我们可以增加收入以迅速实现盈利,但我们认为最佳战场是和大科技公司竞争主导全球开源 AI 生态系统。我们列出了各种其它收入来源,可以根据要求进行讨论。
我们的核心目标是到 2023 年年中实现 1 亿美元的收入,如果只考虑到计算资源与市场价格相比,这是可以实现的。
明年的计划是我们将启动上文讨论的代币经济模型和社区治理,并进行潜在的 SPAC 或IPO。当公司完成了治理、基础设施和产品部分之后,所有这些商业模式都应该是高利润的。
目前,在市场上我们生活的方方面面都没有相对低门槛的投资方式来投资人工智能,很多AI初创公司只是概念构想阶段,但我们结合了前沿研究和现实世界的工程实施。我们可以通过我们的超级计算机的资产承保和我们实施的工程叙述优势迅速成为一家上市公司。
当投资者将更多资金注入一家公司的资产负债表时候以增加它的估值时,你就可以判断一家公司目前处于高速增长势头。而我们就是这些高速增长的公司之一。
我们运营的慈善 501(c)3 捐助者建议基金,即稳定基金,每年将会资助 100 名开源 AI 博士,他们将优先使用我们的超级计算机资源,同时他们也是开源AI学术届的一些KOL,组织协调我们在全球的布局和增强影响力。
我们已向该基金承诺了 捐赠200 万美元,并将在下个月将其增加到 500 万美元,然后公开征集第一批研究员。我们欢迎向该基金捐款;并正在规划一个NFT 系列售卖,销售收入来资助奖学金给每个博士做研究,NFT由前沿的AI艺术家创作。
我们拥有一支世界级的团队,只有 37 名全职员工,目前有数十名正在应聘的候选人才。
我们拥有令人难以置信的强大人才渠道,可以提供前往英国的快速通道签证,从而在一个月内获得居留权和搬迁到英国,并在当地或世界任何地方享受世界级的福利。
非执行:
未来三个月的里程碑
我们是一个具有改变世界潜力的独特组织。
没有我们,我们的未来将由大科技公司控制的人工智能驱动。
在不久的将来,人工智能是唯一确定的增长领域之一,我们完全有能力以合乎道德的方式进行投资和支持这以领域发展。
支持我们,拥有一些超级计算机的股份,帮助世界更加快乐。
本文参考 Stability AI Investment Memo
作者 Emad Mostaque - CEO of Stability AI