Twitter:@0xCike
Kuzco 是在 Solana 上构建的分布式 GPU 集群,用户(节点)通过共享 GPU 算力,执行 LLM 推理(目前用的是 Llama2 和 Mistral 模型),属于目前主流的 AI / GPU 叙事。节点提供算力可以获得积分奖励,后续空投,目前第一期挖矿刚开几天,由于成本略高/没有官方文档,所以只有几百人在挖,不卷。
@Solana 官方、Solana 创始人 @aeyakovenko、Jito 创始人/CEO @buffalu__ 均在关注 @kuzco_xyz 及创始人 @0xSamHogan。基本可以确定该项目不是蹭 AI 概念的土狗,参照同赛道 io.net,未来可能出现高融资高估值,现在早期入股不亏。
Kuzco 可以使用 MacOS 或 Linux 系统的设备进行挖矿,自己有 Macbook 或其他 Mac 电脑(必须是采用 M 系列芯片的)的话,可以挖一下,也可以租用 GPU 服务器去挖。官方目前还未上线文档,只提供了两条指令,调试起来比较麻烦,该教程旨在帮大家减少试错成本。
建议使用 Linux 服务器运行节点(闲置的 Mac 也行),不要在自己的主力电脑上瞎搞。
首先第一步要购买服务器。因为要 GPU 运算,所以几刀一个月的垃圾 VPS 肯定不行,要搞台正经大厂的 GPU 服务器,运算快且稳定,就是有点贵,每台每月成本几千块(换算成几百 U 是不是很便宜?)
经过对比,阿里云的 GPU 服务器价格适中且更易上手,我已运行三天,还是比较稳的。虽然腾讯云和一些 GPU 租赁平台也有类似的业务,价格可以做到更低,但仅就该项目而言,部署难度会高于阿里云,有技术的小伙伴可以自行尝试。
进入阿里云,注册账户:
注册后先充值至少 100 元,否则不能开通按量付费的服务器。然后进入阿里云首页,按下图所示进入【云服务器 ECS】,点【立即购买】。
点【自定义购买】,这里可以选择包年包月(一次性交至少一个月的费用)、按量付费(根据使用资源情况每小时扣款,随时可关闭),一开始建议先按量付费,确定要长期运行的话,再转换成包月的。
下面要选择具体参数配置,我们先搞清楚 Kuzco 的运行逻辑:Kuzco 分配任务给节点,节点使用 GPU 进行运算,运算成功给予奖励。如果你的服务器 GPU 算力很强,那么运算过程就很快,如果任务一个接着一个不中断,那就意味着算力越强奖励越多。
但实测 Kuzco 目前每分钟只有两三个任务,所以高算力 GPU 大部分情况下是空闲状态,我买的英伟达 P100 都有点算力过剩,和最低配的 T4 获得的总奖励数量差不多,但价格差了一倍多。当然,我没有测试更牛逼的配置,也不能确定其分配任务的逻辑,一方面也是为了节省成本,建议无脑 T4(V100 不要买,我运行失败,不知原因)。
进入选购,区域选择香港/印度/印尼,目前这三个区域都有 T4 且价格便宜,每小时在 8-9 元之间。每个区域的机器都有可能暂时缺货,实际选购时可以多切换区域看看。
以印尼为例,按照下图选择机器。
下面选择镜像,也就是系统。建议选择 Ubuntu 22.04,并勾选安装 GPU 驱动,如果在其他平台购买,也要选 20.04 及以上版本的 Ubuntu。一定不要选 Centos 或低版本的 Ubuntu,因为内置 GLIBC 版本太低,无法运行 Kuzco 节点,且升级贼麻烦。
存储选择 ESSD 云盘,没有 ESSD 就选 SSD,容量大点小点无所谓,硬盘不值钱,下面的数据盘不用挂。
勾选分配公网 IP,带宽先拉满到 100M,后续正常运行后调回 5M。
设置自定义密码。
除了上面的配置外,其他的参数都不要改。
这套配置的价格是每小时 8.366 元,流量费另算,实际用不了多少,每个月的费用在 6000-7000 元之间,如果包月就是 4000+(如果有新用户活动可能更便宜),所以后续长期运行一定要选包月。
下单后,等待几十秒,服务器显示【运行中】后,进入管理页面,点击右上角【远程连接】,点【立即登录】。
跳转到远程登录页面后,填写选购环节设置的服务器密码,登录即可进入指令输入页面,此时需要等待系统自动安装 GPU 驱动,大约需要十几分钟,安装好之后会如下图所示自动断开连接,此时点击重新连接即可。
等待安装驱动的过程中,去 Kuzco 官网注册一个账号。
回到远程界面,复制下方代码粘贴并回车运行一下,安装 Kuzco 节点:
curl -fsSL https://kuzco.xyz/install.sh | sh
安装好之后,运行下方代码:
kuzco init
此时会提示登录账户或创建新账户,直接回车登录,按提示依次输入邮箱及密码,然后按提示创建一个矿工名字,最后选择 Yes 开始挖矿。
上述代码环节可参照下图。
接下来会下载模型,可能需要十几分钟的时间,下载好之后自动运行挖矿,如下图所示,出现 heartbeat 就是在等待接任务了。
等它挖几分钟,回到官网,可以在 Workers 中看到你的节点已在运行。
点进去,可以看到每一笔运算获得的奖励分数。
正常运行后,回到服务器管理页面,在【公网带宽】中把带宽从 100 调到 5,前面拉满是为了下载模型快一点,后续运行 5M 够用。运行一段时间后,如果想长期运行,可以在【付费类型】中把按量付费改为包月,每月立省 2000,但流量费是额外按量支付的,也可以在【公网带宽】中把流量费包月。
挖矿过程中需要保持远程连接,实测阿里云自带的网页版经常掉线,可以使用 Xshell 软件一直连着,具体软件下载和操作方式,可以参照之前【空投隔离教程】的 3.3 部分,主机 IP 是上图的公网 IP,登录用户名是 root,密码是服务器密码。
登录后发送下方代码并回车,开始挖矿:
kuzco worker start
如果中间掉线重连,也是用这条指令重启挖矿。
Twitter:@0xCike