从推出到爆火,再到一亿活跃用户, chatGPT 仅仅用了两个月时间。这就是 Web 3.0 时代背景下,人类对真正创新的拥抱速度。AIGC (AI Generated Content)替代了元宇宙,成为2023 年最炙手可热的名词。chatGPT 的出现并不是偶然,而是 NLP 自然语言 (natrual language process )领域的算法不断进化的前提下孕育出的必然产物。AGIC 这一内容生产模式,即将替代 PGC、UGC,成为人类社会活动中不可或缺的部分。
那么 AGIC 到底是什么呢?今天我们抛开其过于复杂的技术背景,从以下三个问题带你快速了解一下这个新名词。
顾名思义,AIGC - 人工智能生成内容,生成内容包括文字、图像、语音。也许你印象中的人工智能回复系统都来自于你手机里的 Siri、家中的小爱同学、或者是打电话给各种客服时令你懊恼的智能语音回复。但这些所谓的 “人工智能” 大多是基于数据比对的自动回复,其与人工智能生成的差距,就好像一本字典和网络搜索引擎之间的差距。AGIC 是基于神经网络学习后的产物,它的对你的回复会基于对内容的理解,而非简单的关键词比对。
我们让 chatGPT 对 Tokenlon 做了一个全面介绍,可以看看你对 Tokenlon 的了解是否有 AI 多。
也许你并没有注意到,AIGC 在绘画领域的应用已经早于 chatGPT 遍地开花,我们所熟知的很多 NFT 项目就使用了该技术。以谷歌为首的人工智能大厂们也相继推出了 AI 绘画应用,用户可以通过导入原始图片进行二次创作,或者直接通过文字描述让 AI 进行创作。虽然艺术界对 AI 绘画的产物褒贬不一,但可以确定的是,这项技术对于某些将绘图作为重要生产力的领域而言,将带来指数级的成本降低和效率提升。
AIGC 在音乐领域的发展也已经初具形态,自适应音乐平台 LifeScore 可以根据用户导入的音乐文件自动编排音乐的播放顺序,从而打造一场完美的演唱会。该平台也与知名直播平台Twitch 合作推出了电视节目「Artificial」,在用户观看该节目时,平台会根据用户情绪改变所播放的音乐。
作为机器学习领域最重要的算法模型,深度神经网络。深度学习之所以是「深度的」,就因为除了能学习模型怎么做精确,还能学习怎么建模本身。简而言之,我们只需要将数据输入模型,机器会自动判断哪些数据有用,哪些数据没有用,并为他们标注特征。之所以称之为「神经」网络,是因为这种算法下可以通过迭代不断进化,就像神经元一样逐级延伸,最后形成一个庞大的神经网络,组成智慧的「大脑」。有趣的是,深度学习训练的过程是一个黑匣子,人们并不能根据其训练过程来解释结果,所有的训练都是机器自主完成的,只能通过其输出结果的准确性来判断所训练出的模型的质量。
深度学习的方式涉及统计、概率、训练与经验主义。举个简单的例子: 当机器被要求画出一只小狗时,机器会判断第一个像素点在哪个位置,什么颜色,当画出脸部后,会判断这只小狗是否有耳朵?如果有的话,几只的概率最大,先画左耳还是右耳?左耳的第一个像素点又在什么位置?而 AIGC 特有的对抗神经网络 GAN (Generative Adversarial Networks) 主要原理为,将两个神经网络(生成网络和判别网络)相互对立,以提高模型输出结果的质量。就是在这样一步步学习与对抗中,AIGC 完成了它的创作。是不是听起来很像一个在刚学画画的孩子,又要学习又要和别人家的孩子作比较?正是因为拥有这样的大脑和训练方式, AI 的成长过程与人类十分类似,那么其高质量的内容创作也就顺理成章。
如果说区块链的诞生改变了人类社会的生产关系,那么 AIGC 的进化,无疑为生产力和生产资料带来了质的提升。元宇宙的建立需要大量的内容创作,其中包括大量枯燥、机械性、重复的的工作,当然我们依然可以通过 PGC 和 UGC 来生产这些内容,但有了 AIGC,这个过程将被缩短。以 chatGPT 和 stable diffusion 为首的 AIGC 所生产的内容质量已经可以媲美人类的创作,部分大学院校甚至禁止学生访问 AIGC 工具,因为他们写出的论文实在是比他们的学生强太多。
照此发展下去,可以想像在不久的未来,我们将生活在一个我们无法区分创作来源的世界。也许短时间的 AIGC 的爆火不乏资本的炒作,并且从现有情况来看,除了我们熟知的几个产品外,大部分 AIGC 产品的内容生产质量还不尽如人意。一项革命性技术的发展需要时间的沉淀和经验的积累,绝不会因为今天股票的暴涨就能马上造福全人类。正如石器时代不是因为缺少石头而结束,人类的生产创作模式的革新也不会因为创作者的匮乏而停滞,至于 AIGC 是否是迎来新纪元的曙光,我们还需要让时间给我们答案。
注:封面来自网络