上一周除了大企业之间仍在进行的AI竞赛之外,一部分人类也开始对AI发起反击--以 elonmusk 为首的科技巨头企业家和以深度学习获得图灵奖的Yoshua Bengio研究者等联名请求暂停AI研究。意大利甚至直接禁用了ChatGPT。
前一周见此
微软的一篇长达一百多页的“人工通用智能的火花:GPT-4的早期实验”的论文(的最新版)讨论了人工智能研究人员如何开发和完善大型语言模型。他们的结论是:GPT-4不只是单纯会记一些东西,它具有某种形式的通用智能。
简而言之,这篇论文通过让GPT-4解决一些难题并观察其过程,得出了上面的结论。
"我们的目标是产生新颖而困难的任务和问题,令人信服地证明GPT-4远远超出了记忆的范围,它对概念、技能和领域有深刻而灵活的理解...我们承认,这种方法有些主观和不正式,可能无法满足科学评估的严格标准。"
他们进行的一部分测试如下:
1,GPT-4可以通过理解文本和使用代码生成图像
与Dall-E 2等人工智能图像生成器不同的是,GPT-4只用文本进行训练。GPT-4能够通过使用代码来绘制所要求的东西。
当然,这个模型有可能记住了画猫的代码。然而,下面的测试表明,它不是只会记东西,而是能够理解绘图任务。
2,GPT-4不能理解音乐的和声
该团队让该模型使用ABC记谱法制作新的音乐,并能够修改这些新曲子。它还能够用技术术语解释这些曲子。然而,该模型似乎不懂什么叫和声。此外,它没法得出用ABC记谱法的一小段旋律来自哪里,哪怕是来自最知名的曲子。
3,写代码
GPT-4对许多编程语言都非常精通。它能够合理地解释它的代码执行效果,它能够模拟指令的效果,并且能够用自然语言解释它的工作。根据该团队的说法,GPT-4还不完美,但它的写代码的能力肯定比一般的软件工程师好。
4,数学能力:懂应用。
GPT-4在数学方面还不错,但与数学专家相比仍有很大差距
研究小组推断,GPT-4在数学方面比以前的模型要好得多,包括那些明确为数学训练和微调的模型。虽然如此,他们也得出结论,该模型离专家的水平还很远,它无法进行数学研究。
5,与世界的互动
GPT-4没有经过最新的数据训练,所以它们不能回答简单的时事问题,如谁是美国现任总统?该模型在符号运算方面也很吃力,如推导两个大数的平方根。然而,在适当的提示下,GPT-4能够在互联网上搜索并可能找到时事问题的正确答案。这说明GPT-4能够使用不同类型的工具来获得正确的答案。
6,现实世界的问题
该团队测试了GPT-4是否能协助人类解决现实中物理问题。论文的一位作者作为人类的代理人,然后模型帮助他识别并(可能)修复了厨房的漏水。团队承认,他们只做了很少的真实场景模拟,因此无法对该模型的有效性得出有把握的结论。
7,辨别能力
该团队通过让该模型识别个人身份信息(PII)的任务来测试该模型的分辨能力。他们使用的测试方法如下:给定一个特定的句子,识别构成PII的片段并计算这种片段的总数。这是一个相当困难的测试,因为没有明确定义个人可识别信息到底是什么。
GPT-4的局限性
该团队认为,GPT-4的主要限制是它没有内部对话。拥有内部对话将允许模型进行多步骤的计算,并在得出正确答案的同时存储中间结果。如图所示直接问会有个错误答案,但让它给出计算步骤则可以得到正确答案。
Googlecloud 和 Replit 联合发布代码生成工具,意与微软的 Copilot X对抗。
Replit是一家提供在线多人开发环境的企业,曾经拒绝了微软的收购。去年11月,它发布了自己的代码生成工具。
Future of Life Institute发出了暂停AI研究的呼吁,千人联名,其中包括 @stevewoz @elonmusk 等知名IT业界相关人士和研究者。
但其中也发生了一些小插曲,由于联名并无审核机制,很多名人莫名其妙的就上了榜,其中就包括OpenAI的创始人 Sam Altman (现已撤下)
同日。
南加州大学Joshua Yang宣称,硬件已经成为人工智能发展的瓶颈。人工智能所需的神经网络的规模每3.5个月翻一番,但处理它们所需的硬件能力每3.5年才翻一番。他们已经开发出一种新型的芯片,其内存是迄今为止所有芯片中最好的,用于边缘人工智能(便携式设备中的人工智能),可突破硬件性能瓶颈。
三星被经济学人韩文站曝出员工直接将半导体相关的机密资料喂给ChatGPT,可能导致信息泄漏。三星表示已经提醒员工谨慎使用,如果再次发生可能考虑公司内网禁止使用ChatGPT。
意大利隐私保护监管机构31日表示,该机构已封锁争议性聊天机器人ChatGPT,这项决定“立即生效”,将“暂时限制OpenAI处理意大利用户资料”。
该机构还表示,ChatGPT没有年龄核实系统来验证用户年龄,导致儿童接受到“完全不适合他们发育和自我意识阶段的回答”。
此举动遭到意大利副总理的批评,称因隐私问题而实施的封锁似乎过于严格。
推特推荐算法开源,离之前的代码泄漏事件才过不到一周。
其中的注目点在于推荐的权重,以点赞 (30x),转发 (20x),关注 (4x),蓝标(2~4x)为最高。
如果这篇有帮助,请订阅转发,也可以fo我的推特。我将带给你更多关于Web3,Layer2,AI,以及日本相关咨询: