每周国内外AI发展动态研究-2025年9月10至15日 按:从2021年开始,关于区块链发展动态,通过每日国外区块链发展动态来进行研究,从最初每天都会通过X研究相关的行业代表性人物、代表性项目,后面发展为不定期但最多一周会有一两次研究,坚持了有五年,几经更换研究的对象人物和代表项目,包括后来另一个项目:研究当月获得融资的区块链项目也有五年以上; 关于区块链的研究,应该是成功的; 关于AI的研究,除了前几年批量阅读些AI类书籍外,今年前几个月,因为大模型的流行,我有几个月研究了大模型产品、周边的DOCKER VSCODE python dify等产品,甚至研究了具体的应用部署、应用案例,陷入技术细节,我感觉不应该这样,于是决定从AI和产品部署类应用脱离出来;我于今天20250801在坐车时,突然决定应该仿照区块链研究的路径,也做个AI每日发展动态研究,找到国内外最牛的100个AI人物(以X为研究媒体,这些人物可能很多没有X账号或不活跃,则略去)和AI项目(拟再做个专题研究)也做个系列,这比陷入AI产品细节里更适合我当前需要; 初步决定每周一到两次;以后有变化再说; 此为志。 第一次调整(2025年8月5日):删除X不活跃的AI人物,增加了排名靠前的X活跃的AI类项目若干。 开放人工智能,@OpenAI,OpenAI 的使命是确保通用人工智能造福全人类。 上个月,我们宣布现在每个人都可以使用高级语音模式,免费用户的使用限制从每天几分钟扩展到小时,Plus 用户的使用限制几乎无限制 我们还宣布,标准语音模式将在 30 天的日落后停用。我们听到反馈说标准语音对许多人来说很特别,我们希望正确地实现这一过渡。标准语音将保持可用,同时我们将在高级语音中处理您的一些反馈。 敬请期待,高级语音模式的更多改进即将推出! 谷歌人工智能,@GoogleAI,让人工智能对每个人都有帮助。展现思维↓ 周五愉快!拾以下是我们本周发布的每周汇总: @NotebookLM 与 @OpenStax @NotebookLM 还对他们的报告进行了重大更新,包括定制、人工智能建议的格式和博客文章。 @GooglePhotos 美国用户现在可以在“创建”选项卡中使用 Veo 3 将照片转换为短视频。 —我们在 @FlowbyGoogle 以及通过 Gemini API。 —我们将 Gemini API 中 Veo 3 和 Veo 3 Fast 的价格降低了 ~50%。 —AI 模式 @Google 搜索功能现已提供五种新语言版本(印地语、印度尼西亚语、日语、韩语、巴西葡萄牙语)。 这是 Veo 方面重要的一周。以下是亮点: —您现在可以在 @FlowbyGoogle 以及通过 Gemini API。 —我们将 Gemini API 的价格降低了 ~50%,因此现在开发人员可以使用 Veo 3 以 0.40 美元/秒的价格进行构建,以 0.15 美元/秒的价格使用 Veo 3 Fast 进行构建。 为确保您充分利用 Veo 3,这里有一个简单的提示指南,您可以使用它来获得最佳视频输出 Meta 的人工智能,@AIatMeta,我们与人工智能社区一起,通过开放科学突破可能性的界限,创造一个更加互联的世界。 无 Microsoft Azure,@Azure,Limitless innovation. ☁️ Follow along for the latest news and resources from the official 构建代理 AI 并不是困难的部分。大规模确保安全是。Azure AI Foundry 是提供可互作的企业就绪代理的解决方案。在我们系列的第 5 部分中了解更多信息: 发现新的 AI 驱动工具,以简化迁移并更快地将新机会推向市场。 立即注册:https://msft.it/6013sisiZ Microsoft 和 @RalphLauren 正在利用人工智能重新定义购物体验。 在 Microsoft Azure OpenAI 的支持下,Ask Ralph 将 Lauren 独特而标志性的风格交到消费者手中:https://msft.it/6018sifBE AWS 人工智能,@AWSAI,在 AWS 上构建和扩展下一波 AI 创新浪潮, 新网络研讨会:使用 AWS 在 DGX Cloud 上部署分布式大型 ML 工作负载☁️ 加入#AWS & @nvidia 9 月 18 日的网络研讨会,了解分布式 ML 的最佳实践#DGXCloud在 AWS 上,并观看实时 Llama 模型微调演示。#startups AI 代理会说什么语言?烙从智能体与智能体的交流到语境理解,再到常识推理,探索科学研究的塑造#agenticAI.#AWS 转化率提高 861%:如何 @dentsudigitaljp 转变广告创建#AWS ⚡跟#AmazonNovaPro、Nova Canvas 和 Nova Reel,他们提高了转化率并将生产时间缩短至 5 天。#generativeAI 英伟达人工智能,@NVIDIAAI,面向商业领袖的最新突破和人工智能的未来。 NVIDIA AI 播客的新功能:溺Chris Dallago(NVIDIA 研究主管)和 Martin Steinegger(AlphaFold 论文的合著者)分享了 AI 如何加速蛋白质折叠突破,解锁更快的药物发现和精准医疗。现在听:https://nvda.ws/4n0jdQz 生成式 + 代理式 AI 如何重塑金融服务? 特色:Prem Natarajan,执行副总裁、首席科学家兼人工智能主管 @CapitalOne 在 NVIDIA AI 播客中,他分享了他的团队如何构建 AI 驱动的系统,以:⚡减轻客户 + 员工的认知负担烙部署代理 AI,如聊天礼宾人员使用专有数据构建专有模型在这里听:https://nvda.ws/46vo4Dh AMD 的 AI,@AIatAMD,共同推动人工智能创新。与开发人员一起构建,为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。 我们很高兴能成为其中的一员#OpenSourceAIWeek在旧金山 — 10 月 18 日至 26 日,为期一周的 Gen AI 和 ML 开源创新庆祝活动。https://opensourceaiweek.com 我们很高兴在#OpenSourceAIWeek10 月 18 日至 26 日,为期一周的庆祝活动#OpenSource创新#GenAI& 毫升。https://bit.ly/3I8WbI4 内存减少 70%。2× 更快的微调。 这就是 Unsloth 为开源 LLM 提供的服务。由 AMD Instinct™ GPU 和 AMD ROCm™ 软件提供支持。 Daniel Han 解释了他们如何为每个人带来高性能微调。观看 Daniel Han 在 AMD Advancing AI 2025 上的技术演讲:https://youtu.be/itPgD0yjKg0 高通,@Qualcomm,无处不在地提供智能计算。 本周在#AI 高通和 @nexa_ai 将多模态设备端 AI 引入手机、汽车、PC 等,由 Qualcomm Hexagon NPU 提供支持:https://bit.ly/3VLfSsq @TheRegister 与高通副总裁 Upendra Kulkarni 讨论了如何#SnapdragonXSeries正在推动个人计算的转变,促进设备上人工智能的兴起:https://bit.ly/41NIll1 高通 & @BMW 发射 @Snapdragon Ride Pilot,一种新的自动驾驶堆栈,提供从入门级到高速公路的便捷、安全第一的自动驾驶:https://bit.ly/467IhO7 不是另一个有故障的虚拟会议......Qualcomm 视频协作解决方案专为企业混合型员工打造,利用 Qualcomm#Dragonwing处理器,增强#AI驱动性能和#IoT连接。开始提升每一次互动: 设备上#AI正在快速加速。跟 @nexa_ai ,我们将 OmniNeural 4B 和 NexaML 引擎直接引入我们的 Qualcomm Hexagon NPU,为移动、物联网等带来可扩展的多模态智能。了解更多信息: 百度公司,@Baidu_Inc,百度是一家领先的人工智能公司,拥有强大的互联网基础。 现在坐在#1在 HF 上查看:https://huggingface.co/baidu/ERNIE-4。5-21B-A3B-Thinking 在此处了解有关该模型的更多信息:https://yiyan.baidu.com/blog/posts/plas/ 引用 百度公司 @Baidu_Inc · 9月12日 ERNIE-4.5-21B-A3B-Thinking 现在是最热门的文本生成模型,在总体上排名第三@huggingface.> 21B 总参数,每个代币 3B 活跃参数 增强的 128K 长上下文理解能力 具有接近 SOTA 智能的轻量级 MoE 模型 浑源,@TencentHunyuan,腾讯大模型,包括文本生成、图像生成、视频生成和 3D 生成。@我随时! HunyuanImage 2.1 量化版现已开放本地部署!使用至少 24GB 的 VRAM,您现在可以在自己的硬件上运行该模型。 拥抱脸:https://huggingface.co/tencent/HunyuanImage-2.1 感谢大家对浑元图像2.1的喜爱和反馈!以下是我们社区集成的快速更新和一些使用技巧。✅ 对 @ComfyUI 感谢他们在整合方面的工作。它仍在进行中,我们将在准备就绪后立即分享更新。我们还在加速开发具有更低 VRAM 要求的量化版本。这将很快推出!专业提示:HunyuanImage 2.1 是原生 2K 模型。为获得最佳效果,请使用 2K 分辨率和纵横比。 为了获得完整的体验,您可以在我们的官方网站或 Hugging Face 演示上试用该模型。我们也很想听听您的反馈和建议。HF 演示:https://huggingface.co/spaces/tencent/HunyuanImage-2.1网站:https://hunyuan.tencent.com/imageGitHub:https://github.com/Tencent-Hunyuan/HunyuanImage-2.1拥抱脸:https://huggingface.co/tencent/HunyuanImage-2.1 以下是我们新的 HunyuanImage 2.1 可以创建的内容的初步介绍。下面的所有视觉效果都是使用该模型直接从文本提示生成的,展示了其先进的文本渲染和原生 2K 图像生成。 Qwen,@Alibaba_Qwen,AGI 的开放基础模型。 Qwen3-Next 刚刚在 Together AI 上发布 80B参数,3B激活。 两种型号:⚡思考:在推理基准测试上优于 Gemini-2.5-Flash-Thinking易Instruct:在关键任务上匹配 235B 模型性能 Qwen Code v0.0.10 和 v0.0.11 带来了新功能和开发人员友好的改进:✨新的用户体验和生产力 · 用于更智能任务分解的子代理 · 用于任务跟踪的待办事项写入工具 · “欢迎回来”项目重新开放总结! · 可定制的缓存策略⚡性能和开发体验 ·更流畅的编辑(无代理循环) ·内置终端台压力测试 ·更少的重试次数和更好的登录处理 ·针对大型项目优化文件读取 ·增强的 IDE + shell 集成 ·更好的 MCP 和 OAuth 支持 ·改进的内存/会话管理 ·更新了多语言文档立即试用:https://github.com/QwenLM/qwen-code 数据砖,@databricks,Databricks 是一家数据和 AI 公司,帮助数据 + AI 团队解决世界上最棘手的问题。 到 2027 年,几乎每个企业都将使用 GenAI 正确的 AI 代理使 GenAI 应用程序准确、可扩展并根据业务需求量身定制。 本指南涵盖: -代理如何腾出时间进行战略工作 -实际示例 -以及更多https://databricks.com/resources/guide/boost-genai-roi-ai-agents?utmsource=twitter&utmmedium=organic-social&utm_scid=701Vp00000Gf8z0IAB 构建管道、仪表板和 AI 模型的实用方法指南在这里,您可以找到跨用例和行业的通用数据和 AI 项目的设计,包括: - 安全湖屋的参考架构 - 数据摄取参考架构 - Databricks 上的智能数据仓库 - 还有更多! 查看 Databricks 体系结构中心:https://databricks.com/resources/architectures?utmsource=twitter&utmmedium=organic-social Entra ID 的自动标识管理现已在 Azure Databricks 上正式发布! 不再需要手动预配或复杂的 SCIM 设置:用户、组(甚至是嵌套组)和服务主体会自动同步。 了解如何简化标识管理并加速 Azure Databricks 上的协作:https://databricks.com/blog/automatic-identity-management-entra-id-now-generally-available-azure-databricks?utmsource=twitter&utmmedium=organic-social “我认为我们正在走向一个多人工智能非常重要的世界。这比多云更重要,因为在模型之间切换非常容易。他们没有同样的锁定效应——你可以与他们互动,得到答案,然后继续前进。 我们的首席执行官 @alighodsi 与 CNBC 讨论了他对 AI 代理的预测、为什么 lakebase 对企业 AI 至关重要以及开源趋势 @dee_bosa .在这里观看对话:https://youtube.com/live/tJZH7p1nhNY?si=1mW8RX3Cz8aHxhAv 扩展 AI,@scale_AI,要制作最佳模型,您需要最佳数据。 许多学生已经依靠人工智能来帮助他们的学习。但今天的模特准备好担任导师的角色了吗? 为了回答这个问题,我们创建了 TutorBench:一个衡量人工智能辅导技能的新基准。辅导不仅仅是给出正确的答案,而是提供清晰的解释、有意义的反馈和指导主动学习。 虽然目前的模型显示出希望,但即使是最强的模型的得分也略高于 55%,这表明还有很长的路要走。 扩展 AI @scale_AI · 9月13日 TutorBench 帮助我们了解人工智能的现状,以及如何引导它成为学生更安全、更可靠的学习伙伴。 拥抱脸,@huggingface,构建未来的人工智能社区。http://hf.co/jobs 您现在可以直接在 VS 中访问 Groq 模型 @code 跟 @huggingface . 只是杨备炮。 我们免费的新实验跟踪库现在支持记录图像、视频、表格,当然还有指标。 引用 阿布巴卡尔·阿比德 @abidlabs · 9月11日 您现在可以使用@TrackioApp!许多 UI 改进使 Trackio 仪表板也感觉更快,尤其是在本地运行它时。 一致性,@cohere,Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案 随着企业人工智能的发展,控制是关键。我们已与 @Cohere 帮助企业部署安全的本地 AI 解决方案,专为✅数据隐私,✅speed 和✅规模。 了解 Cohere North 和 Dell AI Factory 如何使 AI 采用顺畅无阻。 人为的,@AnthropicAI,我们是一家人工智能安全和研究公司,致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈 我们与美国人工智能标准与创新中心 (CAISI) 和英国人工智能安全研究所 (AISI) 的合作表明了公私合作伙伴关系在开发安全人工智能模型方面的重要性。 人为的 @AnthropicAI · 9月13日 他们对 Claude Opus 4 和 4.1 等模型的持续测试帮助我们在部署前发现漏洞并建立强大的保护措施。 Anthropic Engineering 博客上的新功能:为 LLM 代理编写有效的工具。 AI 代理的强大程度取决于我们为它们提供的工具。那么,我们如何使这些工具更有效呢? 我们为开发人员分享我们的最佳提示: 默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。 无 D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。 无 中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。 一些快速更新!我们将样式浏览器中的样式数量增加了 7 倍(包括搜索)。样式热/顶部提要已修复,现在会不断更新和发展。我们已经做到了,当您查看“喜欢”时,您可以将它们过滤为仅图像、视频或样式。 稳定性人工智能,@StabilityAI,SD3.5 来了!无与伦比的定制、社区友好的许可和卓越的图像质量。 今天,我们推出了 Stable Audio 2.5:第一个为企业级声音制作而构建的音频模型音频对品牌参与度的影响高达 86%,但很少有企业将音频作为其品牌的延伸,这使得定制声音成为一个尚未开发的差异化因素。 Stable Audio 2.5 专为大规模创建可定制的高质量音频而构建,其功能包括:▶️改进的音乐创作:生成具有多声部结构的完整歌曲,这意味着清晰的前奏、中间和结尾。▶️音频修复:输入音频,选择轨道应开始的位置,模型使用上下文生成轨道的其余部分。▶️定制:我们的团队可以微调 Stable Audio 2.5,帮助企业为其品牌打造合适的声音。▶️更快的推理:该模型可以在 GPU 上在两秒内生成长达三分钟的曲目,只需 8 个步骤即可输出(而之前的模型为 ~50 个步骤)。 您可以在此处了解更多信息 http://bit.ly/46uYmxR 随着 Stable Audio 2.5 的推出,我们还与领先的声音品牌机构放大器合作,该放大器隶属于 Landor Group,一家 @WPP 公司,为希望创造标志性声音身份和体验的创新品牌共同开发企业解决方案。 稳定性人工智能 @StabilityAI · 9月10日 您现在可以在以下位置试用 Stable Audio 2.5:http://StableAudio.com和 Stability AI API,以及通过我们的平台合作伙伴 @Fal , @Replicate 和 @ComfyUI . Fireflies.ai,@firefliesai,,#1 会议人工智能队友, 从什么时候开始,人们假装自己是他们没有创办的初创公司的创始人。听起来像是一些阴暗的计划来推动一些加密项目。 请提防并举报 @thesxander 不言而喻,他不是 @firefliesai 收听自动化魔法彩我们很高兴展示萤火虫 + @n8n_io 工作流每周可以为您节省数小时。我们的集成团队将带来现场演示、真实模板和动手 AI 用例。 抢到前排座位:http://luma.com/50ubl92t 递归,@RecursionPharma,解码生物学,从根本上改善生活。药物发现的工业革命已经到来。 为什么人工智能比人类更适合早期癌症检测。 在我们的 TechBio Talks 播客第一集中的剪辑中, @BarzilayRegina ,人工智能教师负责人 @AIHealthMIT ,向主持人 Najat Khan 讲述了人工智能对当今患者产生有意义影响的方式之一——更早地发现癌症。她说,癌症涉及一个漫长的组织转化过程,放射科医生通常只有在肿瘤足够大时才能看到癌症的证据——在数十亿个细胞积累之后。 人工智能工具,如里贾纳用于乳腺癌检测的 Mirai 工具,已经使用数百万张图像以及相关患者的结果进行了训练,以“识别这些人眼难以识别的非常微妙的迹象”。 *TechBio Talks 链接 现在的山峰是大本营。 中的一项新功能 @pharmaphorum 着眼于 Recursion 如何建立必要的基础,现在正在加速进入人工智能主导的药物发现的新时代,专注于为患者提供变革性的一流药物。它涉及:▪️值得信赖的数据:作为首席平台官,Lina @LinaZNilsson ,解释说:“做好机器学习的基础是拥有你信任的数据。我们花了十多年的时间来建立这一基础,现在拥有超过 65 PB 的高质量专有多模态数据。▪️公正的发现:人工智能使我们能够在没有人类偏见的情况下解码生物学的复杂性。正如生物学主任、RSB 研究员 Elena Fonfria 博士所指出的那样,“计算机不会感到疲倦。计算机没有偏见“,使我们能够找到新的联系和药物靶点。▪️一流的药物:我们的创始研究员 Michael Genin 的工作受到他自己十几岁时被诊断出患有癌症以及母亲死于癌症的推动,他致力于寻找解决新型生物学问题的一流分子。我们的人工智能平台正是为了做到这一点而设计的,超越渐进式改进,提供变革性的药物。 奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。 今天,我们展示我们屡获殊荣的纪录片 - Je Suis Elodie。它如下 @ElodiePronier ,我们的生物医学发现副总裁,因为她的家庭和工作生活与她的乳腺癌诊断和治疗发生冲突。 入选罗马国际等9个国际电影节 Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱,多伦多大学 无 Yann LeCun (@ylecun) - Meta首席AI科学家,卷积神经网络之父 新闻界的新鲜报纸:收益递减的幻觉:衡量法学硕士的长期执行力。 小模型是代理人工智能的未来吗?由于收益递减,扩展 LLM 计算是否不值得付出代价?自回归法学硕士是否注定要失败,而思维是一种幻觉? LLM 扩展的熊果案例都与一个功能有关:长视野执行。然而,这正是您应该看好缩放模型大小和测试时计算的原因! 首先,还记得 METR 图吗?这可能是 @ylecun 的复合误差模型 模型的地平线长度呈超指数增长( @DaveShapi )的单步精度。 结果 1:不要被典型短任务基准测试的进度放缓所迷惑 这足以使地平线长度呈指数级增长。 但我们超越了 @ylecun 的模型,根据经验测试 LLM...... 对于法学硕士来说,公正的执行也很困难,即使你为他们提供了所需的计划和知识。 我们不应该将执行失败误解为无法“推理”。 即使小型模型具有 100% 的单步精度,大型模型也可以执行超过成功率阈值的更多回合。
注意到随着任务时间的延长,您的座席的表现如何变差?这不仅仅是长期上下文的限制...... 我们观察到:自我调节效应! 当模型看到他们在历史早期犯的错误时,他们就更有可能在未来的回合中犯错误。 增加模型大小会使这个问题恶化 - 这是反向缩放的罕见情况! 那么思考呢......? 思考不是幻觉。它是执行的引擎! 即使是 DeepSeek v3,Kimi K2 在被要求在没有 CoT 的情况下执行时,甚至无法潜在地执行 5 回合...... 使用 CoT,他们可以做 10 倍以上的事情。 那么边疆呢? GPT-5 Thinking 远远领先于我们测试的所有其他模型。它可以一次性执行 1000+ 步任务。 以 432 步排在第二位的是 Claude 4 十四行诗......然后是 Grok-4 的 384 Gemini 2.5 Pro 和 DeepSeek R1 远远落后,仅为 120。
这就是 GPT-5 代号为 Horizon 的原因吗?樂> 开源有很长的;)好! 让我们一起成长吧!我们发布所有代码和数据。 我们进行了长时间的深入研究,并在下面向您展示最好的外卖和精彩的情节 Andrew Ng (@AndrewYNg) - Coursera联合创始人,斯坦福教授 无 Fei-Fei Li (@drfeifei) - 斯坦福HAI院长,ImageNet发起人 医 管 局!这是我一直在思考的有趣且完全随机的事情:正如奥利弗·萨克斯 (Oliver Sacks) 优美地写道——“两片雪花之间的空间是什么?语言可以以复杂的细节描述所有事物、事物和人。但是,介于所有这些之间的“空间”和“虚无”呢?没有这种“虚无”,空间就不存在,事物就会移动。蝴蝶从一朵花到另一朵花的优雅路径就像蝴蝶落在一朵花上的事实一样令人好奇和耐人寻味...... Sam Altman - OpenAI CEO,ChatGPT背后的推动者。X账号:@sama背景:领导生成式AI的普及,关注AI安全和监管。 我怀疑社会有电话文化比会议文化更好 山姆·奥特曼 @sama · 9月10日 我一段时间以来非常想要的第一次新 iPhone 升级!看起来很酷。 Sundar Pichai - Google/Alphabet CEO,主导Google AI战略。X账号:@sundarpichai背景:推动Google在AI搜索、云服务和硬件中的应用。 Veo 3 和 Veo 3 Fast 现已在 Gemini API 中正式发布。根据开发者的反馈,我们还推出了对垂直格式输出(9x16 宽高比)、1080p 高清输出的支持,并将价格降低了近一半。 Satya Nadella - Microsoft CEO,领导Azure AI和OpenAI合作。X账号:@satyanadella背景:将AI整合到微软生态系统,主导Copilot等产品。 我们正在与以下品牌合作,例如 @RalphLauren 利用我们值得信赖的人工智能功能创造引人入胜的沉浸式购物体验。 Ask Ralph 是 Ralph Lauren 应用程序中一款新的人工智能对话式造型伴侣,是人工智能如何重新定义零售购物体验的最新例子:https://msft.it/6014si3JK Greg Brockman - OpenAI联合创始人兼CTO。X账号:@gdb背景:推动GPT系列模型的技术发展。 让 GPT-5 为你编写提示: 引用 杰米·沃伊诺 @jamievoynow · 9月13日 我让 gpt5 驱动提示英语,并且对结果的好程度感到非常震惊。有点疯狂。我开始认为 DSPy 的理念一直都是正确的 一年前的今天,OpenAI 推出了 o1 预览版,我们蹑手蹑脚地进入了停下来思考的模型时代。那时我们靠口粮生活,每周在 o50 预览上发送 1 条消息,每天在 o50 mini 上发送 1 条消息。现在我们正在与 GPT 5 思维模式聊天,这是一个巨大的飞跃 Lisa Su - AMD CEO,AI芯片竞争的关键人物。X账号:@LisaSu背景:推动AI优化芯片发展,与NVIDIA竞争。 无 Jeff Dean - Google高级副总裁,Google Brain创始人。X账号:@JeffDean背景:领导TensorFlow等AI基础设施开发。 在 App Store 中排名第一。恭喜 @GeminiApp 团队的辛勤工作,这只是一个开始,还有更多! 引用 里哈德·雅克 @RihardJarc · 9月13日 哇$GOOGLGemini 在美国 iOS 上的下载量已超过了 ChatGPT。 值得关注的是,因为 ChatGPT 几个月来一直统治着积分榜。$GOOGL执行和产品发货显示结果...... VaultGemma 是一个开放模型的发布,从头开始训练有差分隐私。 下面的博客文章和技术报告链接的完整技术报告有一些很好的分析,以呈现差分私有语言模型的缩放定律: 博客:https://研究.google/blog/vaultgemma-the-worlds-most-capable-differentially-private-llm/纸:https://arxiv.org/abs/2501.18914 Mustafa Suleyman - DeepMind联合创始人,Inflection AI创始人。X账号:@mustafasuleyman背景:推动AI在对话系统中的应用。 非常有趣的兔子洞,可以尝试在 Copilot Labs 中生成音频的所有不同模式、语音和风格组合。试一试,在评论中留下你最喜欢的——越有趣越好。https://copilot.microsoft.com/labs/audio-expression 你问了,我们发货了!脚本模式刚刚在 Copilot Labs 中删除了用于音频生成(c/o 我们的新 MAI-Voice-1 模型)。 脚本模式:逐字读取输入 情感:有点即兴重复段以达到最大的戏剧性 故事:表演多种声音/角色 尝试全部 3 个➡️ https://copilot.microsoft.com/labs/audio-expression Oriol Vinyals - Google DeepMind研究员,AlphaStar项目负责人。X账号:@OriolVinyalsML背景:AI在游戏和策略领域的应用专家。 无 Andrej Karpathy - 前Tesla AI总监,OpenAI研究员。X账号:@karpathy背景:自动驾驶AI和计算机视觉领域的专家。 我突然意识到,比 1B GPT-175 好得多的 3B 以下参数模型在今天已经是一毛钱一打了。有点酷。 Jack Clark - Anthropic联合创始人,AI政策专家。X账号:@jackclarkSF背景:关注AI对社会的影响和治理。 SB 53 已被加州立法机构投票淘汰,并正在前往 @CAgovernor 书桌。该法案将使我们所有人对强大的人工智能系统和构建它们的公司具有更大的透明度。我们敦促州长签署该法案。 引用 人为的 @AnthropicAI · 9月8日 Anthropic 支持加利福尼亚州参议员斯科特·维纳 (Scott Wiener) 的 SB 53。该法案为管理像我们这样的前沿人工智能公司构建的强大人工智能系统提供了坚实的基础,并且通过透明度而不是技术微观管理来实现。 下周,我将在华盛顿特区举行的人类未来论坛上与达里奥一起主持一场关于人工智能和人工智能政策的 AMA。将您的问题放入此表格中,我们将在舞台上提出。https://docs.google.com/forms/d/e/1FAIpQLSfxd6GNuXpZJgLcWhfkvXosBJv66iX5JHXKU-BhIW1nbQzyvg/viewform?usp=sharing&ouid=114019517539498872277 引用 杰克·克拉克 @jackclarkSF · 9月4日 Dario 和我将于 9 月 15 日在华盛顿召集政策制定者,深入了解 Anthropic 的最新进展,并分享人工智能如何应用于国家安全、科学和公共服务的现场演示。注册参加:https://website.anthropic.com/events/futures-forum-2025 杰克·克拉克 @jackclarkSF · 9月11日 离开正规公司的人:是时候改变一下了!对我的下一章感到兴奋! 离开AI公司的人:我凝视过无尽的黑夜,外面有形状。我们必须善待彼此。我将继续学习哲学。 Reid Hoffman - LinkedIn联合创始人,Greylock Partners投资人,AI伦理倡导者。X账号:@reidhoffman背景:投资多个AI初创公司,探讨AI与工作的未来。 @StanfordHAI 今天的“人工智能的下一次革命:影响力峰会”上的专家敦促我们以合理的乐观和韧性引导人工智能的未来,造福社会和子孙后代。该活动汇集了顶尖人才,讨论人工智能在科学、工业及其他领域的下一波浪潮。 Patrick Collison - Stripe CEO,支持AI支付与业务优化技术。X账号:@patrickc背景:推动AI在金融科技中的应用 观察我身边一些患有慢性疾病的人,令人惊讶的是 Reddit 经常最终发挥作用。我认为一个核心原因是因为试验并不是针对很多事情进行的,而 Reddit 提供了一种紧急情报,介于任何一位医生都可以组织的情报和临床试验的完全严谨性之间。 为什么很多事情都不进行试验?好吧,它们当然是缓慢且昂贵的(19 年关键试验的中位数成本为 $2015M[1];在调整通货膨胀和其他阶段后,也许这相当于今天的总成本 $40M?但是,当相关干预缺乏知识产权保护时,它们也很难获得资金,因为随之而来的知识无法货币化。因此,饮食、非处方补充剂和生活方式干预的试验进展不足。举一个平淡无奇的例子,很多人认为镁可以改善睡眠,但据我所知,从来没有进行过试验来评估镁改善没有睡眠障碍的非老年人睡眠的能力。 因此,Reddit 以一种非常非结构化的方式使有限的“复合知识”成为可能。最佳实践可以被注意到,并且可能会不完美地开始积累。对于有慢性健康问题的人来说,这是一件大事,我听过很多故事,从“我发现了一些让我的病情更容易控制的东西”一直到“我在一条深埋在帖子中的奇怪评论中找到了永久的治疗方法”。(当然,人们在医疗条件之外也看到了这一点。我很喜欢 BodyWeightFitness Reddit 子版块中推荐的例程,作为一种类似的提炼实用智慧[2]。 这种方法的一个有趣且更正式的例子最近被用于长期 COVID,并于今年早些时候发表[3]。在对 3,900 人进行调查后,该论文分析了患者报告的 150 种不同治疗的结果,得出了如下图。显然没有灵丹妙药,但令人惊讶的是,比如说,大约一半的人发现抗组胺药是有帮助的。我认识很多人,他们发现这项研究的经验教训对改善他们的日常生活质量有影响。 看到这篇论文和 Reddit 的经验,我想知道这种方法是否可以以某种方式进行扩展:是否有一种观察性的、自我报告的临床试验可以介于 Reddit 和这些手动方法之间?是否应该有一个涵盖所有主要慢性病、管理正在进行的调查并跟踪纵向结果的平台? 我真的不知道最好的方法是什么,但我觉得这里可能有一些重要的事情。患者主观体验中有很多潜在数据,如今没有得到适当的收集或分析。 Emad Mostaque - Stability AI创始人,Stable Diffusion背后推手。X账号:@EMostaque背景:推动开源AI生成模型。 Nick Bostrom 的 OGI 想法很有趣,但我认为股票或股息在 AGI 中不起作用,因为。 如果 OpenAI 达到 100 万亿美元,而只有美国公民获得 10%,每人 29 美元。 但那是股票,而不是流量。 5% 股息(公用事业公司级别)=每年 > 1.5 美元,贫困线为每年 16 美元。 几乎✅便宜✅好✅我估计这个成本< 500 美元的计算来训练,并且优于去年的几乎所有模型 这里有很多有趣的技术选择,将非常适合连续的 RL 等等 混合很有意义 Alexandr Wang - Scale AI创始人,AI数据标注领域的领导者。X账号:@alexandr_wang背景:为AI模型提供高质量训练数据。 无 Clement Delangue - Hugging Face CEO,AI开源社区推动者。X账号:@ClementDelangue背景:构建AI模型共享平台。 Q.谁对齐矫正器? 一个。http://alignmentalignment.ai今天,我很荣幸地宣布一个划时代的事件:人工智能对齐中心对齐中心的启动。 ERNIE-4.5-21B-A3B-Thinking 刚刚在总体上达到 #1 @huggingface 趋势模型。 查看模型页面:https://huggingface.co/baidu/ERNIE-4。5-21B-A3B-Thinking ** Vinod Khosla - Khosla Ventures创始人,AI初创公司早期投资者。X账号:@vkhosla背景:投资多个AI健康和能源项目。** 如果 @Google 那么就是一个坏演员 @people 未经他人许可窃取他人的照片更糟糕吗?挪用别人的脸来赚钱? 维诺德·科斯拉 @vkhosla · 9月13日 “我们不是在寻找完全全面发展的人,我们是在寻找非常擅长一两件非常重要的特定事情的人。” @eglyman 之 @Ramp 尽早押注杰出人才。 Ben Horowitz - Andreessen Horowitz联合创始人,AI商业化推动者。X账号:@bhorowitz背景:支持AI与企业服务的结合。 Replit 的重大突破 引用 阿姆贾德·马萨德 @amasad · 9月10日 AI 代理可以制作应用程序原型......但是,交付真正的软件需要数小时的测试、调试和重构。 特工 3 的自主性提高了 10×——它会继续在其他人陷入困境的地方前进 Elad Gil - 独立投资者,前Twitter高管,AI独角兽支持者。X账号:@eladgil背景:投资生成式AI和数据平台。 当我们在 @OpenAI 一年前发布的 o1-preview,它会想几秒钟。今天,我们最好的推理模型可以思考数小时、浏览网页和编写代码。 但还有很大的空间可以进一步推动推理。我对明年会发生什么感到兴奋! Chris Dixon - Andreessen Horowitz合伙人,AI与区块链结合的推动者。X账号:@cdixon背景:投资AI驱动的Web3项目。 无 Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute 在今天的《纽约时报》中,我介绍了 Eliezer Yudkowsky,他是 AI 的厄运预言家,也是现代硅谷最有趣(也是最具争议性)的人物之一。 从鼓舞 OpenAI 和 DeepMind,到用哈利波特同人小说一蹴而就的一代年轻理性主义者,再到建立人工智能安全的智力基础,他的影响力比人们意识到的要大得多。现在,他出版了一本新书,呼吁彻底关闭人工智能竞赛,这样我们就不会都死。 享受!https://nytimes.com/2025/09/12/technology/ai-eliezer-yudkowsky-book.html?unlockedarticlecode=1.lU8.ALkU.Qne6o4IgeeEP&smid=url-share Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley GEPA 现在可以通过 ax(TypeScript 中的 DSPy)在 TypeScript 中使用。令人惊叹的工作 @dosco ! 我在 @VLDBconf 关于为什么我们认为是时候重新考虑 OLTP 数据库和 Lakebase,它结合了云原生 Postgres 设计 @neondatabase 与 Lakehouse。原因包括云、对 DW 的需求不断变化,使其更加实时,以及 AI 代理。幻灯片⬇️ Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face 10 月 10 日至 11 日与主持人进行的又一次精彩通话,参加 Kids-AI-Coding 黑客马拉松 我们刚刚增加了我们的第一个非洲东道主。我们现在在五大洲都有东道主 您仍然可以在以下位置加入https://kidsaicoding.com/kids-hackathon-worldwide/host-application 人工智能领域最安静但最疯狂的转变之一是小模型正在成为绝对的野兽 引用 奥马尔·哈塔布 @lateinteraction · 9月13日 我突然意识到,比 1B GPT-175 好得多的 3B 以下参数模型在今天已经是一毛钱一打了。有点酷。