每周国内外AI发展动态研究-2025年9月16至18日 按:从2021年开始,关于区块链发展动态,通过每日国外区块链发展动态来进行研究,从最初每天都会通过X研究相关的行业代表性人物、代表性项目,后面发展为不定期但最多一周会有一两次研究,坚持了有五年,几经更换研究的对象人物和代表项目,包括后来另一个项目:研究当月获得融资的区块链项目也有五年以上; 关于区块链的研究,应该是成功的; 关于AI的研究,除了前几年批量阅读些AI类书籍外,今年前几个月,因为大模型的流行,我有几个月研究了大模型产品、周边的DOCKER VSCODE python dify等产品,甚至研究了具体的应用部署、应用案例,陷入技术细节,我感觉不应该这样,于是决定从AI和产品部署类应用脱离出来;我于今天20250801在坐车时,突然决定应该仿照区块链研究的路径,也做个AI每日发展动态研究,找到国内外最牛的100个AI人物(以X为研究媒体,这些人物可能很多没有X账号或不活跃,则略去)和AI项目(拟再做个专题研究)也做个系列,这比陷入AI产品细节里更适合我当前需要; 初步决定每周一到两次;以后有变化再说; 此为志。 第一次调整(2025年8月5日):删除X不活跃的AI人物,增加了排名靠前的X活跃的AI类项目若干。 开放人工智能,@OpenAI,OpenAI 的使命是确保通用人工智能造福全人类。 我们听到了您的反馈,GPT-5 Thinking 有时可能需要比您希望的更长的时间。现在,Plus、Pro 和 Business 用户可以设置节奏以匹配当下。 在 Web 上的 ChatGPT 中选择 GPT-5 with Thinking,以在消息编辑器中切换思考时间。 - Plus、Pro、Business 有 Standard(新默认,平衡速度和智能)和 Extended(Plus 之前的默认值) - Pro 还有 Light(最活泼)和 Here(更深) 您的思考时间选择将保留在以后的网络聊天中,直到您更改它。 我们的通用推理模型解决了 2025 年国际大学编程竞赛 (ICPC) 世界总决赛的所有 12 个问题,这是世界顶级大学编程竞赛,足以获得人类排名第一名。 引用 穆斯塔法·罗哈尼内贾德 @MostafaRohani · 12小时 1/n 我真的很高兴与大家分享我们的@OpenAI推理系统在 2025 年 ICPC 世界总决赛中获得了 12/12 的满分,这是首屈一指的大学编程竞赛,来自世界各地的顶尖大学团队将解决复杂的算法问题。这将是,GPT-5 解决了大部分问题,突显了我们在向公众提供最智能、最广泛使用的人工智能模型之一方面所取得的成就。就在一年前,我们的推理模型智能度明显降低,成本也高得多。 今天,我们开发了 显示更多 开放人工智能 @OpenAI · 12小时 最后,恭喜今年的所有人 @ICPCNews 参与者。 您每年为比赛带来的才华、创造力和决心水平非同寻常;这就是 ICPC 如此特别的活动的原因。 今天,我们将发布与 @apolloaievals . 在对照测试中,我们发现了与前沿模型中的阴谋一致的行为,并测试了一种减少阴谋的方法。 虽然我们认为这些行为目前不会造成严重伤害,但这是我们正在准备的未来风险。https://openai.com/index/detecting-and-reducing-scheming-in-ai-models/ 显示更多回复 开放人工智能 @OpenAI · 12小时 我们的结果取决于阅读模型的推理(“思维链”),我们认为该领域还没有为具有不透明推理的评估感知模型做好准备。 在更好的方法出现之前,我们敦促开发人员保持思维链的透明度,以研究和减少阴谋。 我们更新了 ChatGPT 的个性化页面:个性配置、自定义指令和记忆现在都集中在一个地方。在接下来的几天内上线。 忘记自动完成——这是代理完成的。 在 OpenAI 播客的第 6 集中, @gdb 和 Codex 负责人 Thibault Sottiaux 加入 @andrewmayne 谈谈从代码建议到编码代理的飞跃、GPT-5-Codex 的推出,以及到 2030 年软件开发可能走向何方。 谷歌人工智能,@GoogleAI,让人工智能对每个人都有帮助。展现思维↓ 我们正在构建人工智能工具,以在整个创作过程中为创作者提供支持,并重新定义 @Youtube . 以下是我们在今年的#MadeonYoutube— Veo 3 即将登陆 YouTube Shorts,只需一个提示即可创建带有音效和语音的短视频剪辑。很快,我们还将推出新的Veo功能,例如为照片中的人物制作动画的能力。 — 使用 AI 进行编辑可将您的相机胶卷转换为初稿。Gemini 将分析原始素材,选择最佳时刻,并将其与音乐、效果甚至画外音配对。 — 很快,创作者就可以将口语变成音乐。借助我们新的语音转歌曲功能,您可以从视频中提取有趣的引言或令人难忘的短语,并使用我们的 Lyria 2 模型将其重新混音成您的 Shorts 歌曲。 Meta 的人工智能,@AIatMeta,我们与人工智能社区一起,通过开放科学突破可能性的界限,创造一个更加互联的世界。 Meta Connect 2025 来了!观看今晚@太平洋时间下午 5 点的主题演讲直播,了解 AI 可穿戴设备及其他领域的未来:https://meta.com/connect/ 隆重推出 DINOv3:一种通过自监督学习 (SSL) 训练的最先进的计算机视觉模型,可生成强大的高分辨率图像特征。在多个长期密集预测任务上,单个冻结视觉主干网首次优于专用解决方案。 在此处了解有关 DINOv3 的更多信息:https://ai.meta.com/blog/dinov3-self-supervised-vision-model/?utmsource=twitter&utmmedium=organic_social&utmcontent=video&utmcampaign=dinov3 Microsoft Azure,@Azure,Limitless innovation. ☁️ Follow along for the latest news and resources from the official 马克·鲁西诺维奇 (Mark Russinovich) 重返#MSIgnite重点关注最重要的主题。☁️期待云原生见解、现场演示,也许还有一两个惊喜嘉宾。 @RegularITGuy 有内幕消息:https://ignite.microsoft.com/en-US/blog?pblink-a962d6a72d5f4848a834d83d28ff6638&wt.mcID=Ignite2025esccorpsocootwMSEBlog_MarkR 不要让创新等待。9 月 23 日至 24 日在线加入我们,了解 AI 如何帮助您的组织有效地迁移到云。立即注册:https://msft.it/6019smejH 推出 AKS Automatic,这是 Kubernetes 上 AI 和云原生应用的最快生产路径。借助开箱即用的集群、自动化、智能默认值和保护措施,您可以更快地移动、简化运维、运行安全的工作负载并保持 AI 准备就绪。 AWS 人工智能,@AWSAI,在 AWS 上构建和扩展下一波 AI 创新浪潮, Breaking Barriers 即将来到都柏林,参加我们的首届 Agentic Networks 黑客马拉松本次黑客马拉松将重点关注由 Strands 和#AgentCore,可以在未来的网络中发挥作用。#AWS #agenticAI 如何 @BayerPharma 加速药物创新#AmazonBedrock 易 跟#AWS安全护栏 &#AmazonMacie在敏感数据保护方面,拜耳正在建立信任,同时更快地将新药推向市场。#generativeAI 准备好利用 AI 实现业务转型,但担心实施时间和成本?了解如何#AWS生成式 AI 创新中心已帮助客户提高数百万美元的生产力,并将运营成本降低一半。#generativeAI 重新思考 AI 代理:更少的僵化,更多的智能。易烙⚡借助 Strands Agents SDK 的模型驱动方法,LLM 可以动态选择工具和任务,无需复杂的编排。更智能的代理,更快的构建。#AWS #agenticAI 英伟达人工智能,@NVIDIAAI,面向商业领袖的最新突破和人工智能的未来。 人工智能代理正在成为新的数字劳动力,超越自动化来管理复杂的工作流程。 在 Agentic AI Day 上#NVIDIAGTC华盛顿特区,探索以下会议:安全、主权的生成式 AI | @googlecloud 加速 AI 工厂 | @LockheedMartin 使用代理 AI 保护联邦系统 | @IntelliGenesis @labs_ig 注册加入#AgenticAI日:https://nvda.ws/47TGPlf NVIDIA AI 播客的新功能:烙NVIDIA 高级研究经理兼西雅图机器人实验室负责人 Yashraj Narang 分享了 AI + 模拟如何加速机器人创新。在这里听:https://nvda.ws/4gtsnlT 加速英国的人工智能目标, @CoreWeave , @Microsoft , @nscale_cloud , @OpenAI 和 @NVIDIA 正在通过向国家数据中心增加 120K GPU 来建设国家的人工智能基础设施,使其成为该国历史上最大的人工智能基础设施部署。➡️https://nvda.ws/3KpoSRv“英国正在为人工智能工业革命建设基础设施。” AMD 的 AI,@AIatAMD,共同推动人工智能创新。与开发人员一起构建,为开发人员服务。通过开放的生态系统提供支持。由 AMD 提供支持。 如果您的桌面可以处理本地 AI 并扩展到企业基础设施,会怎样? @FrameworkPuter 的新台式机由 AMD Ryzen AI Max 提供支持,是您进入 AMD ROCm 生态系统和 AMD Instinct GPU 的启动板。▶️立即观看 →https://bit.ly/46I3tvB AMD ROCm 7.0 来了!现在支持 Instinct MI350 系列 GPU、扩展的 PyTorch 2.5 支持、优化的 BLAS/FFT/comm 库、更快的 HIP 编译器性能和企业部署功能。 探索 ROCm 7.0 提供的所有功能:https://bit.ly/3VkB1cU 高通,@Qualcomm,无处不在地提供智能计算。 @CristianoAmon 和 @Microsoft 的 @Satyanadella 聊#AI和重塑个人电脑: 引用 克里斯蒂安·阿蒙 @cristianoamon · 11小时 混合人工智能。本地模型。个性化体验。计算的未来就在这里——而且@Qualcomm和@Microsoft正在引领潮流。观看我的完整对话@satyanadella. 40 年的创新。未来无限可能。观看精彩片段#QualcommAt40庆祝活动 @SnapdragonStdm :最好的还在后头。 它#NationalCodingWeek我们正在赋能开发人员将#AI将愿景变为现实,以创新突破构建未来。探索我们的开发人员中心并开始构建:https://bit.ly/4psecSa 听听高通的 @JohnEdwardSmee 在最近的一次对话中 @POLITICO 关于如何#6G突破将改变道路#AI在设备上运行: 引用 约翰·斯米 @JohnEdwardSmee · 9月16日 很高兴与之交谈@aarontmak在@politico关于无线的未来。#6G将带来#AI直接到设备上,以实现更快、更直观的体验。我们还讨论了频谱以及如何推动 6G 向前发展。阅读更多:https://politico.com/newsletters/digital-future-daily/2025/09/12/5-questions-for-john-smee-00559910 高通 @Qualcomm · 9月16日 在不伤害传粉媒介或地球的情况下清除牧场上的有毒杂草?高通无线覆盖范围 + @Robotriks 正在通过#AI-安全、可持续地瞄准豚草的动力机器人。 百度公司,@Baidu_Inc,百度是一家领先的人工智能公司,拥有强大的互联网基础。 我们用一手真正的扑克牌测试了 ERNIE X1.1,让我们准备好在压力下弃牌。看看它的回应↓ ERNIE X1.1 能如何遵循说明?我们通过让 X1.1 起草详细的产品要求文档来测试这一点,同时坚持严格的格式和长度要求。↓ 浑源,@TencentHunyuan,腾讯大模型,包括文本生成、图像生成、视频生成和 3D 生成。@我随时! 我们很高兴推出新的 Hunyuan3D 3.0!它具有 3 倍的精度、1536³ 几何分辨率和 3.6B 体素超高清建模,可提供令人惊叹的细节。 突出:✅创建具有逼真面部轮廓和自然姿势的面部,创建真正逼真的高保真模型。✅精确地对输入图像进行集成,以使用分层生成策略重建复杂的结构,捕获隐藏的细节✅生成超清晰的专业级细节,增强纹理保真度和对齐方式,实现身临其境、逼真的设计视觉效果 通过混元3D AI引擎(20代)免费访问。可通过腾讯云 API 获得。改变游戏、电影、电子商务等!立即试用:https://3d.hunyuan.tencent.com Qwen,@Alibaba_Qwen,AGI 的开放基础模型。 正在为 Qwen3-ASR-Flash 的 3 分钟限制而苦苦挣扎?没有了! Qwen3-ASR-Toolkit 简介一个免费的开源 CLI,用于高速转录长达数小时的音频/视频文件。释放 Qwen3-ASR-Flash API 的全部功能! 易智能 VAD 分割(没有尴尬的切割!⚡️并行处理,实现大规模加速通用媒体支持(MP4、MOV、MP3、WAV、M4A 等)从任何采样率自动重采样 从一个命令开始:“pip install qwen3-asr-toolkit” 在 GitHub 上查看:https://github.com/QwenLM/Qwen3-ASR-Toolkit LM Studio 现在在 Mac 上支持 Qwen3-Next 和 MLX — 太酷了!而那个Qwen水豚和LM Studio紫色小家伙简直太可爱了 引用 LM 工作室 @lmstudio · 9月17日 LM Studio 现在支持 Qwen3-Next 和 Mac 上的 MLX!淋 数据砖,@databricks,Databricks 是一家数据和 AI 公司,帮助数据 + AI 团队解决世界上最棘手的问题。 Databricks One 现已推出公共预览版! 在#DataAISummit我们推出了 Databricks One:一个简单、受监管且美观的主页,供每位员工访问 AI/BI 仪表板、Genie 和应用。 现在,公共预览版可供每个云中的所有工作区用户使用。 为什么这很重要: • 使每位员工都能民主化地访问数据和人工智能 • 通过内置的 Unity Catalog 治理安全扩展 • 加速采用,无需额外的许可成本 了解更多信息:https://databricks.com/blog/announcing-public-preview-databricks-one?utmsource=twitter&utmmedium=organic-social 如何衡量特定领域的 AI 代理的有效性? 标准 LLM 基准测试不足 — 您需要根据您的领域、工作流程和业务目标量身定制的评估框架。 了解正确的方法如何将 AI 代理从实验工具转变为具有可衡量影响的值得信赖的企业解决方案:https://youtube.com/watch?v=PZBUaVxdY0U 有效的 Agentic BI 不仅需要了解数字,还需要了解它们背后的业务概念。 这取决于三个要素: - 用于准确、受监管数据的统一基础设施 -大规模支持 AI 和 BI 的数据 - 一个开放的语义层,确保工具之间的一致性 了解统一这些元素如何为 AI 驱动的商业智能的下一个时代奠定基础:https://databricks.com/blog/delivering-agentic-bi-how-unify-infrastructure-data-and-semantics?utmsource=linkedin&utmmedium=organic-social Databricks Assistant 通过可自定义的说明变得更加强大⚡️现在,您可以根据自己的风格、库和团队标准定制 Assistant ,而无需每次都重复自己。 通过此更新,团队可以: - 为每次交互应用个人和工作区范围的指令 - 指导助手在聊天、内联修复和编辑模式下的行为 - 建立清晰、可重用的约定,以提高一致性和生产力 了解如何为组织自定义 Databricks Assistant:https://databricks.com/blog/customizing-databricks-assistant-instructions?utmsource=twitter&utmmedium=organic-social Databricks' @arikaplan1 分解了体育界大数据的起源,以及他认为大数据下一步的发展方向。 体育分析中的人工智能曾经被认为是未来的“下一个前沿领域”,现在已成为新常态——过去和现在的 Databricks 客户都在利用数据和分析来提供球员表现洞察并提高建模能力。 阅读更多内容 @TechTargetNews :https://techtarget.com/searchbusinessanalytics/feature/AI-in-sports-A-look-back-at-the-analytics-pioneers 扩展 AI,@scale_AI,要制作最佳模型,您需要最佳数据。 又一个重要的里程碑!Scale AI 已获得五角大楼价值 1 亿美元的协议。 我们很荣幸获得信任,并致力于通过安全、尖端的人工智能来促进国家安全。 拥抱脸,@huggingface,构建未来的人工智能社区。http://hf.co/jobs @AntLingAGI 蚂蚁金服的 Ling-Flash-2.0 刚刚上线 @huggingface - 100B MoE,6.1B 活性(4.8B 非嵌入) - 128k 上下文长度 - 在 20T+ 代币上进行训练 - 也提供基本型号 - 在推理任务上表现出色 - 麻省理工学院执照 推出 90+ 开源、最先进的生物医学和临床零样本 NER 模型 @HuggingFace 由 @OpenMed_AI Apache-2.0 许可并准备使用 基于GLiNER构建,覆盖12+生物医学数据集淋(1/6) 一致性,@cohere,Cohere 为现实世界的业务问题构建安全、可扩展的私有企业级 AI 解决方案 Cohere 正在欧洲、中东和非洲地区扩张! 我们很高兴地宣布,我们的新巴黎办事处将作为战略中心,以加强我们不断增长的业务并更好地支持整个地区的客户和合作伙伴。 加入我们,构建企业人工智能的未来: 人为的,@AnthropicAI,我们是一家人工智能安全和研究公司,致力于构建可靠、可解释和可指导的人工智能系统。与我们的人工智能助手交谈 我们发布了一份详细的事后分析,了解了 8 月至 9 月初期间影响 Claude 的三个基础设施错误。 在帖子中,我们解释了发生了什么、为什么需要时间来修复以及我们正在改变什么: 默夫人工智能,@MurfAIStudio,在几秒钟内将文本转换为逼真的语音。我们为使用语音进行构建的开发人员提供可流式传输、可扩展的自助式 API。 无 D-ID,@DID,D-ID 的人工智能平台支持以数字人为特色的动态视频和互动体验。 重大新闻!我们很高兴地宣布 D-ID 正在收购 @simpleshow 将两个尖端团队聚集在一起,为企业引领人工智能视频和交互式通信的步伐。 阅读 TechCrunch 文章中的所有详细信息>>https://eu1.hubs.ly/H0n4vTr0 珞热烈欢迎整个 simpleshow 团队。我们围绕着共同的卓越标准、与世界级品牌的信任关系以及一种交付、学习和提高标准的文化而团结起来。 下一步是什么:期待更快的推出,对学习与发展和营销产生更大的影响,以及一个您可以信赖的单一安全和私密平台。 下一章现在开始!请关注此空间以获取更新。 中途,@midjourney,社区支持的研究实验室 - 探索新的思维媒介并增强人类的想象力。 我们将样式浏览器中的样式数量再次增加一倍。不要忘记尝试右上角的模糊样式搜索功能。查看下面的视频示例。它很快! 稳定性人工智能,@StabilityAI,SD3.5 来了!无与伦比的定制、社区友好的许可和卓越的图像质量。 无 Fireflies.ai,@firefliesai,,#1 会议人工智能队友, 人工智能笔记员正在成为工作场所的标准配置,但风险是真实存在的 ⚖️加州 400+ 起与录音相关的法庭案件(2024 年)欧盟人工智能法案工作场所条款现已生效未经授权的数据训练的集体诉讼 企业正在重新评估供应商。 递归,@RecursionPharma,解码生物学,从根本上改善生活。药物发现的工业革命已经到来。 释放人工智能、机器学习和数据在药物发现中的力量 Recursion 自动化总监 Patrick Collins 将于 10 月 2 日作为 @LabOfTheFuture 阿姆斯特丹的欧洲——主题演讲和小组讨论——着眼于数据生成、互联模型和人工智能洞察力如何推动 TechBio 的新时代。 他将与以下人员一起参加小组讨论:▪️Christian Baber,首席投资组合官, @PistoiaAlliance ▪️Patrick Schorderet,数字战略与执行全球主管, @novonordisk ▪️Marc Smith,工艺开发首席产品经理, @IDBSsoftware 了解更多并注册:https://lab-of-the-future.com/europe/ 我们专注于去我们认为其他人无法到达的地方。” 9 月 8 日,Recursion 联合创始人兼首席执行官 @RecursionChris 首席研发官兼首席商务官 Najat Khan 博士在 @MorganStanley 第 23 届年度全球医疗保健会议。他们解决了医疗保健公司面临的宏观问题、平台的发展和 Boltz-2 的集成、管道战略以及我们对合作伙伴里程碑的预期。淋 奥金,@OwkinScience,Owkin 使用人工智能为每位患者找到合适的治疗方法。 Owkin 将前往 ESMO 2025 在 ESMO,我们将推出 K Pro:我们的企业级代理 AI 平台,可实现更快、更智能的管道决策。K Pro 建立在 9 年的人工智能创新和多模式患者数据之上,旨在加快研发速度并降低风险。 我们还将展示我们最新的人工智能诊断解决方案,将人工智能无缝集成到临床工作流程中,以产生现实世界的影响。 在 #4021 展位与我们会面,或在此处与我们的团队预约会面:https://calendly.com/esmo-2025 我们很高兴地宣布与 @IEOufficiale (IEO),意大利领先的癌症研究机构之一,也是全球肿瘤学领域的重要参与者,旨在推进人工智能驱动的肿瘤学研究。 我们正在与 IEO 一起探索人工智能如何加速医学发现并改善多种癌症类型的患者预后。此次合作将利用 IEO 广泛的临床专业知识和配备人工智能的 IEO 临床数据平台丰富的多模态数据集,开发和验证 Owkin 的代理人工智能解决方案,这些解决方案可以改变患者的诊断和治疗方法。 欧洲肿瘤研究所 IRCCS 病理学部主任 Nicola Fusco 教授评论道:“与 Owkin 的合作代表着在应用尖端人工智能改善患者治疗效果方面向前迈出了重要一步。通过将我们的临床专业知识与 Owkin 的创新人工智能方法相结合,我们的目标是加速开发能够为我们的患者提供更精确和有针对性的治疗策略的工具。 此次合作加强了我们在意大利充满活力的肿瘤研究生态系统中的影响力,并表明我们致力于与世界一流机构合作,为全球患者提供人工智能驱动的解决方案。 在我们的新闻稿中了解更多信息:https://owkin.com/newsfeed/owkin-partners-with-istituto-europeo-di-oncologia-ieo-to-advance-ai-driven-cancer-research-and-therapeutic-development Geoffrey Hinton (@geoffreyhinton) - 深度学习先驱,多伦多大学 无 Yann LeCun (@ylecun) - Meta首席AI科学家,卷积神经网络之父 Meta 刚刚将 AI 代理的训练速度提高了 25 倍。 这是机器人技术和复杂规划的突破。 Meta 的 FAIR 开源了一种名为可扩展选项学习的新方法。它以以前只有法学硕士才能看到的规模训练专业代理。 它的工作原理如下: 这种类型的 AI(使用分层强化学习训练的代理)训练缓慢的原因是并行化瓶颈。 想象一下,一个人工智能团队有一个计划者和许多专业工人(子任务)。旧方法很困难,因为它们必须在培训工人之前一一处理每个计划者的决定。 SOL 通过新的系统设计解决了这个问题: 单一、统一的大脑:它不是使用单独的模型,而是使用单一的参与者-批评者网络来容纳规划者(控制者策略)和所有工作者(选项策略)。 数字“开关”:它使用一个单热向量告诉这个统一的大脑在任何给定时刻扮演什么角色,一个标志,上面写着“对于这个输入,充当'导航'工作者”。这允许批处理不同策略的数千个不同决策并立即发送到 GPU。 用于学习的智能“过滤器”:在采取作后,它使用一种称为张量掩码的技术。将其视为一个智能过滤器,可确保正确的绩效反馈(奖励和优势)传递到正确的工作程序策略。这就是打破一次更新问题的原因。 这种架构允许整个分层系统并行批次学习,并消除阻碍该领域的瓶颈。 为什么这很重要: 这种新的训练方法改变了构建可以推理和执行长期任务的代理的可行性。- 商业领袖:这种架构是开发复杂自主系统的关键。25 倍的培训周期加快了机器人、物流和多阶段流程自动化的研发,使复杂的战略性人工智能在商业上实现。 - 从业者:作者计划开源 SOL。您可以实现学习长期技能的代理,而不会像旧的 HRL 方法那样降低性能,从而为更结构化、可能更强大的模型创建一条途径。 - 研究人员:本文提出了 HRL 缩放问题的经过验证的解决方案(第 3.2 节)。为分层代理启用高通量异步更新的系统是一个重大贡献,它为时间抽象和信用分配的大规模实验打开了大门。 Andrew Ng (@AndrewYNg) - Coursera联合创始人,斯坦福教授 新的短期课程:使用 MCP 服务器构建 AI 应用程序:使用 Box 文件构建 @Box 并由 @BenAtBox ,他们的首席技术官。 许多 AI 应用程序需要自定义代码来进行基本文件作。模型上下文协议 (MCP) 允许您将文件任务卸载到提供 LLM 可以直接使用的工具的专用服务器,从而对此进行标准化。 在本课程中,您将使用 Box MCP 服务器处理存储在 Box 文件夹中的文档。您将设计应用程序以使用通过 MCP 提供的工具,而不是编写自定义集成代码来连接到 Box API 并下载文件。 您将获得的技能: - 构建一个由 LLM 驱动的文档处理应用程序,使用 Box MCP 服务器访问文件 - 使用 Google 的代理开发工具包 (ADK) 设计一个多代理系统,该系统由用于文件作的专用代理组成 - 通过使用 Agent2Agent (A2A) 协议连接到代理的编排器协调多代理工作流 您将从本地文件处理应用程序开始,对其进行重构以与 Box 的 MCP 服务器配合使用,然后将其演变为多代理系统。 在这里注册:https://deeplearning.ai/short-courses/build-ai-apps-with-mcp-server-working-with-box-files/ Fei-Fei Li (@drfeifei) - 斯坦福HAI院长,ImageNet发起人 玩这个超级有趣! 引用 本·米尔登霍尔 @BenMildenhall · 15小时 生成的 3D 世界不仅用于观看,您还可以在里面玩弹丸叠叠乐 链接如下 我用世界实验室重新构想了我的客厅。Gemini 帮助设计了它,World Labs 生成了 3D 环境,VPS 将其本地化到我的空间 1:1 比例。 我现在可以在混合现实中进行持久的重新设计,并像物理存在一样探索它。它是如何建造的: 在整个历史中,人类共享一个 3D 世界。 @theworldlabs 联合创始人 @drfeifei 空间智能现在让我们能够生成和重建无限的宇宙,用于创造力、旅行、讲故事,甚至社交。 “它突然使我们能够以多元宇宙的方式生活。” Sam Altman - OpenAI CEO,ChatGPT背后的推动者。X账号:@sama背景:领导生成式AI的普及,关注AI安全和监管。 正确处理所有 12 个问题真是太棒了! 引用 穆斯塔法·罗哈尼内贾德 @MostafaRohani · 13小时 1/n 我真的很高兴与大家分享我们的@OpenAI推理系统在 2025 年 ICPC 世界总决赛中获得了 12/12 的满分,这是首屈一指的大学编程竞赛,来自世界各地的顶尖大学团队将解决复杂的算法问题。这将是 另外,恭喜所有ICPC世界总决赛参赛者——每位参赛者都将获得一整年的ChatGPT Pro。 我们很高兴看到您接下来会取得什么成就。 山姆·奥特曼 @sama · 13小时 回顾 OpenAI 品牌上 Area 的这次探索很有趣。这项工作部分启发了我们在产品中使用和喜爱的圈子。 Sundar Pichai - Google/Alphabet CEO,主导Google AI战略。X账号:@sundarpichai背景:推动Google在AI搜索、云服务和硬件中的应用。 很高兴能与 @PayPal 使在线交易更简单、更安全。 引用 亚历克斯·克里斯 @acce · 10小时 PayPal 正在与@Google为数十亿人带来更智能的购物——想想无处不在的代理商务和 PayPal 结账。全球规模,重新定义。对我们合作伙伴关系的新篇章感到兴奋@sundarpichai 不可信的里程碑:Gemini 2.5 Deep Think 的高级版本在全球顶级编程竞赛 ICPC 世界总决赛中获得了金牌表现,解决了令人印象深刻的 10/12 问题。在抽象问题解决方面取得如此深刻的飞跃——恭喜 @googledeepmind ! 很高兴见到这个布莱恩!构建代理生态系统的最佳方式是开放和团结。恭喜 @coinbase 将其 x402 协议扩展到 AP2。 引用 布莱恩·阿姆斯特朗 @brian_armstrong · 9月16日 x402 +@Google刚刚为 AI 代理解锁了一个新水平。 代理现在实际上可以相互支付,x402 为谷歌新的代理支付协议 (AP2) 内的稳定币轨道提供动力。真的很酷。 Satya Nadella - Microsoft CEO,领导Azure AI和OpenAI合作。X账号:@satyanadella背景:将AI整合到微软生态系统,主导Copilot等产品。 我们致力于为大西洋两岸的人们和企业创造新的机会,并确保美国仍然是英国值得信赖和可靠的技术合作伙伴。 这就是为什么我们今天宣布在四年内对英国投资 300 亿美元,包括建造该国最大的超级计算机,配备超过 23,000 个世界上最先进的 GPU,以扩展数字基础设施,使我们两国更加紧密地联系在一起。 集中数据不是终点线,而是起点。在#FabConVienna,Microsoft Fabric 获得了超越统一的新功能,通过实时上下文化数据为下一代 AI 代理提供支持。探索 Fabric 中的地图和图形:https://msft.it/6019smdnX Greg Brockman - OpenAI联合创始人兼CTO。X账号:@gdb背景:推动GPT系列模型的技术发展。 ICPC 是一项非常艰巨且有意义的挑战: 引用 鲍里斯·米奈耶夫 @bminaiev · 13小时 1/5 2015年,我作为ITMO大学团队的一员赢得了ICPC世界总决赛。这是总决赛历史上唯一一次有球队在比赛结束前解决所有问题。 用于将动画视频创建为 React 应用程序的 Codex: 引用 布伦南·麦凯克兰 @iambrennan · 9月16日 勞GPT-5-Codex 刚刚改变了我对未来的看法。 我需要一个内容丰富、视觉效果丰富的精美动画视频。这需要是一个反应应用程序,用于......原因。 Lisa Su - AMD CEO,AI芯片竞争的关键人物。X账号:@LisaSu背景:推动AI优化芯片发展,与NVIDIA竞争。 无 Jeff Dean - Google高级副总裁,Google Brain创始人。X账号:@JeffDean背景:领导TensorFlow等AI基础设施开发。 我很高兴地宣布,Gemini Deep Think 的高级版本在 2025 年 ICPC 世界总决赛(世界上最负盛名的编程比赛之一)上取得了金牌级别的表现!磊在我们的博客文章中了解更多信息:http://bit.ly/46rvjLs对我个人来说,一个鼓舞人心的时刻是,我们的模型解决了一个在比赛中没有大学团队解决的问题——这是一个真正的创新时刻。随着 Gemini Deep Think 在 ICPC 和 IMO 中达到黄金级,我认为我们看到了编码、数学和推理能力的泛化方面的深刻飞跃,为复杂问题生成新颖的解决方案。 这对我们来说是一个巨大的里程碑,踏上了一段奇妙的旅程。非常感谢和自豪我们的团队,感谢使这一突破成为可能的所有辛勤工作和团队合作。期待继续我们的研究,帮助人们使用 Gemini 解决世界上一些最棘手的未解决问题! 很高兴看到我们的 Gemini 模型在编码方面变得越来越好!Gemini 2.5 Deep Think进阶版在2025年国际大学生编程大赛(ICPC)世界总决赛上取得了金牌级别的表现! 阅读如何通过 @UChicago ,基于基于人工智能的 NeuralGcM 天气模型,由 @GoogleResearch ,被用于更准确地预测印度的季风季节,并支持印度 38M 农民的农民决策。 Mustafa Suleyman - DeepMind联合创始人,Inflection AI创始人。X账号:@mustafasuleyman背景:推动AI在对话系统中的应用。 技术是来为我们服务的,而不是为了有自己的意志和动力以及独立的欲望。这些系统应该适用于人类。它们应该节省我们的时间;它们应该让我们更有创造力。这就是我们创建它们的原因。 Oriol Vinyals - Google DeepMind研究员,AlphaStar项目负责人。X账号:@OriolVinyalsML背景:AI在游戏和策略领域的应用专家。 无 Andrej Karpathy - 前Tesla AI总监,OpenAI研究员。X账号:@karpathy背景:自动驾驶AI和计算机视觉领域的专家。 无 Jack Clark - Anthropic联合创始人,AI政策专家。X账号:@jackclarkSF背景:关注AI对社会的影响和治理。 我们刚刚发布了有史以来第一个对 150+ 个国家和美国所有 50 个州的真实 AI 使用情况的全面分析 - 以及交互式地图,以便您可以自己探索数据http://anthropic.com/economic-index.我们将在今天在华盛顿特区举行的未来论坛上分享更多相关信息。 Reid Hoffman - LinkedIn联合创始人,Greylock Partners投资人,AI伦理倡导者。X账号:@reidhoffman背景:投资多个AI初创公司,探讨AI与工作的未来。 推荐听我与 @PeterDiamandis ! 引用 Peter H. Diamandis,医学博士 @PeterDiamandis · 11小时 如果人工智能能够将人类的健康寿命延长一倍,结束入门级工作,并解码动物的言语......我们的未来将非常有趣。和我一起参加本周的 WTF 节目@reidhoffman: -- 人工智能扼杀初级工作并催生企业家 -- 修复美国创纪录的最低读数 & 1/ 当我第一次开始工作和投资人工智能时,它存在于研究实验室和技术人员的想象力中。 人工智能可以放大人类生活的每个角落的想法是大胆创新计划。 我们看到,随着人们将人工智能体验为日常魔法,大胆创新计划成为现实:它为曾经缺乏参与电影制作的资金、技能或团队的创作者解锁了一个超级机构。 里德·霍夫曼 @reidhoffman · 14小时 11/ 未来是人工智能作为基础,而不是前台。 那时我们将真正开始体验人工智能的魔力;当它淡出背景并成为现实时,塑造我们所说的话、我们讲述的故事以及我们建立的关系。 Patrick Collison - Stripe CEO,支持AI支付与业务优化技术。X账号:@patrickc背景:推动AI在金融科技中的应用 新品自 @arcinstitute :第一个功能性人工智能生成的基因组。 这是一个概念上的突破,但它也可能解锁对抗抗生素耐药性的新策略。 引用 塞缪尔·金 @samuelhking · 15小时 生物学中许多最复杂和最有用的功能都是在全基因组的尺度上出现的。 今天,我们分享我们的预印本“使用基因组语言模型对新型噬菌体进行生成设计”,其中我们验证了第一个功能性人工智能生成的基因组淋 您现在可以订阅印刷版 @WorksInProgMag ! 对于那些不熟悉的人来说,Works in Progress 是与 @stripepress . Stripe 的使命是提高互联网的 GDP。我们希望让世界上的创业更加成功 显示更多 帕特里克·科里森 @patrickc · 15小时 在这里订阅:https://worksinprogress.co/print/. Sam 的帖子中的更多细节:https://x.com/s8mb/status/1968320461571592323. Emad Mostaque - Stability AI创始人,Stable Diffusion背后推手。X账号:@EMostaque背景:推动开源AI生成模型。 自 o1 推理模型发布以来,已经过去了大约一年。 智能反转快速到来 引用 开放人工智能 @OpenAI · 13小时 回复 @OpenAI GPT-5 解决方案在第一次尝试提交给 ICPC 管理和批准的在线评审环境中时,12 个问题中有 11 个被正确解决 最后也是最具挑战性的问题,在GPT-5遇到后,我们的实验推理模型解决 Alexandr Wang - Scale AI创始人,AI数据标注领域的领导者。X账号:@alexandr_wang背景:为AI模型提供高质量训练数据。 恭喜 @scaleAI 团队与美国 CDAO 签订了另一份 $100M 的合同 @DeptofWar 我们继续致力于利用人工智能能力推进国家安全 引用 扩展 AI @scaleAI · 14小时 又一个重要的里程碑!Scale AI 已获得五角大楼价值 1 亿美元的协议。 我们很荣幸获得信任,并致力于通过安全、尖端的人工智能来促进国家安全。 Clement Delangue - Hugging Face CEO,AI开源社区推动者。X账号:@ClementDelangue背景:构建AI模型共享平台。 完全同意,我们仍处于周期的早期阶段,人工智能的情况将继续发生巨大变化。 例如,即使今天很多公司都使用通才 API 和 LLM,我怀疑从长远来看,大多数公司都希望基于开源(类似于大多数科技公司编写自己的代码的方式)训练自己的模型,为自己的用例和约束定制。 这将创造一个完全不同的领域,并彻底改变价值创造和捕获。迫不及待地想看看人工智能的未来如何展开! 引用 公理 @axios · 11小时 .@AMD主席兼首席执行官@LisaSu表示人工智能的技术拱门处于“非常早期的阶段”: “就人工智能技术和人工智能建设而言,我们可能处于一个巨大的 10 年周期中,我们可能已经投入了 2 年。”#AxiosAISummit 虽然我们正在努力发货第一批 Reachy Mini(计划在 9 月底之前),但我们发货时 @pollenrobotics @LeRobotHF 今年夏天,世界各地的研究实验室将推出一堆 Reachy 2。 这是弗劳恩霍夫工业工程研究所的开箱,该研究所是世界上最大的应用研究组织之一弗劳恩霍夫协会的一部分! ** Vinod Khosla - Khosla Ventures创始人,AI初创公司早期投资者。X账号:@vkhosla背景:投资多个AI健康和能源项目。** 如果 @Google 那么就是一个坏演员 @people 未经他人许可窃取他人的照片更糟糕吗?挪用别人的脸来赚钱? Ben Horowitz - Andreessen Horowitz联合创始人,AI商业化推动者。X账号:@bhorowitz背景:支持AI与企业服务的结合。 他们正在推出建立在同一基础上的两个产品的测试版。首先是一个移动应用程序,可以让任何人立即“重新拍摄”照片。下面是一个示例 @pmarca & @bhorowitz 从应用程序生成的照片: 我们需要人工智能的更多真相,我们会得到的! 引用 洋子 @stuffyokodraws · 9月17日 [新投资]我们@a16z在种子轮中处于领先地位@PhotaLabs:由前 Adobe 研究人员创立@ceciliazhang77 @zhihao_x96:他们解决了 GenAI 中最难的问题之一:在照片中生成真实的身份和背景 有些狂野@PhotaLabs生成的示例淋 Elad Gil - 独立投资者,前Twitter高管,AI独角兽支持者。X账号:@eladgil背景:投资生成式AI和数据平台。 幸运地获得了 1 小时的华尔街传奇 - 迈克·米尔肯 他支持 70 年代以后一些最重要的公司 米尔肯的开始 撼动华尔街 支持 MCI 和移动 美国梦中心 问答: 关税、债务、贸易战 生物医学的瓶颈 Chris Dixon - Andreessen Horowitz合伙人,AI与区块链结合的推动者。X账号:@cdixon背景:投资AI驱动的Web3项目。 无 Max Tegmark AI/未来 @tegmark MIT, Future of Life Institute 丹尼斯正在绝食地反对无法控制的超级智能的竞赛——我被他的勇气所感动。我的科学评估是,我们更接近建造它,而不是弄清楚如何阻止它接管地球,所以我对在这些赛车公司工作的朋友们发出呼吁: 1) 在公开和内部发出声音,坚持要求贵公司推动将其自愿安全承诺提升为具有约束力的法律。否则,你不能责怪你的竞争对手鲁莽。 2) 给未来的自己写一条信息,列出你的道德红线,形式是“如果我的公司做了 X,我将辞职”。 引用 丹尼斯·谢雷梅特 @DSheremet_ · 9月17日 今天是我在 Google DeepMind 前绝食抗议的第 11 天,以阻止与无法控制的人工智能的竞赛。 两天前,我与麻省理工学院教授马克斯·泰格马克进行了交谈@tegmark关于人工智能发展的危险和绝食抗议。 他说:“我有一个两岁的儿子。我觉得他 Matei Zaharia 大数据/AI @matei_zaharia Databricks, UC Berkeley 无 Thomas Wolf NLP/开源 @Thom_Wolf Hugging Face 喜欢那个!语音界面具有巨大的潜力。由于用户体验尚未达到采用的质量标准,因此仍未得到充分利用 引用 David Joohun Kim @davidjoohunkim · 14小时 了解房间的 AI:保持沉默,根据提示说话,并路由到正确的模型(本地或云)。没有唤醒词。没有摄像头。在设备上。演示 ↓ Reachy-Mini 更新好:质量提升++,声音/电感优于 alpha。第一批小批量发货 9 月下旬。 不太好:扩展到数千台(而计划为 100 台)需要更长的时间 仍有望在圣诞节前发货前 3000 份预购单(精简版和无线版),大多数发货时间为 12 月初。 我们的轻量级开源评估库“lighteval”现在附带了 7,000+ (!!) 基准测试。 在本地运行它实际上是一句俏皮话: lighteval vllm “model_name=gpt2” “排行榜|truthfulqa:mc|0” (还有一个 Python API 用于训练中/训练后评估) 引用 内森 @nathanhabib1011 · 9月15日 刚刚更新了 lighteval 的自述文件——不敢相信我们已经发展到涵盖 ~7,000 个任务提供顶级多语言支持法学硕士担任法官烙多圈评估️编码基准测试六