微软悄悄的发布了一个基于ChatGPT的系统Visual ChatGPT,一个利用ChatGPT来进行你说我画的系统。传统(并没有)的你说我画系统如Stable Diffusion已经广为人知,这次的V ChatGPT和他们有什么不同呢?
接着这个机会,我决定用ChatGPT工具链来解读ChatGPT家族新添的一员。
既然说了借助ChatGPT工具链,那就得定下个规矩:从这条开始,除了关于工具使用等步骤性说明之外,其他文字将全部来源于ChatGPT工具链。 首先,原始的ChatGPT是无法访问网络且数据只到2021年,必然是没有关于visual chatgpt的内容的,因此我们需要结果工具让其获得相关信息。
很幸运,Visual ChatGPT的Github上附带了他们的论文,里面有着很详细的介绍说明。那么我们就可以用 @xathis 开发的工具ChatPDF来读取论文。
首先,让我们来问问它V ChatGPT是什么。以下为生成的内容 Give me a summary about Visual ChatGPT:
可以看出很不错,那么对于不懂英文的同学呢?我们可以和他说 Summarize in Chinese.
当然,这里你也可以使用由 @yetone开发的 openai-translator .
但是,无论是英文和中文都超过了段推特的字符限制,那么可不可以精简一点?可以的,以下是它的回答:
Visual ChatGPT是一个结合不同视觉基础模型的系统,允许用户通过发送和接收语言和图像与AI系统进行交互。它支持复杂的视觉任务,包括需要多个AI模型协作的视觉编辑指令。该系统已通过大量实验验证其理解和生成能力。
让我们问他一些更复杂的东西吧: Visual ChatGPT和Stable Diffusion有什么不同?
详细说明一下Visual ChatGPT的工作流程是什么:
进一步说明一下Visual ChatGPT中的Prompt Manager:
给出一个Visual ChatGPT的使用范例:
我应该如何安装并使用Visual ChatGPT呢?PDF并没有写,所以得不到相关信息。
以上就是这次的内容了,可以看出,正如我昨天和 @novoreorx 所说,配合上自动化流程,ChatGPT将可以取代非常多的技术和工具推荐的流量工作。
在这里感谢给予启发的各位
我的推特: