首页 AI新闻【独家】OpenAI推出6项革命性聊天GPT更新！

【独家】OpenAI推出6项革命性聊天GPT更新！

随着每一天的过去，人工智能（AI）变得越来越智能。无论是在处理电子邮件的业务任务还是日常杂务中，都有AI解决方案可供选择。目前最先进且最流行的AI模型是聊天GPT（chat GPT），本视频的重点是它及其改进。然而，还有其他一些领先的AI公司最新的进展也被纳入了本视频。让我们一起来了解一下。

OpenAI的DI 3和chat GPT

OpenAI的DI 3是其早期版本的重大升级，它现在与chat GPT良好地运作在一起。目前，研究人员正在对其进行测试，但对于chat GPT Plus和Enterprise用户来说，将在十月份推出的API使用方式带来了令人兴奋的消息。DI 3的一个很酷的功能是它非常擅长理解用户的需求，特别是当他们提供长而详细的指示时。根据官方网站的说法，DI 3在捕捉指示中的所有细节和微妙之处方面要好得多，这使得将您的想法转化为真实准确的图像变得非常容易。许多其他的文本转图像系统经常会漏掉一些单词或描述，用户必须非常擅长给出正确类型的指示，但通过DI 3，我们在能够创建与您的文本准确描述完全匹配的图像方面取得了巨大的飞跃。根据Jim Fan的一篇帖子，“D 3不仅是对中途旅程的反对，它实际上是对即将到来的巨大多模态llms与DeepMind Gemini之间的对战的一次鬼才突破。”。D 3在chat GPT的基础上进行了本地构建，这是关键短语。D 3的非凡语言对齐是建立在牢固的文本GPT基础之上的。中途旅程并没有太多推理的大脑，这就是为什么需要大量的提示操作，首先大脑，然后是像素。这是构建强大的多模态AI的方法。当DI与chat GPT结合时，它成为了一个强大而令人印象深刻的工具。

谷歌的图像动态猜测技术

谷歌研究团队发表了一篇名为"图像动态猜测技术"的论文，承诺带来令人兴奋的功能。他们通过查看树木、花朵、蜡烛和风中的衣物等真实视频来学习事物的运动方式。当他们向计算机程序展示一张图片时，它可以猜测图片中的物体如何随时间移动。他们称之为"神经随机运动纹理"，这个猜测可以转化为一组路径，展示物体在整个视频中的移动方式。他们可以利用这些路径进行不同的操作，例如将静态图片转换为看起来正在移动的视频，或者让人们似乎可以触摸图片中的物体。该论文解释了他们的方法："我们的方法通过在单个RGB图像上建模场景动力学中的生成图像空间先验。我们的模型生成了神经随机运动纹理，一种在Fourier域中模拟密集长期运动轨迹的运动表示。我们展示了我们的运动先验，使得可以实现将单一图片转换为无缝循环的视频，或者在回应交互式用户激励（例如拖拽并释放对象上的点）时模拟物体动力学。我们通过使用时空XT切片可视化输出视频，从输入图片中沿扫描线显示10秒的时间。"。

MV dream: 多视角扩散模型

《MV dream: 多视角扩散模型》是一个同样令人赞叹的论文，它能够通过利用在大规模网络数据集和从3D模型渲染的多视图数据集上进行预训练的图像扩散模型，从给定的文本提示生成几何一致的多视图图像。得到的多视图扩散模型既具有2D扩散的一般性，也具备3D数据的一致性。这样的模型可以作为3D生成的多视图先验，通过评分蒸馏抽样，在已有2D lifting方法的3D一致性问题解决上极大改善稳定性。最后，我们展示了该多视图扩散模型也可以在几次样本设置下进行微调，用于个性化的3D生成，即可以在学习主体身份后仍然保持一致性。《MV dream》可以根据简短的请求生成具有意义的3D图片，这是非常令人印象深刻的。它有点像是梦想摄影棚3D，因为它可以从少量信息中学习，创造出特殊的图片。尽管如此，它并不一定创建原始和全新的艺术，因为它是根据互联网上的大量图片进行学习的，但它也是强大的，因为它从不同角度观察3D物体并利用这一观察来生成图片。

Roblox人工智能助手

最近，Rowan Chung在推特上发布了一条关于Roblox的更新消息。他说，Roblox将为超过2亿人提供人工智能助手。他们刚刚发布了一个名为「roblock助手」的新AI聊天机器人，允许创建者们通过键入提示来构建虚拟世界。更令人着迷的是，超过43%的Roblox用户年龄在13岁以下。下一代建筑师将在非常年幼的时候就开始学习与人工智能进行交流。Roblox助手是一个非常有帮助的AI聊天伙伴，它可以为各种创作者简化生活，将无聊的任务交给它，留下有趣的事情给你，比如故事讲述、游戏制作和设计精彩的体验。使用助手时，创作者可以像与朋友交谈一样使用常规文字与助手对话。它可以帮助解答关于Roblox的问题，用简单的语言解释，并在编码方面提供帮助，例如改进代码、解释棘手的部分或查找并修复问题。它也能帮助创作者进行构建，你可以告诉助手你想要的东西，然后它会在你的游戏中实现。例如，你可以说在这里放些街灯，或者在森林中加上不同的树木，再添加一些灌木和花朵。与助手一起工作就像拥有一个有创造力的朋友，你可以与它聊天、寻求帮助，并不断尝试直到达到完美的效果。

亚马逊的Alexa语音变化

亚马逊对其著名的语音助手Alexa进行了重大变化，这是一个巨大的进步，改变了人们与Alexa交流的方式。现在，当Alexa说话时，声音更像是一个真实的人，而不是一个机器。这是因为有了一种智能技术，叫做语音-对语引擎。它可以倾听您的情感和说话方式，然后让Alexa以与之相匹配的方式说话，让与Alexa的对话更加友好和理解。现在的Alexa听起来不再像一台机器，而像一个关心你的朋友。这对亚马逊来说并不是一个巨大的飞跃，但却足够大。

3D纹理生成工具vmod 3D Libraries Fabricator

最后一个令人惊叹的创新是vmod 3D Libraries Fabricator，使用这个创新工具，你可以在几秒钟内轻松生成3D纹理。只需一个简单的提示，您就可以创建各种原创和完全可定制的高分辨率3D纹理，所有这些都具有商业许可证的PBR地图。这些纹理不仅随心所欲，而且完全无缝，确保您的设计无可挑剔。此外，您可以享受到超高分辨率的纹理，选项高达4K UHD，保证超逼真的效果。它还可以轻松生成高质量的PBR贴图，包括基础、法线、高度和粗糙度贴图，以增强纹理的逼真效果。虽然它还没有面向公众开放，但您仍然可以加入测试版。您只需访问他们的网站https://vm.XYZ/fabricator-general-insights-in-AI，点击订阅按钮并打开通知提醒即可。

精华

AI的发展和应用正在不断提升，为个人和商业领域提供了许多解决方案。
OpenAI的DI 3和chat GPT是目前最先进和受欢迎的AI模型之一。
谷歌的图像动态猜测技术可以通过分析物体在时间上的运动方式，创建具有运动效果的视频。
MV dream通过从不同角度观察3D物体，可以根据简短的提示生成具有几何一致性的多视角图像。
Roblox推出了一个名为roblock助手的AI聊天机器人，使创作者们能够轻松构建虚拟世界。
亚马逊的Alexa语音助手经历了重大变化，现在更像一个友好和理解的朋友。
vmod 3D Libraries Fabricator是一个创新的工具，可以轻松生成定制的高质量3D纹理。

FAQ

Q: DI 3和chat GPT可以用于哪些方面？ A: DI 3和chat GPT可以用于生成准确的图像，并提供强大的语言处理能力。

Q: MV dream能够以多视角生成图像吗？ A: 是的，MV dream可以根据简短的提示生成几何一致的多视角图像。

Q: Roblox助手可以帮助做什么？ A: Roblox助手可以帮助创作者进行学习、编码和游戏制作，还可以帮助解答问题和实现构建方面的需求。

Q: Alex的语音变化如何影响用户体验？ A: Alex的语音变化使得与其交谈更加友好和理解，减少了机器感。

Q: vmod 3D Libraries Fabricator可以生成什么样的纹理？ A: vmod 3D Libraries Fabricator可以生成各种原创的高质量3D纹理，包括商业许可证。

Q: 这些创新的AI技术什么时候能够对公众使用？ A: 目前，部分创新的AI技术正在测试阶段，但未来可能会向公众开放使用。

资源

OpenAI官方网站: https://openai.com
谷歌研究论文: https://research.google
Roblox官方网站: https://www.roblox.com
亚马逊Alexa官方网站: https://www.amazon.com/alexa-voice-assistant/b?node=13727921011
vmod 3D Libraries Fabricator测试版网站: https://vm.XYZ/fabricator-general-insights-in-AI