挑战AI克隆:让它替代我24小时?!

目录

  • 挑战一:电话通话 📞
  • 挑战二:制作抖音视频 🎥
  • 挑战三:银行生物识别 🏦
  • 挑战四:视频通话 📹
  • 今天我们将会创建一个看起来和动起来与我一模一样的头像。
  • 我们先用镜头微笑一下。
  • 我喜欢微笑,微笑是我最喜欢的表情。
  • 我稍微深呼吸一下,这就是呼吸的样子吗?
  • 我是Joanna Stern,很高兴主持这个视频。
  • 不,我才是真正的Joanna。
  • 好吧,我自己克隆了一下。你好。
  • 为什么要这样做呢?
  • 最新的AI工具可以生成文本和图像,已经使真实和虚假之间的区别变得很难辨认。
  • AI生成的声音和视频将更加模糊界限。
  • 所以我提出了一个挑战。
  • 我能用AI来取代我一天吗?
  • 是的,我给自己想了四个挑战,看看AI能否代替我,这样真正的我就有更多时间做自己的事情。
  • 或者至少这就是我想要的。
  • 我依然对看着这个静止的Joanna感到有些不适。
  • 好吧,我们开始吧。
  • 第三场景,第二遍,校准。
  • 在我们进行挑战之前,让我们先了解一下我的AI头像,它是由一家叫做Synthesia的初创公司制作的。
  • 这家公司在纽约的一个专业工作室录制了我的一系列头部动作。
  • 我感觉自己像在眼科医生那里。好的。
  • 然后我朗读了一段相当奇怪的预先写好的剧本。
  • 积极的思考会帮助你相信自己,并充满自尊和自信。
  • 之后,我去了一个音频工作室,录制了大约一个小时的剧本。
  • 我的名字是Joanna Stern,我谨此同意这个音频录制,以创建一个定制的声音。
  • 公司将所有这些用作训练数据,并通过他们的AI神经网络处理了它们。
  • 你不介意我称你为Joanna吗?有什么问题吗?
  • 好吧。所以说声音并不是最好的。
  • 一个叫做ElevenLabs的工具在我的制片人Kenny上传了两个小时的我以前的录音后,制作出了更好的声音。
  • 我是真正的Joanna。
  • 我是真正的Joanna。
  • 我是真正的Joanna。
  • Synthesia和ElevenLabs的工作原理类似。
  • 输入任何内容,AI的Joanna会马上做出回答。
  • Synthesia定位于希望制作内部视频的企业,它至少要收费1000美元才能创建一个定制的头像。
  • 使用ElevenLabs进行声音克隆只需每月5美元。
  • 挑战一:电话通话。
  • 那天我恰好有一个和Snap CEO Evan Spiegel的电话约定。
  • 这家公司最近发布了一个名为My AI的聊天机器人。
  • 嗨Evan,我是Joanna。
  • 你是否担心我们整天与AI聊天,会停止与真正的朋友交流?
  • 显然不会。我们正在看到的是,我们正在测试和学习的方法的真正好处之一。
  • 迄今为止,我认为这将成为对对话的增强,并改善人们与朋友和家人交流的方式。
  • 难道你没有想到我提给你的问题是由AI声音生成的吗?
  • 不,没有。我是说,前两个字有点暴露,但我以为你今天可能特别严肃。
  • 连我自己的妹妹都很容易被欺骗,当我打电话给她关于她的死鱼的时候。
  • 喂,朱尔斯。
  • 我刚刚得知关于Swimmy Dimi的事情,我很为你的损失感到抱歉。
  • 你以为是我吗?
  • 起初,是的。但后来不是。就是声音很像你,只是它不会停下来等我回话。
  • 挑战一:通过。
  • 挑战二:制作抖音视频。
  • 我请ChatGPT以Joanna Stern的声音写一个关于iOS 16的不为人知的技巧的抖音剧本。
  • 最困难的是让ChatGPT写出真实的内容。它总是编造东西。
  • 最后,我终于找到了一个好的脚本。尽管写作风格不太像我。
  • 我将剧本粘贴到Synthesia中,在我的头像后面放了一个绿屏,并导出了视频。
  • 当《华尔街日报》的抖音团队在编辑的时候,我对最终成品非常满意。
  • 抖音家人们,我是Joanna Stern,你们的iOS向导。
  • 今天我们要揭示隐藏世界中的背击手势。
  • 我喜欢这些,我甚至不需要自己拍摄这些视频。
  • 我不需要穿漂亮的衣服,不需要打扮,化妆,念这些台词。
  • 但抖音团队对此并不是很满意。
  • 他们注意到头像从不移动手臂,嘴巴的动作也不总是与音频匹配,而且面部表情很少。
  • Synthesia已经在其头像的beta版本中大大改进了这些问题。
  • 看,我可以点点头。
  • 挑战二:不合格。
  • 挑战三:银行生物识别。
  • 一些银行在转接你到客服人员之前,会要求你用声音确认身份,而不是问安全问题。
  • 这通话将被监控和记录,你的声音可能用于验证。
  • 请说出您的名字和姓氏,然后是您的邮寄地址。
  • Joanna Stern。
  • 这是来自Chase信用卡服务的Nikki。
  • 它奏效了。Chase确认了声音,并直接将我接通到了一名客服代表。
  • 没有额外的问题。我要求我们的实习生斯拉夫尽力模仿我,然后看看会发生什么。
  • 请说出您的名字和姓氏,然后是您的邮寄地址。
  • Joanna Stern。
  • 请在卡背面的签名面板上输入三个数字。
  • 如你所见,对于斯拉夫来说,声音生物识别系统并不相信他的声音,要求进一步验证。
  • 当我联系Chase时,一位女发言人说:“我们使用声音生物识别技术,以及其他各种方法来验证致电我们的客户。她还补充说,为了完成请求,客户必须提供额外的信息。
  • 挑战三:通过。
  • 挑战四:视频通话。
  • 我请ChatGPT生成一些常见的会议短语,然后导出头像说这些短语的视频。
  • 然后我在我的Mac上安装了一些软件,将这些视频投到了我的Google Meet通话中。
  • 听起来很好。哦,你静音了,Joanna。我的天啊,这是真正的Joanna吗?
  • 是的,看起来像个假的。听起来不错。是的,她看起来像是你的全息版。是她。是什么在这里发生?
  • 你怎么知道那不是我?它看起来像是你的全息版。是我是坐姿。
  • 她也没有开过任何玩笑。
  • 挑战四:彻底失败。
  • 那么今天我们学到了什么呢?
  • 我们学到了视频克隆现在还无法欺骗任何人,但是AI的声音非常好。
  • 我们还学到了,虽然你可以用它节省时间,但人们也可能滥用它们。
  • 我想避免有些日子不去工作室吗?是的。
  • 我担心骗子使用我们的声音打电话给银行或我们的家人吗?是的。
  • Synthesia表示,他们创建头像时需要创作者口头同意。
  • ElevenLabs则要求你勾选一个框,表示你有权限使用这个声音,该公司表示,如果声音被滥用,它能够识别出它的声音。
  • 无论如何,这意味着我们都需要高度警惕,区分真实和人工智能。
  • 最后,希望大家保持人性。加油!我是不可避免的!