DeepFake视频AI换脸
|

假作真时真亦假,该管管AI输出内容了

极诣在2019年为读者介绍了BERT,另外由于工作关系年前也接触了不少中文NLP领域杰出的初创企业。当前自然语言处理已经进入了一个高速发展的时期,AI生成的文章(NLG)、AI辅助生成的文章、AI编辑的视频将会更多渗透到普通人的生活中。在不久以后你每天消费的内容中可能有相当的比例会是由AI制作的

美库尔DWA的Krish Sailam在AdExchanger上的评论文章《As AI Use Expands, We Need Standards To Identify Content Not Created By Humans》可以说是2020年来对AI内容的问题看得最透彻的文章之一。Sailam非常直接地表达了对AI产生内容的担忧,主要围绕着三个方面:

  • 现有科技能否有效识别AI参与制作的内容
  • 对于AI制作的内容,其版权的归属问题
  • 利用AI制作内容的媒体是否应该主动标识AI内容

AI制作内容存在着多种形式。有同义词替换语序颠倒的“伪原创”文本,也有海量爬虫拼凑的新内容,还有我们听习惯的林志玲导航,更有像DeepFake那样去年成为话题的换脸视频。您可以点击这里体验一下AI主播播报新闻,也可以点这里听川普对你科普

DeepFake视频AI换脸
DeepFake视频AI换脸

现有的科技对于识别这些人工智能产生的内容并没有像生成这些内容那样容易,这也是为什么Facebook、微软、MIT、康奈尔大学、伯克利大学、马里兰大学、牛津大学等等一道为了DeepFake要搞一个Deepfake Detection Challenge (DFDC)。因为AI真的可以达到以假乱真的程度

去年年底,百度地图就推出了导航语音定制功能。用户只需在百度地图App上录制20句话,20分钟左右即可生成个人完整语音包。整个过程非常有趣,但是如果这个语音包被用于你的长辈会发生什么?我们可以想象一下最坏的结果是什么。更糟糕的是今后我们所谓的录音证据、视频证据将迅速失效

我们通常理解的AI产生的内容是没有版权的,但是如果其不被标注由AI制作而被署以人名或者无署名那么就变成自然人的作品。把比如搜索引擎结果页面是机器编篡而成的,因为我们知道它是自然排名而不是人为编辑所以不会构成侵权问题。不作AI标识会存在很大法律风险

另外在本已版权意识淡薄的市场中,伪原创、抄袭、洗稿泛滥,再加以更大量级的机器人写的垃圾,这会让人们寻找真正有用的信息变得越发困难。在一些媒体中出现的内容我们实在无法有效辨别,有时候读到一半才发现是机器人写的,有时读完了也没有发现有用信息,有的甚至会断章取义变成谣言。这将变成实实在在的一场信息灾难

那么为什么会有那么多垃圾AI内容呢?媒体需要负很大责任,其次是搜索引擎,最后是品牌。正是因为追求廉价内容,添加新的广告库存,媒体才会热衷于用AI制造新内容。这些内容往往无引用无背书,普遍低质量。搜索引擎的问题是在技术上无法真正识别原创作品和自然人作品,这给许多不良媒体创造了温床。

如果说媒体存在原罪,搜索引擎实力不济,那么品牌的问题便是愚昧。如果老PR人的思维是天天见报还是比较靠谱的,那么数字营销中的PR人刷发文数、阅读量则是完全没有开化的状态,因为有更多的机器人内容被机器人阅读了

因此,如Sailam所说,整个媒体行业和广告传播界实在需要进行自律。如果我们自己管不了自己,那么总会有人来管,而届时我们要付出的代价可能比突然失去第三方Cookie要惨重得多。劣币驱逐良币,之后还有谁来辛苦码字呢?

类似文章