假作真时真亦假，该管管AI输出内容了

极诣在2019年为读者介绍了BERT，另外由于工作关系年前也接触了不少中文NLP领域杰出的初创企业。当前自然语言处理已经进入了一个高速发展的时期，AI生成的文章（NLG）、AI辅助生成的文章、AI编辑的视频将会更多渗透到普通人的生活中。在不久以后你每天消费的内容中可能有相当的比例会是由AI制作的。

美库尔DWA的Krish Sailam在AdExchanger上的评论文章《As AI Use Expands, We Need Standards To Identify Content Not Created By Humans》可以说是2020年来对AI内容的问题看得最透彻的文章之一。Sailam非常直接地表达了对AI产生内容的担忧，主要围绕着三个方面：

现有科技能否有效识别AI参与制作的内容
对于AI制作的内容，其版权的归属问题
利用AI制作内容的媒体是否应该主动标识AI内容

AI制作内容存在着多种形式。有同义词替换语序颠倒的“伪原创”文本，也有海量爬虫拼凑的新内容，还有我们听习惯的林志玲导航，更有像DeepFake那样去年成为话题的换脸视频。您可以点击这里体验一下AI主播播报新闻，也可以点这里听川普对你科普。

现有的科技对于识别这些人工智能产生的内容并没有像生成这些内容那样容易，这也是为什么Facebook、微软、MIT、康奈尔大学、伯克利大学、马里兰大学、牛津大学等等一道为了DeepFake要搞一个Deepfake Detection Challenge (DFDC)。因为AI真的可以达到以假乱真的程度。

去年年底，百度地图就推出了导航语音定制功能。用户只需在百度地图App上录制20句话，20分钟左右即可生成个人完整语音包。整个过程非常有趣，但是如果这个语音包被用于你的长辈会发生什么？我们可以想象一下最坏的结果是什么。更糟糕的是今后我们所谓的录音证据、视频证据将迅速失效。

我们通常理解的AI产生的内容是没有版权的，但是如果其不被标注由AI制作而被署以人名或者无署名那么就变成自然人的作品。把比如搜索引擎结果页面是机器编篡而成的，因为我们知道它是自然排名而不是人为编辑所以不会构成侵权问题。不作AI标识会存在很大法律风险。

另外在本已版权意识淡薄的市场中，伪原创、抄袭、洗稿泛滥，再加以更大量级的机器人写的垃圾，这会让人们寻找真正有用的信息变得越发困难。在一些媒体中出现的内容我们实在无法有效辨别，有时候读到一半才发现是机器人写的，有时读完了也没有发现有用信息，有的甚至会断章取义变成谣言。这将变成实实在在的一场信息灾难。

那么为什么会有那么多垃圾AI内容呢？媒体需要负很大责任，其次是搜索引擎，最后是品牌。正是因为追求廉价内容，添加新的广告库存，媒体才会热衷于用AI制造新内容。这些内容往往无引用无背书，普遍低质量。搜索引擎的问题是在技术上无法真正识别原创作品和自然人作品，这给许多不良媒体创造了温床。

如果说媒体存在原罪，搜索引擎实力不济，那么品牌的问题便是愚昧。如果老PR人的思维是天天见报还是比较靠谱的，那么数字营销中的PR人刷发文数、阅读量则是完全没有开化的状态，因为有更多的机器人内容被机器人阅读了。

因此，如Sailam所说，整个媒体行业和广告传播界实在需要进行自律。如果我们自己管不了自己，那么总会有人来管，而届时我们要付出的代价可能比突然失去第三方Cookie要惨重得多。劣币驱逐良币，之后还有谁来辛苦码字呢？

类似文章

搜索引擎优化|数字营销

研究Technical SEO的正确姿势实例 – JS跳转试验
作者Hermes Ma 2019年4月24日

百度、必应、搜狗、Yandex，极诣通过一个长达两个多月的实验，发现并证明了一些搜索引擎爬虫面对JavaScript跳转时的反应和行为。哪些蜘蛛能读懂JS，怎样的JS又能被哪些引擎的蜘蛛顺利运行呢？马上揭晓！

阅读更多研究Technical SEO的正确姿势实例 – JS跳转试验
搜索引擎优化|数字营销

SEO基础：Alt属性标签的秘密
作者Hermes Ma 2014年1月2日2017年5月13日

Alt属性是一个图片属性，英文Alternative的缩写。它的作用是当图片无法读取或显示时，用该Alt属性的内容替换图片位置。你知道如何正确使用Alt吗？

阅读更多 SEO基础：Alt属性标签的秘密
搜索引擎优化|数字营销

谷歌SEO与百度SEO的异同
作者Hermes Ma 2014年9月30日2017年5月13日

本篇文章极诣将会介绍谷歌SEO与百度SEO这两者的区别。比较谷歌SEO和百度SEO，我们会获得很多对国内外数字营销的深度认识。我们将从以下12个方面进行比较。

阅读更多谷歌SEO与百度SEO的异同
数字分析|数字营销

Google Data Studio高级使用技巧Blended Data Source和Calculated Fields
作者Hermes Ma 2020年3月11日

极诣本篇将再次探讨Google Data Studio中的两个高级功能Blended Data Source和Calculated Fields。我们会用几个实例来演示这两个功能。

阅读更多 Google Data Studio高级使用技巧Blended Data Source和Calculated Fields
内容营销|数字营销

你担心的和你期待的，马老师的AI营销观
作者Hermes Ma 2024年4月17日2024年4月17日

由于最近时常被同事客户问到关于人工智能和生成式AI（Generative AI/Gen-AI）的相关问题，包括AI对消费者体验的影响以及未来对整个营销行业的影响，还有营销人应该如何做好准备，于是谨以此文略作总结，并给出马老师现时现刻对AI的看法。

阅读更多你担心的和你期待的，马老师的AI营销观
数字广告|数字营销

Device ID之IDFA末日，猫和老鼠的游戏终将完结？
作者Hermes Ma 2020年8月5日2020年9月9日

在九月发布的iOS14中Apple🍎除了将在Safari和WKWebView中完全限制第三方Cookie，还会默认开启限制广告跟踪（LAT – Limited Ad Tracking）。有哪些你必须了解的？

阅读更多 Device ID之IDFA末日，猫和老鼠的游戏终将完结？