洪水猛兽还是星辰大海?——生成式人工智能的那些事
来源: 作者:王晓鹏 时间:2023-05-04


从被动式交互到生成式人工智能

2011年,苹果公司在当年发布的iphone4S手机上第一次预置了智能语音助手Siri,我至今还记得当年拿到这部手机,第一次用“Hi,Siri”唤醒那个电子味十足的女中音,为我设置一个闹钟时候的新鲜和兴奋。在我的印象中,这是掌上移动设备上第一次有了可堪一用的“人工智能”,尽管彼时它还无法识别中文,也只能完成一些基本的手机功能设置,但在那个很多人还在使用手机键盘进行信息交互的时代中,Siri为我们开启了一个人机交互的全新世界,那也是我第一次实实在在地接触到人工智能这个新鲜事物。

此后,各科技厂商纷纷推出了自己的智能语音助理,“Hi,Bixby”“小爱同学”、“你好小艺”、“你好YOYO”、“你好,小迪”……一时百花齐放,好不热闹。而且厂家也不再满足将智能助理局囿于小小的显示屏幕之内,而是以手机为端点,通过“万物互联”的思维,让人工智能连接起我们生活中的方方面面。我现在已经习惯:“小爱同学,帮我拉开窗帘”、“小爱同学,今天天气怎么样?……”每天各种这样的问询,特别是很多个冬日的寒夜,当我钻进温暖的被窝,却发现灯还没有关的时候,一句“小爱同学,关闭卧室灯”所带来的便利和幸福感更是让人欲罢不能。

虽然这些形形色色的“人工智能”能够响应我们的指令,有些甚至还能和我们进行一些简单的交流,但是其本质还是被动地接受指令完成任务,不能主动学习和汇总进化,它们给我的答案,要么是简单的网页搜索结果,要么就是预设好的固定回复和程序操作,这一切都让我感觉它们还只是冰冷的代码而已,但我还是以为人工智能做到现在这个程度已经很好了,也许要很久以后的未来,才能出现如电影《流浪地球2》中“Moss”那样能够和人类正常交流,为人类提供海量高效服务的真正的人工智能。直到我遇见了ChatGPT,我才意识到,原来,未来已来。


生成式人工智能对我们的影响

ChatGPT是由OpenAI公司开发的一款自然语言处理(NLP)模型。作为一种基于Generative Pre-trained Transformer(生成式预训练转换模型)架构的深度神经网络模型,它有着广泛的应用价值,如文本生成、摘要、翻译及文本分类等任务。

概念总是枯燥和无趣的,那让我用一张图片来告诉大家ChatGPT的神奇之处:

上图是我使用ChatGPT生成的即兴小诗,仔细读下来,这首诗的内容还是有一些“电子味”,辞藻的堆砌也显得生硬,但是平心而论,这首诗展示了“夏天”这个主题词下具有代表性的多个场景,内容也绝非毫无关联的机械式搜索,可见ChatGPT真的是在理解了我的需求后,并通过海量的搜索,经过算法的匹配重组,生成了一个“说人话”的答案。这个结果,也许不够完美,但是已足够震撼。为了测试ChatGPT是否真的是一个会“主动学习”的AI,我还特意选取了两个类似的问题,看一看它会不会给我两个复制粘贴或者是基本相同的答案,结果如下:基础的人工智能,或者说“伪”人工智能,对于相似度较高的问题,往往会给出基本相同的答案,因为它不具备预先训练、主动学习、智能分析汇总的能力,而反观ChatGPT很好地理解了两个问题中的细微差异,它没有用简单的复制粘贴敷衍我,而是给了我两个有针对性的答案,这样的答案虽然还只是大而化之的论道,但是我相信,这样的答案放在任何一个公开场合,都足以保证使用者在台上侃侃而谈。不夸张地说,在我发问后,等待答案的过程中,我甚至感到了人工智能在后台的努力:它在努力地理解我的问题,分析我关注的要点,以海量的数据搜索匹配算法组合,最终给我呈现出一个需要的答案,整个过程迅速而又得体,娓娓道来,我感觉对面似乎真的有一个人类在回答我的问题,它不是一个AI,他(她)更像是我的采访对象和助理。

面对这样具有颠覆性的人工智能技术,生物学意义上的人类已经在信息搜集、筛选、分类汇总、反应速度各个方面全面落后,ChatGPT究竟会对我们的生活和那些熟悉的领域带来什么样的影响?这个问题,前面的图片中,ChatGPT已经给出了答案,我就不再赘述了。


生成式人工智能的合规分析

生成式人工智能,之所以能够像“正常”的人类一样为我们提供我们需要的答案,是因为其独特的运行机制使然。GPT技术(生成式预训练转换模型)首先需要在大量网络数据集上进行预训练,以学习潜在的语言模式和特征;预训练完成后,模型得到的权重可以在特定任务上进行微调,以适应目标应用需求,提高模型性能。正所谓“工欲善其事,必先利其器”。在有了海量的数据“投喂”和预训练以后,AI通过自注意机制和多层前馈神经网络完成文本输入到输出的转换,从而保证它能够在大量随机发问的文本中有效地捕捉上下文信息,甚至是发现发问者关注的重点,在数据集中匹配最合适的答案,并通过一种我们能够理解的语言组织方式进行输出,让使用者获得需要的答案。从上述的运行机制可以看出来,对于从事生成式人工智能的企业来说,法律合规的风险集中在“数据投喂”、“算法匹配”、“信息输出”三个环节。生成式人工智能是一个新兴的领域,技术门槛较高,对于立法提出了巨大的挑战,但是鉴于该技术具有自我学习、自我进化的双刃剑特性,其未来的发展结局存在着一定的道德风险和技术不可控危险,生成式人工智能的终点是洪水猛兽还是星辰大海?是“天网”还是“TARS”?取决于今日的人类如何对其进行有效地监管,引导技术的正常发展,以保障其能够真正地为人类所用。2023年4月11日,国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》(以下称“”《管理办法》),可见,在分布式人工智能大潮汹汹而来之际,我国也开始尝试在该领域推动立法,以尽快对此项重大技术革新进行有效监管。《管理办法》一共21条,《管理办法》将“生成式人工智能”定义为:“本办法所称生成式人工智能,是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。”并明确长臂管辖原则,除了境内从事研发、利用该技术产品的主体外,任何面向中国境内公众提供生成式人工智能服务的主体,未来都在《管理办法》的监管范围之内。除了概念定义和管辖范围之外,《管理办法》还从适用市场准入资格、从业者法律义务、法律责任等几个方面对于生成式人工智能从业者的合规管理进行了规定。根据《管理办法》的相关内容,未来从事生成式人工智能服务的企业需要在以下几个方面做好合规管理。

规范数据标注及算法设计合规

前文已述,生成式人工智能需要海量的“数据投喂”,但是互联网上的数据良莠不齐,充斥着大量的违法违规数据信息,如果不加选择不加标注地对模型进行无差别投喂,势必会出现违法违规的结果,即“恶花结恶果”,针对此风险,《管理办法》进行了相应的规制,相关企业应该注意做到以下合规要求:1.开展此类服务之前,首先要根据《具有舆论属性或者社会动员能力的互联网信息服务安全评估规定》向网信部门申报安全评估,并根据《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续;2.确保训练所使用的数据来源合法合规,不得违反法律法规和社会公序良俗,从事此类服务的企业对于用于训练的数据的真实性、准确性、客观性负责,以确保根据数据“投喂”得出的结果符合社会主义核心价值观、不得危害国家安全、不得宣传民族仇恨、暴力色情等违法内容;3.用于构建分布式人工智能模型的算法要遵守公平公正的要求,不得有带有歧视性的内容,对训练数据进行人工标注时,必须对标准人员进行专业培训,并制定清晰、具体、可操作的标注规则。算法和数据训练是生成式人工智能的根基,虽然我国的《管理办法》还在征求意见阶段,但是其上位法《数据安全法》《网络安全法》都对数据服务提供者及网络运营者的合规责任进行了详细的规定,所以目前提供该项服务的企业,都有一个基本的法律红线意识,比如我在ChatGPT测试一个涉嫌违规的话题时,它就很快给出了“无懈可击”的合规回答。

个人信息保护合规

用户在使用生成式人工智能服务过程中,在提问互动的过程中,不可避免地会向人工智能提供各种个人信息,甚至是敏感个人信息,所以除了《数据安全法》《网络安全法》之外,《管理办法》的另一个重要的上位法是《个人信息保护法》,结合《个保法》的规定,根据相关企业应做好以下个人信息保护的合规管理:1.处理个人信息的,应事先告知个人信息所有人,处理敏感个人信息的,必须事先获得个人信息所有人的许可;2.应遵循最小必要性原则,收集用户个人信息,并采用脱敏、匿名化手段处理提供给模型的个人信息;3.建立专门的个人信息保护部门,制定个人信息保护的方案,监督生成式人工智能服务的使用过程,及时发现上报并处理个人信息泄露或滥用的情形;4.为使用者提供显著且易于获得的用户投诉处理机制,及时处置用户提出的删除、更正、屏蔽其个人信息的请求。

知识产权保护合规

虽然生成式人工智能基于海量数据投喂预学习,再利用各家公司自行研发的神经算法对数据进行筛选、重组,最终提供给用户一个似乎是“独一无二”的答案,但是在技术刚刚开始发展起步的今天,由于各家从业公司的技术力量的差异和算法模型的优劣差别,不可避免地会出现知识产权和名誉权侵权纠纷。如果从事该项服务的企业没有相应的技术能力,只是挂羊头卖狗肉,以生成式人工智能为名,行搜索引擎搬运工之实,可能会导致用户以为获得的结果合法合规,实际上是侵犯了别人的知识产权。为避免出现上述情况,企业要在以下两点加强合规管理:1.预先审查数据的知识产权权利来源,通过人工审核或技术手段甄别训练数据中可能侵犯知识产权的内容,或主动联系权利人获取权利授权;2.优化算法,增加算法的智能化程度,杜绝简单地照搬网络数据,全盘复制提供给服务者的“伪”人工智能。


结语

随着以ChatGPT为代表的生成式人工智能的兴起,科幻电影中那些可以帮助人类处理各种工作的人工智能似乎已经逐渐成为现实,未来已来,生成式人工智能自我学习和进化的终点究竟是什么?是成为人类的得力助手?还是反客为主侵蚀人类的生物主体性地位?这些问题值得每一个人认真思考,这不仅是技术从业人员需要面对的问题,也是包括监管机构、立法者、社会学家需要共同参与的复杂社会性话题。技术的本质一定是要服务于人类,早在80年前,阿西莫夫就提出了机器人三定律,通过科幻小说的方式表达了对强人工智能发展归宿的思考和解决问题的方案。那么在小说中的未来已经逐渐变成现实的今天,我们要清醒地认识到,对于人工智能的技术规制和监管,不应将其视为洪水猛兽,唯恐其取而代之人类的地位,进而限制技术的发展,故步自封;而是要看到技术对于推动人类进步的重大作用,在尊重技术中立的前提下,坚守法律和道德的底线,通过技术性立法,为技术的发展划定方向和红线,让包括生成式人工智能在内的新兴技术真正成为人类文明发展的助力,伴随我们一起驶向浩瀚无际的星辰大海。

< 劳务活动中罹患热射病是否可以得到赔偿? 返回列表 员工犯错,领导背锅?法院:违法解除! >