封面新闻记者边雪


(相关资料图)

谈及未来引领新一轮经济和社会转型发展的核心驱动力,不得不提到的就是智能化技术革新。

自2016年“AlphaGo”为人工智能发展按下加速键,生成式对抗网络(GAN)、BERT、GPT等新技术无不在多领域突破人工智能的能力瓶颈。

2022年年末,随着来自OpenAI的聊天机器人ChatGPT的发布,人们认识到了“生成式AI”的威力:它几乎可以创建任何文本或图像,对任何问题都能有高度拟人化的反应,让人们以新的方式思考广告营销、撰写论文或传播新闻,甚至担心自己会因此而失业。

OpenAI旗下ChatGPT官网(图片来源:官网截图)

中国科学院自动化所研究员张家俊在接受封面新闻专访时表示,之前的AlphaGo等人工智能的突破仅在某个比较窄的领域,跟大家的日常生活似乎关系不太大,因此技术领域之外的参与度不高;但是ChatGPT与人们密切相关,因为每个人都使用语言、每天都在对话、都有信息需求,所以参与度特别高。它在60天时间达到1亿月活就是最好的印证。更多的用户数据能优化出更好的对话模型,更好的对话模型就会吸引更多的用户,技术和用户的良性闭环是ChatGPT火爆的一个关键因素。

中科院自动化所研究员张家俊。

“人性永远是复杂的,尽管工作内容像机器的人将会被机器取代,但世界需要人类。”虽然皮埃罗·斯加鲁曾在《智能的本质》中指出,人类能称之为人的地方在于,人类努力探索生活更深层的含义,而不是朝九晚五跟机器人一样。但面对火出圈的ChatGPT带来的震撼,焦虑与慌张已经开始在人群中蔓延。

与其惶恐饭碗端不住

不如积极拥抱ChatGPT带来的变革

作为一个通用人机对话系统,ChatGPT能够完成很多自然语言处理任务和代码任务,可以应用于语言和代码相关的若干领域。能写代码写作业,能写剧本能做题,ChatGPT几乎能代写你想要的一切。随着ChatGPT作为工具在工作、生活中高效应用,文字工作者、程序员、广告等领域的从业者也开始担心:自己的饭碗还能端得住吗?

“从ChatGPT擅长的能力看,它目前更适合于内容创作领域、信息咨询领域和代码领域。ChatGPT尤其擅长语言生成,可以按照用户要求生成多样化拟人的文本,因此在内容创作领域会有很大的前景。”张家俊还强调,ChatGPT十分擅长信息整合与逻辑归纳,可以根据用户需求生成丰富实用的建议,因此在信息咨询领域也会产生较大的影响。

网友与ChatGPT的对话。(图片来源:网络)

ChatGPT经过海量程序代码的学习后能够依据用户需求生成初步的完整代码、帮助用户检查代码问题,因此在代码领域,它确实会带来非常显著的变化。

“突破性技术引发的恐慌是正常的,人们都需要有一个接受的过程。”张家俊认为,ChatGPT一定会代替一些人类的工作,但更多的影响或将体现在促使包括科研工作者在内的人员转变思路,积极拥抱ChatGPT等新技术,利用更好的技术提升自己,完成更有价值的工作。

ChatGPT回答靠忽悠加瞎编?

与搜索引擎有机结合或将缓解缺陷

ChatGPT训练数据确切是截止于2021年9月份,这是目前ChatGPT等所有大模型的核心问题之一。由于训练后得到的是一个静态模型,缺乏对实时数据的学习机制,从而导致模型对于训练时间之后发生的事件无法给出准确答案。

“这问题是用户无法信赖ChatGPT的主要原因,在关键信息上还需要求助其他工具。”张家俊表示,OpenAI似乎一直在探索解决方案,例如WebGPT就能够与搜索引擎进行交互,实现准确且实时信息的获取。所以,ChatGPT若能与搜索引擎有机结合,这个问题将极大缓解。

值得注意的是,微软于北京时间2023年2月8日发布融入ChatGPT和GPT-3.5的新一代搜索引擎Bing,事实性问答的难题似乎已经得到解决。

北京时间2月8日,微软发布使用新人工智能驱动的Microsoft Bing和Edge。(图片来源:微软官网截图)

通过数十亿美元的投资,微软将其未来押在人工智能上,直接挑战Alphabet的谷歌。与初创公司OpenAI合作,微软的目标是超越竞争对手,并可能从加速各种内容创建、自动化任务(如果不是工作本身)的工具中获得巨大回报。对此,张家俊表示,微软新版本的Bing搜索引擎融入ChatGPT后,即使免费版的ChatGPT存在无法接入的问题,但若使用该搜索引擎同样也能用上,“ChatGPT结合搜索引擎后可能会越来越强大。”

ChatGPT已然非常惊艳,其技术突破更是超越预期。但如果以通用人工智能标准要求的话,ChatGPT仍存在一些问题。张家俊指出,例如,ChatGPT在事实性问题方面可靠性较弱,无法给出答案依据、不能提供信息的可靠来源,导致用户需要通过其他途径确认答案的正确性。

在鸡兔同笼等很多对人来说简单的数学应用问题上,易产生错误的推理结果,这是源于ChatGPT似乎学习到了推理的基本模式,但是并未学习到推理的核心本质。

此外,ChatGPT本质上还是一个依据上文预测下文的语言模型,缺乏与图像、语音和视频等模态信息的整合,导致它无法处理多模态问题,无法真正理解概念的内涵。

张家俊还强调:“ChatGPT缺乏人类的生活体验,导致无法真正理解世界和人类,没有情感和同理心。”根据媒体报道,ChatGPT的爆火源于它在一位工程师的诱导下,竟写出了毁灭人类的计划书,步骤详细到入侵各国计算机系统、控制武器、破坏通讯和交通系统等,甚至还给出了相应的Python代码。

ChatGPT到底是“危”还是“机”

答案在于使用者

每一项突破性技术几乎都有其两面性,ChatGPT也不例外。但技术对社会有益还是有害,关键还在于使用者。张家俊认为,作为用户,我们可以让ChatGPT成为我们最得力的助手,而不是取代我们的智能行为。“比如,我们可以利用ChatGPT辅助人类创作,或者帮助我们获取信息,或者帮助我们提升写作水平。”

ChatGPT的成功预示着大模型技术将仍然是人工智能未来发展的一个主要方向,也是目前看来在实现通用人工智能的路径中发展最好的路径。在张家俊看来,ChatGPT以自然的语言交互方式展示了一种迈向通用人工智能的可能路径,对AI的未来研究具有较大的影响。

“首先,人机对话不再仅仅是一个细分研究方向,而更多成为AI研究的载体和平台,通过人机对话的方式实现通用智能。其次,由于大模型的规模效应与所谓智能涌现的关系,未来不仅在语言方向,语音、图像、视觉和多模态等方向的研究可能也会研发数百亿甚至千亿级参数的基础大模型以及在此基础上人在环路的各种智能应用。最后,将会出现大批研究者以ChatGPT等通用模型为基础,或研究可解释性、鲁棒性和优化目标等特性来改善ChatGPT等模型,或以此为工具研究各种下游任务。”

“可以预计,ChatGPT与搜索引擎以及其他软件产品的结合将带来用户体验的实质提升,我非常看好这种结合。”张家俊认为,搜索引擎和其他软件产品可以视为内容信息的聚合器和展示平台,ChatGPT可以视为内容信息的理解器、分析器和生成器,因此用户将会有一站式的“所搜即所得”的美好体验。

近日,百度称将推出一款类似ChatGPT的产品“文心一言”,英文名ERNIEBot,预计3月份完成内测,面向公众开放。

消息一出,百度股价一度暴涨15%。百度方面表示,ChatGPT是人工智能里程碑,更是分水岭,这意味着AI技术发展到临界点。

对“文心一言”的即将问世,张家俊也表示十分值得期待。“截至今日,我国还未出现类似ChatGPT强大的产品。国内研发了较好的基础大模型,也有特定领域和通用领域非常优秀的对话系统,相关人才储备和技术积累都比较深厚,相信未来我国也会出现与ChatGPT同样强大甚至更加强大的通用人机对话系统。”

关键词: 正式开启 搜索引擎