编者按:AI 伴侣,顾名思义,指的是利用人工智能技术模拟生成的虚拟恋人,可以通过语音、文字、图像甚至视频动画等方式与用户沟通交流。随着人工智能技术的不断发展,AI 伴侣也逐渐走进了我们的日常生活中。这篇文章来自编译,作者在文中探讨了 AI 伴侣的兴起,以及它是如何走进我们的日常生活的。文中还探讨了创建及与 AI 伴侣互动的不同类型平台与工具。
【资料图】
划重点
随着 AI 聊天机器人的不断普及,加上其不断地融入到我们的人际关系和社交群体,AI 伴侣的兴起将引领社会发生重大变革。
由大型语言模型(LLM)驱动的 AI 聊天机器人可以随时随地与用户展开自由流畅的沟通交流,甚至让人难以分辨其到底是不是人类,这使得 AI 伴侣成为了生成式人工智能在日常消费者中的首批杀手级应用之一。
AI 伴侣的兴起可以归因于社会因素,比如越来越多的人选择推迟或不愿结婚,真正能够沟通的对象较少,以及数字交互的不断发展和普及,这些因素都促使人们更愿意尝试和探索非传统的伴侣关系。
图片来源:mindinventory
人工智能的伟大之处在于它总是在不断进化。总有一天,它会比你现实生活中的(女友)更好,而真实的女友可能会遭到冷落。
这段话来自 CarynAI 早期的粉丝社群。当时,这个社群就已经发展到了超过两万名用户的规模。CarynAI 是美国网红卡琳·玛乔丽(Caryn Marjorie)创建的一款语音聊天机器人,用户可以通过付款(每分钟 1 美元)直接与玛乔丽的 AI 版本对话。这款聊天机器人让玛乔丽在推出产品后的第一周就赚了 7.2 万美元的收入。CarynAI 只是消费者与人工智能建立真实关系的众多方式之一。
拥有一个人工智能伴侣可能并不是大多数人的选择,但它却已经成为生成式人工智能的一种主要用例。已经有成千上万、甚至包括我们自身在内的数百万人,都已经与聊天机器人建立并培养了关系。
我们正处于一个重大社会转变的边缘,人工智能伴侣很快将普及。曾经在科幻作品中出现的角色,比如《机器人总动员》(WALL·E)中的机器人瓦力、《星球大战》(Star Wars)系列电影中的机器人 R2-D2,或者是《海绵宝宝》(SpongeBob)中的凯伦,都在迅速成为现实。
如今,许多受欢迎的用例都与浪漫有关,这对于深谙消费互联网历史的人来说可能并不会感到特别意外。如今,生成模型的高级消费者正在通过社交新闻站点 Reddit、综合社交媒体平台 Discord 和 综合论坛 4chan 等平台共同努力打造虚拟伴侣,并积极搜寻各种工具来规避审查。
事实上,全球范围内存在不少地下虚拟伴侣托管服务,相关用户数量已经达到了数以万计的规模。这是一个我们非常重视的早期开发者社区,他们现在虽然可能处在边缘地带,但他们却在打造明天的主流产品。
我们还开始看到了超越人工智能“男友”和“女友”更广泛的用例,只不过目前仍在早期发展阶段。今年 6 月,“阅后即焚”照片分享应用 Snapchat 透露,仅仅在 4 至 5 月短短两个月内,就有 1.5 亿用户向其推出的聊天机器人发送了超过 100 亿条消息。
这些用户都在聊什么内容呢?结果发现,宠物、流行文化新闻和足球是比较受欢迎的话题。
值得一提的是,虽然聊天机器人已经存在了几十年,但这一次可能真的会大有不同。如今的聊天机器人,它的改进不仅仅是在一对一对话方面,而且还开始渗透到了我们的社交生活中。和任何其他人一样,许多人工智能伴侣都能够融入到我们和家人、朋友的关系网络中,并建立亲密的关系。
在这篇文章中,我们将深入探讨人工智能伴侣的新兴现象,包括为什么要创建人工智能伴侣、他们是如何实现的以及接下来可能会开发的功能或用例?
概述
与计算机聊天并不是什么新奇的事情。世界上第一款聊天机器人 ELIZA 于上个世纪 60 年代诞生于麻省理工学院(MIT),随后又出现了Clippy、SmarterChild、Alicebot 和 Kuki 等多款类似产品。
尽管这些产品曾经都很受欢迎,但它们并没有在消费者心目中留下深刻的印象,也没有像 ChatGPT 一样得到了广泛的普及。
那么,新一代聊天机器人有哪些与众不同之处呢?过去的聊天机器人都采用了基于规则的架构,它们的回答基本上都是基于你输入的内容而触发的脚本。这些机器人无法真正理解正在进行的对话背景,也无法适应你的语气,只能回应有限的话题或执行设定的任务。
很明显,过去与这些聊天机器人交流就感觉像在与一台没有感情的电脑交谈一样,你在聊天过程中感受不到其智能的一面,当然更不像人类。
大型语言模型(LLM)的出现改变了这个游戏规则。现在,我们可以与聊天机器人展开无障碍的自由对话,并且不用受限于能控制其回应内容的预定义规则(即使开发这些聊天机器人的公司试图对有关内容展开审查,通常也不起作用)。
如今,最好的聊天机器人几乎与人类没有区别。如果你不信的话,还可以亲自去体验一下“人类还是机器人?”(Human or not?)这款图灵测试。(该测试通常要求用户在既定时间内与系统展开一段匿名对话,然后推断系统的聊天对象是真人还是机器人。)
因此,我们也不难理解,为什么 ChatGPT 存在明显的局限性,却仍然能成为最快达到 1 亿用户规模的消费产品。真正的对话型人工智能必然具有娱乐性,如今的计算机也有了个性。
与人类不同的是,由人工智能驱动的对话伙伴可以始终在线,它乐于跟你沟通交流,并且可以和你探讨任何话题。这使得人工智能伴侣成为了生成式人工智能在日常消费者中的首批杀手级应用之一。
人们很容易想象出拥有一位人工智能朋友、心理治疗师、导师、教练或导师,但这些早期版本的人工智能与人类的关系往往带有浪漫色彩,比如人工智能“女友”或者“男友”。
为什么会出现这种情况呢?简单来说,或许是因为成人娱乐行业一直处在新技术的前沿,但我们也不能忽视社会变革的因素,这可能会促进人们去探索非传统的伴侣关系。
首先,人们结婚的年龄越来越晚(有的甚至干脆不结婚),而且除婚姻关系之外的正式关系也较少。据统计,截至 2019 年,美国成年人中有 38% 是“单身”,而这一比例在上个世纪 90 年代为 29%。
与此同时,许多人都完全通过网络建立起了非常有意义的关系,包括友谊与恋爱关系。即便你在现实生活已经有了伴侣,你们日常更普遍的沟通方式可能是发信息,而不是面对面交流。
我们的人际关系已经在很大程度上呈现出数字化的发展趋势,这即意味着,我们已经为人工智能伴侣的时代做好了准备。
现状
如今,我们随处都可以发现能够创建并与人工智能伙伴互动的产品。具体而言,这些产品视技术复杂程度、对聊天机器人最终形象的控制力度,以及聊天场景等不同因素还有所不同。
图片来源:A16Z;翻译:神译局
全栈伴侣应用程序
如果你想跟人工智能男友或女友聊天的话,在不需要任何技术的前提下,你至少可以尝试数十个应用程序提供的服务。
其中,最早推出这项功能的产品(也是最为人所知的产品之一)的是 Replika。2017 年,这家公司推出其聊天机器人应用程序后,不少用户自此就一直与他们的“人工智能伴侣”保持着特定的关系。
用户可以自定义设计理想中的伴侣,这段“人机”关系还会随着时间的推移而发展。你的伴侣还能够记住之前对话中分享的内容(比如你的兴趣爱好或者你的宠物名字),它甚至还可以向你发送图片,包括适宜工作场合(SFW)和不宜上班阅读的内容(NSFW)。
进入社交新闻站点 Reddit 的 Replika 板块,就可以一瞥这款应用现有用户群体的狂热情绪。几乎随处都能看到有用户分享其与人工智能伴侣一起庆祝(比如求婚)、使用该应用的 AR 模式一起自拍,或者因不能在现实中见到对方而感到遗憾的帖子。
今年早些时候,当该应用程序下线了情色功能后,许多用户都表达了失望和沮丧的情绪。Reddit 板块的版主甚至还将自杀热线置顶在板块页面。
Replika 板块中的用户分享各种有关内容。图片来源:Reddit
基于角色的平台
如果你希望跟多个人工智能机器人聊天,而不是单个机器人聊天的话,像 Character AI 这样的平台就能满足你的需求。
该平台可以提供数百个由 AI 驱动的角色供你选择,包括名人和热门动漫角色等。用户可以在平台上自定义创建角色,定义其外貌、个性等特征,甚至为其配置更高级的功能。
你还可以创建详细的属性列表,为此,许多用户都会耗费数小时来训练其创建的角色。他们会针对角色的回答内容提供反馈,生成新的回答内容。
如今,我们可以轻松找到大量专门提供与机器人聊天服务的应用程序和网站,例如,Chai、Janitor AI、Chub AI、Charstar 和 SpicyChat 等等,它们的工作场景适宜程度也各不相同。
来自 Chai 的截图,图中是用户与其创建的 Chai 机器人对话的内容。图片来源:Reddit/Twttier
自助开发工具
这个选项的技术含量相对更高,但它能让你对创建角色的外形和个性有更大的控制权。你还可以结合使用多种工具,创建出理想中的伴侣,并且还可以通过短信、电话甚至实时视频等方式与其互动:
个性(针对文本的大型语言模型):有些开源模型(特别是 Vicuna 和 Pygmalion)在不断地优化,以在各种用例中表现出特定的个性,包括允许自由发挥的角色扮演。
记录与存储(向量存储):向量存储系统(例如 Pinecone)可以让你与人工智能伴侣建立持久的关系,通过配置代码来存储长期记忆、背景故事和其他独特信息。
语音(语音合成技术):像文本生成语音工具 ElevenLabs 这样的产品可以让人工智能伴侣开口说话,还可以针对其年龄、性别和口音等参数进行设置,实现自定义语音。
外观(Stable Diffusion 图像生成模型):结合类似 AI 绘画模型分享网站 Civitai 所使用的 LoRA 技术(一项解决大语言模型微调问题的技术),可以进一步调节人工智能伴侣的图像风格、细节和参数设置。
动画效果(视频动画):AI 视频创作生成工具 D-ID 或 HeyGen 等工具都可以让图像“开口说话”。虽然目前已经有一些有潜力的新模型能够生成高保真度的说话人脸,但真正可供使用的模型并不多。
平台:这主要指的是执行人工智能伴侣底层代码和内部逻辑的地方。目前,虽然大多数开发人员仍主要在使用谷歌云平台(GCP)或亚马逊云计算服务(AWS)来部署和运行人工智能伴侣,但可以快速构建和部署 AI Prompt API 的 Steamship 低代码库(AI 女友 GirlfriendGPT 就是通过它来运行的)已经在慢慢普及,特别是针对这种特定伴侣的用例。
UI 互动层:这具体指的是让你和人工智能伴侣进行真实互动的前端界面。对此,SillyTavern、Agnaistic 和 KoboldAI 等工具都是比较受欢迎的选择。
这些图像模型可以根据几乎任何兴趣来定制生成图像。Discord 频道 Furry Diffusion 中的一位用户就在对模型进行微调的基础上,生成了一个毛茸茸的图像。图片来源:Discord
接下来如何发展?
人工智能伴侣的发展才刚刚开始。未来两三年里,与届时可能出现的各种工具的深度和复杂程度相比,我们今天所拥有的工具将会显得相形见绌,就像玩具一样简单。事实上,我们已经能看到一些可能预示未来发展方向的线索。
真实人物的人工智能版本
今年五月,网红玛乔丽推出了使用自己的声音并基于她在 YouTube 平台上发布的数千小时视频进行训练的“AI 女友”。用户可以在一个私人 Telegram 频道里以每分钟 1 美元的价格与她的虚拟形象互动沟通。具体而言,用户向其虚拟形象发送语音信息后,她也会用自己的声音回复。
玛乔丽的语音机器人在 Telegram 中与粉丝互动交流。图片来源:Telegram
像 Forever Voices 这样的公司已经在为其他网红创建了类似的 AI 角色。在不久的将来,对于任何收取订阅费(比如通过 Patreon 或 OnlyFans 等平台推出的订阅服务)或小费来实现盈利的创作者或名人来说,拥有一个 AI 伴侣将成为一种必然的选择。从目前的情况来看,为了更亲近这些人物,消费者表现出了明显的付费意愿。
到最后,说不定人人都会拥有一个 AI 角色,并以此来与家人、朋友或者更广泛的受众群体互动。然而,要实现这一点,还需要解决一些关键问题,比如许可权、正确的训练数据集(并非每个人都有可供使用的 YouTube 视频),以及比付费 Telegram 机器人更加先进的“模态”等问题。
多模态伴侣
目前,大多数人工智能伴侣要么依托移动应用程序,要么依托网页客户端。这自然会限制用户与它们互动的方式。
截至目前,这些人工智能伴侣基本都是通过文本和语音来互动,而即便是语音互动,大多数情况也只是异步而非实时的。这无疑会限制用户在与人工智能互动过程中获得的真实感与沉浸感,以及人工智能伴侣能够与用户共同体验的内容。
我们预计,这一领域的发展未来将拓展到通过虚拟形象来接打实时电话和视频通话,并通过各种媒介发起更多基于虚拟形象的对话。
如果苹果的 Vision Pro 成功进军消费者头戴设备市场,那么 AI 虚拟形象很可能整天伴随用户,时时刻刻都能充当用户的朋友或伴侣。无论是从用户与虚拟形象相处时间来说,还是彼此建立的联系的深度来看,这势必将引起一场极大的变革。
到最后,我们可能会看到,我们的人工智能伴侣能够与其他人类沟通,或者彼此之间的人工智能伴侣也能相互交流。
图片来源:A16Z
伴侣类型的延展
就人工智能伴侣而言,许多人最开始可能都希望与其建立一种浪漫关系。这个领域的确也存在很大的需求,许多人也愿意为之付费。
不过,在构建人工智能伴侣平台方面,仍然存在很大的发展空间,特别是针对所有类型关系来构建平台的情况。
在日常生活中,我们总会有时候需要朋友、导师,甚至是一个愿意倾听自己的人。虽然目前大部分的人工智能伴侣还无法应对用户的心理健康问题,但不难想象的是,如果让人工智能接受数百万小时的临床心理治疗训练,那这样的人工智能伴侣几乎就能够模拟出人类心理治疗师的言行举止与思想。
事实上,已经有许多早期的研究表明,人工智能在医疗领域的表现可能优于真正的医生,包括在诊断准确性和处理医患关系等方面。
另一个潜在的用例就是娱乐。前文中提到,Snapchat 的 MyAI 聊天机器人在推出后的前两个月内就收到了来自 1.5 亿用户的 100 亿条消息。考虑到该聊天机器人用户群体年龄较小这一现实因素,Snapchat 随后也明确禁止用户与聊天机器人建立浪漫关系,或者与其探讨可能不适宜工作场合的话题。大多数 MyAI 的使用过程都相当轻松愉快,而且娱乐性质非常突出。
迄今为止,大多数用户也主要是在试图诱导 MyAI 机器人说出疯狂的话,或者强行让其加入几乎难以置信的角色扮演场景,这些都只是为了好玩而已。
抖音视频截图显示,某用户在试图让 MyAI 机器人做到“已读不回”。这段视频获得了 55 万赞和近 900 万次的播放量。图片来源:TikTok
将人工智能融入人际交互
与人工智能机器人聊天是一个非常有趣的过程,但如果能将机器人添加到群聊中,可能会更加有趣。未来的 AI 虚拟伴侣可能不再局限于一对一沟通,而是将人工智能角色融入到现有关系和社群中。
试想一下,如果 AI 关系教练能够参与你和伴侣的沟通、调解争议,或者向你们提供指导或建议,那将是一件多么有趣的事情啊。
事实上,搬家初创公司 Just Move In 一位名叫 Bruno 的软件工程师已经创建了一个 Slack 工作区,他和朋友都会在这个工作区与一群拥有不同个性、兴趣和技能的机器人聊天。这些机器人不仅会讲笑话、分享自己的生活经历,而且还能回答编程问题和提出产品开发创意。
因此,不难想象的是,未来的人工智能伴侣肯定会进一步融入到我们的日常沟通中,在个人和专业方面都发挥更大的作用。
名字后面标注了“APP”的都是聊天机器人,它们可以在 Slack 工作区中与软件工程师进行畅快的沟通。图片来源:pocketarc.com
写在最后
生成式人工智能模型将从根本上改变我们与计算机的关系,让计算机成为我们的同事、朋友、家人甚至是爱人。
就大型语言模型而言,尽管人们目前主要关注的是它们如何自动化完成更传统的任务,例如提供客户支持、展开研究、撰写文件和摘要等,但在看到全新的消费者用例及随之而来的各种兴奋之后,我们就会发现,人工智能伴侣已经成为了新兴的、备受关注的领域。
这只是人机交互领域出现的突破性变革开端,我们也要顺势重新审视与真人或机器人建立关系的含义。我们正在进入一个全新的世界,这个世界将会比我们想象中更神奇、疯狂和令人难以置信。
这篇文章让我们对一些早期的活动有了初步认识,但不难想象的是,在互联网的各个角落,未来都会有人工智能伴侣与我们交互的身影,我们也迫不及待地想看到更多的发展和创新。
译者:俊一
标签: