在经过生成式AI的“教育”之后,不少人开始感叹AI的无所不能。与此同时,行业内的人士却也发现,经过大模型训练而“涌现”的AI虽有惊艳之处,但落地到具体的应用场景,总有点“缺了什么”的感觉。

这对成都潜在人工智能科技有限公司(以下简称“行者AI”)来说并不是一个陌生的问题。自从2016年成立团队以来,行者AI就在关注如何利用AI为游戏从业者实现降本增效。

“我们希望成为一个帮助游戏乃至文娱公司降本增效的平台,我们希望把工具做得更加简单易用,让大家可以一键上手。”行者AI CEO尹学渊说道。


(相关资料图)

行者AI CEO尹学渊 图片来源:左梦涵 摄

采访当天,行者AI CEO尹学渊身着带有行者AI标志的Polo衫,打扮十分干练。技术出身的他语速极快,在回答问题时往往采用拆分成几个方面或层次的方式来回答。

这种问题导向的思维同样也贯穿在行者AI的产品当中,在他看来,如何落地“最后一公里”是当务之急,“大模型结合领域专家的垂直模型可能更有市场空间或者应用场景。”

随着对产业链环节的逐步“拆解”,目前,行者AI已推出包括AI美术、AI音乐、AI虚拟玩家、AI安全等在内的产品及解决方案。

尹学渊告诉《每日经济新闻》记者(以下简称“NBD”),朝着这个方向,行者AI正在不断优化产品,以期能够让游戏行业乃至内容创作的从业者能够尽量节省生产的时间,以把更多精力放在创意本身,正如其愿景所言:聚焦于1%的创意,释放99%的密集型劳动。

打造一整套生产力工具

NBD:在今年大模型的热潮下,不少观察都指向其“降本增效”的想象空间。无独有偶,行者AI的团队在2016年成立之初,想要解决的主要就是游戏开发中的“高成本、低成功率”问题?

尹学渊:游戏本身来讲是一个非常复杂的系统工程,其中有各种各样的环节。所有环节累加在一起导致了一个问题,那就是游戏的开发成本非常高,但是另一方面,它的成功率又低。实际上,不仅仅是游戏,整个内容行业的成功率可能都是比较低的。

高成本、低成功率意味着想挣钱还是挺难的。所以我们当时立项,就是希望降低游戏开发制作以及运营的成本,途径就是利用人工智能,因为它本身是一个降本增效的工具。

举个例子,单独来看,可能每款产品只有3%的成功率,但是如果用同样的钱,成本降低的情况下,可以去做10款。我们天马行空地想一想,如果能把成本降到1%,就可以做100款。换句话说,容错率在不断提高,游戏公司的产品也更容易“跑”出来。

NBD:2016年人工智能的“明星”当属AlphaGo,其采用的深度强化学习算法也走红一时。在当时的人工智能热潮以及技术条件的背景下,行者AI主要推出了什么产品?相应解决了哪些“痛点”?结果是否又超出预期?

尹学渊:我们最早做的是虚拟玩家,也就是机器人陪玩,和AlphaGo类似,这种算法的底层逻辑是深度强化学习。推出之后,立竿见影地解决了玩家在匹配乃至用户留存方面的问题。

在竞技游戏当中,机器人陪玩是一个重要的话题。竞技游戏作为一种强对抗属性的游戏类型,玩家在双方实力相当的时候其实是最舒服的,棋逢对手才最好玩,一方太强或是太弱都会让玩家感觉到没意思。在这种情况下,AI可以起到的作用是扮演对手或是队友,综合给到一种很好的体验效果——要么是“险胜”,要么是“惜败”。

深度强化学习的原理非常适合这个场景,它可以真正教会AI玩游戏,相比以前用行为树来控制机器人时的打法单一、可预测,基于深度学习的AI机器人可以达到媲美人类的水平,也有更多的发挥空间。

另一方面我们也开始尝试AI美术,不过还是受限于当时的算法,对抗生成网络(GAN),以及算力。我们发现,GAN能画的东西不多。直到近年流行开来的扩散(Diffusion)算法之后,AI美术的能力才得到了极大提升。

所以说,当时的结果并没有超出预期,虽说AlphaGo的推出给市场带来很多启发,但从设想到落地我们还是花了挺多的时间。

AI原画创作 图片来源:受访者提供

NBD:在上述提到的算法、算力迭代的大背景下,行者AI目前已有AI虚拟玩家,AI2D、3D图像资产生产, AI音乐音效生产,AI内容安全的产品矩阵,打造这样一个矩阵的考虑是什么?主要解决的又是游戏行业内的哪些具体问题?

尹学渊:近5年以来,整个行业提了很多类似“游戏工业化”的概念。什么叫工业化?这是一个相对的概念,打个比方,以前可能更像手工劳作。而建立一个标准化的工业流程,像福特生产汽车一样来生产游戏,它的成本才能降低,成功率才能提升。

既然是工业化,就需要各个环节都能降本增效。游戏研发流程本身非常复杂,将其逐个拆分,不同的环节都会有不同的占比,比如美术的成本一般可能占到游戏的40-50%左右。我们的策略是让各个环节都能实现降本增效——不是单点地去做某一方面的工具,而是打造一整套生产力工具。

AI音乐制作 图片来源:受访者提供

把算法以及大模型应用到场景中

NBD:在“爆红”几个月后,ChatGPT的流量在今年6月出现了环比下降,一些观点聚焦在了通用大模型如何落地的问题。对此,行者AI如何看待?又会采取何种应对措施?

尹学渊:我们现在比较关注一个点,就是大家怎么在“最后一公里”去落地。在我看来,目前的AI与上一代的AI相比,确实有很多不同之处,特别是在“涌现”之后展现出的逻辑推理能力。

然而,你会明显地感觉到它还是不能满足人们的需求。大模型看起来似乎无所不能,但是一旦仔细去用,好像又什么都做不了,它就是差那么一点点。打个比方,大模型可能更像一个教育好的高中生,有一定的逻辑推理能力、语言表达能力等。但是如果一个高中生直接走上职场,会不会觉得怎么都弱了一些?所以应该到大学里面选择学习一个专业,有了专业的知识才能服务好具体行业。

“最后一公里”实际是我们从业者要去解决的问题。在未来,大模型结合领域专家的垂直模型可能更有市场空间或者应用场景。因此,我们采取的策略更多是把算法以及大模型应用到场景中,要能为行业服务。

NBD:AI技术不断创新,市场竞争也很激烈。以AI绘画为例,从去年开始,以Stable Diffusion、Midjourney等为代表的AI绘图软件已在业界掀起热议,其能力迭代之快引人侧目。这对于行者AI有何影响?准备如何应对? 

尹学渊:像Stable Diffusion,几乎每周都有新版本、新插件。在此背景下,发表的论文也好,开源社区的新动向也好,算法、底层模型、插件的迭代也好,第一时间我们都会去跟踪。

实际上,包括这些软件在内的快速迭代对我们来说还是一个助力。它们可能迭代得非常快,甚至每天都有新东西出来,但是你会发现大家去用它们解决实际问题时,还是会有各种各样的地方处理得不好。

这背后需要结合“Know-How”,(设计)一套自己的工作流,是开源社区无法帮助完成的。比如开源的Linux,并不是谁拿它都能做一个好用的操作系统。AI开源工具也一样,需要结合领域内的知识,知道大家在行业里要什么,在此基础上进行迭代和更新,才可能做出好用的产品。

AI美术模型训练 图片来源:受访者提供

NBD:具体来看,行者AI推出的AI绘图软件是如何结合“Know-How”的?

尹学渊:目前,行者AI的AI绘图软件主要有两个版本,一是行者AI美术专业版,二是上手门槛更低的图刷刷。背后其实就是三个词——高可控、一致性、高精度。

先说高可控,既然是生产力工具,那就不能是个玩具。要画一个红衣服的女孩子,她就一定是红衣服,要一个跳起来的姿势她就需要跳起来,要一个中国风她就必须要是中国风。而且力度控制要做得很细,而不是出现无数个提示词,最后依然没有达到要求。

其次,保证有一致性。目前的AI绘图软件已经能把一幅画画得很漂亮,但是在实际的应用场景中,画风要保持一致,里面出现的角色也应该是连续的。否则画得再漂亮,也无法具体运用。最后就是高精度,出的图片一定是真正(在精度上)能用得上的。

我们在这个工具里面会做一些工作流。比如批量出图,因为只有能批量出图,才可能进入到生产环节。毕竟AI做的东西在目前还不是百分之百地可用,所以我们会用出图率来衡量,一批图里能选出的越多,就越能节省生产力。

AI美术3D减面 图片来源:受访者提供

AI是助手不是对手

NBD:目前看来,加强人工智能的监管已经成为共识,有关生成式AI的话题也不乏争议。在这其中,版权和质量问题的讨论尤甚。一种典型的质疑声音认为,生成式AI的作品不仅容易侵权,产出的质量也“一言难尽”。行者AI如何避免上述提到的问题?

尹学渊:有关版权的问题刚好问在我们行者AI产品设计的理念上面,第一个叫做“可用”,第二个叫“好用”,第三个点其实叫做“敢用”。可控、一致性、高精度保证“可用”;降低操作门槛、一键快捷功能、增加出图率和批量出图让产品“好用”;这个问题正好是“敢用”。

敢用又分为两个层次,第一个是知识产权,第二个是合规性。

先说知识产权,目前的大模型,更多可以理解为它消耗了全世界的素材,但是为了做到高可控、一致性、高精度,特别是一致性,才能保证可用,那就需要训练自己的画风。我们的工具有训练模型的功能——“一键炼丹”,现在服务的客户几乎都会用自己的素材投喂AI,在训练画风的同时也在避免侵权:用户使用自己的素材,训练自己的模型,这个模型只提供给自己使用。

行者AI获“2023AIGC应用创新TOP50”荣誉 图片来源:左梦涵 摄

在合规性上,当出现与常见的道德观、法律法规以及不同国家地区民俗相违背的内容时,AI能发挥很大的作用,这也是为什么行者AI会有一条AI安全的产品线。

至于产出质量的问题,确实,如果只拿AI来做,有些地方就是有瑕疵,多多少少可能现在还没有达到我们脑海中对AI的期待,好像一提自动驾驶就一定得是 L5级别。其实,今天大多数厂商还在L2到L3的过程中,这仍然是有价值的。

你一定要去把它变成工具,进行AI跟人之间的反复交互与创作。在AI的帮助下,虽然(一个作品)并不是一秒钟就做出来了,但可能两周的工作量实际上花三天就完成了,这样难道不好吗?我们看待AI,一定要把它当成助手,而不是对手。

NBD:游戏行业一个典型的现象是,游戏厂商纷纷提出“精品化”的口号。在此情况下,AI带来的降本增效能够解决什么问题?我们注意到,除了游戏行业,行者AI也在进行一些探索,比如打造AI音乐教室,这背后的考虑是?

尹学渊:在存量市场,谁具有成本的优势,谁就更容易做出好东西。在保证游戏品质不变的情况下,很多游戏公司都希望以更低的成本把游戏做出来。AI作为降本增效的工具,其落地是一个特别好的趋势。

其次,我们能不能去扩展游戏的外延?不仅靠游戏休闲娱乐,我们还能给它赋予一些像教育、医疗、陪伴的应用场景。我觉得在未来这是一个很大的趋势,我们也在探索。

比如AI音乐教室就是去启发小朋友们的创造力。在以前,自己要创作一首歌是一件很难的事情,这里面包括旋律,还有不同的乐器。在小朋友的知识还没有那么完整的时候,AI的出现恰好可以弥补这一部分的知识,比如告诉它“今天你很开心,来一段开心的旋律”之类的。

此外,AI医疗的场景我们也在探索。现在我们跟全国某知名医院有一个合作项目,做老年人的游戏,让老年人的脑部活跃起来以预防老年痴呆。游戏里我们会设计一些记忆、语言表达、逻辑推理的点,来刺激他们大脑中的不同区域。

成都石室天府中学附属小学一体化教室 图片来源:受访者提供

NBD:回看行者AI的发展历程,团队成立的2016年刚好遇上AlphaGo的热潮,今年又站在以ChatGPT为代表的生成式AI的浪潮之中。其实,人工智能在期间也经历了爆红-遇冷-再爆红的过程。行业起起伏伏,行者AI的方法论是什么?如今又在风口,有何愿景?

尹学渊:我最大的观点或者体会是——风口都不是追来的,而一定是等来的。当你坚信一件事情一定会发生的时候,你就应该去好好地沉淀自己。

去年年底推出的ChatGPT用上了基于人类反馈的强化学习,也就是RLHF(Reinforcement from Human Feedback),加了这个东西它才像人。当Transformer模型和RLHF结合的时候,就会产生新的一个化学反应,在我们看来,人工智能今天的成果,也是一直在迭代,并不是说突然一下就“起飞”了。

新闻每天都在说AI工具的事情,实际上能够每天把AI工具完全融入到生产流程的公司或是开发者还是很少,最大的问题还是门槛太高了。

行者AI希望成为一个帮助游戏乃至文娱公司降本增效的平台,我们希望把工具做得更加简单易用,让大家可以一键上手。以后大家只要有一个idea,你就可以创作,而且这种内容不仅仅是游戏。

本文作者系天府文创云记者石普宁,转载合作相关可搜索“天府文创云”公众号。

推荐内容