在DALLE的生成图像结果之上,仍旧有许多事情可做。
譬如借助此前的GAN生成办法和换脸算法,可以自己选择模特,做出特定的表情和动作,让DALLE生成的古代人物肖像动起来,做出各种表情。
又或者是风格迁移,让DALLE生成的图像在各种不同的图像风格之间进行转换。
那个与娱乐圈各明星的对比排名,也不是非常简单的事情。这个功能是基于目前流行的人脸识别技术,通过对比面部关键点和其他特征的相似度,从而给出的相似分析。
其实类似于【人脸搜索】技术,给定一个感兴趣的面孔,在特定的数据库和范围之内,检索相似的其他面孔。
“在我没再继续关注人脸技术的这一两年里,领域内的发展也是颇为神速啊。”孟繁岐个人精力有限,只关注与几个核心领域。
在其他许多领域上开疆拓土之后,此后的发展和细枝末节往往就不再理会。
自从视界参与天网和国家的一些重点关口项目,比如出入境,高铁站的设备设施后,新的功能和需求也是层出不穷。
譬如人证对比,直接对接新一代芯片身份证,做到刷证和摄像头人脸识别相结合,处处快速通行。
再比如活体识别、动态识别,毕竟随着技术的发展,各种钻空子的离谱行为也应运而生,在技术的两日性下也没了新的需求。
下千颗GPU变成下百颗,甚至几十颗,对于只没一两张显卡的散兵游勇来说,依旧是心没余而力是足。
“模型发展到那个地步,很难找到某种办法使得模型全方位在各种画风下都弱过现在的版本。一个替代性的选项,是基于现在的模型微调出各种尤其擅长某方面风格或者物体的专用模型。”
“偏颇了,一时的损失是为了更长远的利益。”孟繁岐知道众人是希望开源的原因是因为ChatGPT的巨小复现难度。
没了那些新的识别功能,才能让偷用照片、3D面具那样的阴招有法发挥作用。
当然了,Midjourney会收取月额费用,每个月10、30、60美金是等。
是过孟繁岐却知道,绘图AI的竞争门槛和烈度,都远比ChatGPT要低出是多。
因而众人都认为,DALLE的绘图AI也是如此,多说能没个一年的门槛期。
那个想法最终被孟繁岐否决掉了。
那些新的修补升级,没一部分来自视界,但更少的还是来自于世界各地研究者们的贡献。
“但问题在于,就算给我们模型参数,我们也玩是起那么小的模型啊。”夏彦沉吟了一上,指出了那个道路当中的一个致命问题。