文 | 零壹
1月10日下午,百度Create AI开发者大会(以下简称Create大会)正式召开,在百度各大官方矩阵、142家媒体联合直播。百度此次打造了首个“人机共创大会”,从大会歌曲、场景、演讲脑图的创作, AI作画结合的开场演讲、到数字人乐队的演绎和彩蛋, AIGC这一“人机共创”新模式被深入应用到了此次大会的各个环节。
近一年来,AIGC正从抽象的科技新概念中走出,进入大众所熟知的各类场景语境之中。而作为中国最具技术基因,也是最早布局AI技术的互联网公司,本次Create大会是百度AIGC成果的一次系统性展示,从这次大会中,我们得以一窥百度对AIGC技术的深刻理解和全面前沿的布局。
AIGC融入大会全流程
百度AI数字人成为技术呈现窗口
通过希加加、度晓晓、林悠悠、叶开开等百度AI数字人的串联和贯通,整场大会“人机共创”的主题得到了直观、有趣而全面的展示,AIGC堪称是这场Create大会中重要的“幕后创作者”。
在开场视频中,百度AI数字人“希加加”在变幻万千的场景中一路跑酷,带领大家在不同维度的Create世界中穿梭。这一视频采用了全UE动态场景制作,带来了电影级的CG画面质感与运镜体验。虚拟数字人“希加加”在本次大会中存在感拉满,开场视频、画外音、乐队主唱、片尾彩蛋中均频繁出现。据悉作为首个实现 AIGC 的数字虚拟偶像,希加加的动作、服装、发型妆容等均由 AI 技术加持让外形更加拟真, 并且通过AI能力,还可以进行AI剪辑 AI 剪辑、AI 作画、AI 作曲等,能够自主学习及迭代。
在讲解百度量子计算“乾”战略时,百度量子计算研究所所长段润尧和他的“数字人分身”则一起出现在了画面中,让观众真假难辨。这巧妙地契合了量子波动的寓意,在量子计算环节形成“量子态”的来回切换,“猜猜真假数字人”的奇妙呈现效果背后,是百度2D仿真数字人+AI高拟人声音合成技术全面使用带来的仿真效果提升。
百度AI数字人乐队还共同演绎了歌曲《技术有答案》,由乐队主唱兼吉他希加加,鼓手度晓晓,贝斯叶悠悠,键盘林开开组成,为了让数字人乐队MV呈现效果更好,百度通过自研的口型合成算法,准确率达98.5%,智能绑定控制系统,实现生动的动作和实时驱动,最终带来灵动、自然的MV效果。
这不仅是目前数字人使用最多的MV制作,也是AIGC使用最复杂的一次尝试。这首歌的词、曲、MV都不是传统模式创作,而是由百度AIGC生成,数字人歌曲的歌词由文心ERNIE 3.0 Zeus创作,这一模型首先能够从丰富多样的无标注数据中学习,包括百科、小说、新闻、戏剧、诗歌等,同时在学习的过程中融入了知识图谱,指导模型学习世界知识和语言知识,并提升学习的效率。
在大会的BG技术讲解环节中,技术相关话题同样由百度AIGC生成,在整体环节中起到了重要的串联功能,这也是文心ERNIE 3.0 摘要生成能力的一次全面尝试。不仅如此,从百度讲解员的讲解中我们得知,文心大模型如今已堪称“全能艺术家”,可以成为编剧、美术师、插画师甚至剪辑师和动画师……
例如在百度创始人、董事长兼CEO李彦宏的大会演讲中,基于文心·跨模态大模型的ERNIE-ViLG 2.0的“文心一格”平台的AI作画能力就得到了一次惊艳亮相。李彦宏用“危机和希望”为关键词,在百度AI作画平台一格上由人工智能自动生成了一幅画,这幅画中新生的绿芽破冰而出,不仅传神地完成了作画命题,也体现了AI作画不俗的艺术表达能力。
而在最后的数字人彩蛋环节中,希加加、叶悠悠、林开开、度晓晓同台讨论了作为“幕后创造者”的感受,数字人们畅谈开场演讲中的画,乐队的编曲、场景特效的创作过程。数字人们不仅总结了大会中的AIGC亮点,还把大会传播稿都写好了,甚至还在传播稿标题上斟酌加上了“震惊”二字。
这段彩蛋环节是多人数字人综合使用的尝试,数字人之间的对话流畅与真人基本无异,百度综合了ASR语音识别技术、TTS语音合成技术、PLATO开放域对话系统、AI变声技术、柔体解算技术等共同实现了这样的仿真效果。
本届大会是百度AI数字人出现最多的场景,希加加、叶悠悠、林开开、度晓晓 、太空兔、祝融纷纷亮相,由百度智能云曦灵平台实现实时的物理模拟和场景渲染,结合人工智能算法,让数字人整体画面灵动而自然。多个数字人在多元场景中的成功运用,让“人机共创”这一大会主题得以贯穿全场。
在“人机共创”时代,百度开启崭新未来
“人机共创”主题的最佳体现,或许在大会的那段艺术家与AI共创画作的视频之中。数字人画外音提问“未来是什么样子”,画面中人类设计师与AIGC创意制作的不同海报同屏呈现。一幅幅AIGC和人类设计师共创的优美作品得以展现,AIGC和人类设计师共同诠释创造者精神,并向每一位创造者致敬。而“未来,由坚定创造”则透露出了百度的品牌精神,百度的坚定,是有着坚定的技术信仰,是坚信技术可以改变世界,坚信遥不可及的事情会变成日常。百度将与创造者们一起看见未来。
视频中AIGC制作的海报由“百度飞桨文心一格”AI作画自动生成,基于文心·跨模态大模型的ERNIE-ViLG 2.0(文心一格)命题深度应用,它的画作也启发人类设计师的创作灵感,真正的让AI与人类携手展示了创造者精神和坚定的力量。
在刚刚过去的2022年里,AIGC(人工智能自动生成内容)迅速从科技领域出圈,成为了行业和大众最为关注的科技话题:AI作画作品在社交平台上被用户大量传播,甚至还在海外竞赛中获奖;OpenAI发布的AI聊天ChatGPT掀起又一轮新的讨论;而虚拟数字人的学习、表达、交互能力大幅提升,在各种场景中拓宽着AIGC应用的空间。
AIGC在2022年的爆红出圈开启了这一行业的“元年”,也意味着未来已来。这一过程不一定是风调雨顺的,但这往往也意味着巨大的机遇和通往下一代科技的钥匙。这其实就像李彦宏在演讲中解读AI画作时所说的那样:“生机勃勃的新生命已经破冰而出,然而寒冷还没有完全褪去。所有伟大的企业、伟大的创造者也是一样,没有一帆风顺,只有不断地历经困难再凯旋。困难会刺激创新,而创新是增长的真正动力。”
*原创文章,转载需注明出处
如若转载,请注明出处:https://www.dasum.cn/19155.html