热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

DNSPod十问夏珍:如何用黑科技“复活”张国荣?

夏珍,腾讯多媒体实验室视频处理技术负责人,张国荣《热情》演唱会修复技术负责人。14年入职腾讯,负责QQ音视频通话的画质优化,

c4e9eb01f942408f5a799b650643f9b2.gif

7ab914720172ef5ff36fc0bedf07a7d1.png

90ca48ad26899ae76e7bb108f061bee1.png

夏珍,腾讯多媒体实验室视频处理技术负责人,张国荣《热·情》演唱会修复技术负责人。14年入职腾讯,负责QQ音视频通话的画质优化,业界首推低码率的实时视频美颜,在toC上服务QQ、QQ空间、QQ音乐、微视、全民K歌等产品,18年后负责视频处理技术包括画质修复和画质增强等算法的探索、研发、应用和落地,重点服务腾讯云音视频、媒体AI中台、数据万象、腾讯会议、腾讯视频、腾讯影业等业务。

b2ced28ac5010413c605fde98e58fd4b.png

吴洪声,人称奶罩,腾讯云中小企业中心总经理,DNSPod创始人,洋葱令牌创始人,网络安全专家,域名及DNS技术专家,知名个人站长,中欧国际工商学院EMBA。

1

吴洪声:你自从加入腾讯以来一直都在做视频处理相关的工作,从早期负责QQ视频美颜,到后来的腾讯会议的降噪,再到现在的腾讯多媒体实验室,以及腾讯云音视频、媒体AI中台等等,当初是什么契机让你选择了视频领域并一直深耕下去?这么多年里有没有哪段经历让你印象最深刻?

夏珍:因为热爱吧。

14年进鹅厂时做的第一个项目是QQ视频美颜,在当时应该是业界首推低码率下的实时视频美颜,虽然过程有非常多的挑战,但能感受到给用户带来的全新体验。

其实中间经历了非常多有趣也有挑战的项目,但4月1日张国荣《热·情》演唱会还是印象最深刻的一段。因为最开始做的QQ是一款toC的产品,后来随着公司战略的转移,我们的重心也从toC移到了toB,而这次演唱会仿佛是一种toC和toB的结合,有点意思。

1c7972c6d47a3d745856c0ac43d61f21.png

2

吴洪声:4月1号的张国荣《热·情》演唱会修复视频吸引了3000多万人观看,当时我的朋友圈几乎都在刷屏。你们当初做这个项目的契机是什么?演唱会好评如潮,这个项目大功告成后你们有没有什么心得体会?

夏珍:当时也是一次偶然的机会接触到宝丽金,他们正在找修复张国荣演唱会的技术,于是一拍即合,开始了整个项目。整个项目取得甚至超出了预期的效果,没想到哥哥去世这么多年,依然有非常非常多的粉丝在纪念他,让我们团队认为老片修复在C端原来也非常有价值

1a2bc8db410b9876a9a0b018cd70b901.png

微信视频号《热·情》演唱会

3

吴洪声:在《热·情》演唱会视频修复过程中,对你们来说最大的挑战是什么?你们这次视频修复的主要“杀手锏”是什么?

夏珍:在整个修复过程中,最大的挑战有两个,一个是能修复的时间非常短。春节前后因为疫情的原因,香港和深圳相继有严重疫情,母带也不能从香港寄到深圳,耽误了很多时间,我们拿到母带时已经是3月10日左右,离上线只有20天不到,压力还是很大的。

另一个是第一次修复演唱会的场景,和之前的影视剧修复还是有非常多的区别。我们这次修复的“杀手锏”主要是有人脸修复和GAN(生成对抗网络)超分,人脸修复其实在视频领域依旧是一个比较难的问题,相比图像的人脸修复,视频里有多人脸、前后景、运动、遮挡、角度、噪声等非常多影响效果的问题。GAN超分则需要在修复视频画质的同时又能把握生成更多细节,还需要把握细节生成的真实性。

232973e190bfb3649775922e167f6a9b.png

超清修复后的版本,张国荣的脸部细节清晰可见

6221d5e7b2445cdd976249bdec02d077.gif

张国荣《热·情》演唱会修复前后对比(受截图软件影响,画面有损失)

4

吴洪声:听说你们在修复哥哥演唱会视频中进行了多次算法升级和优化,为的就是给观众带来更好的体验。你作为这个项目的操盘手,能介绍一下你们做了哪些工作吗?

夏珍:首先我们的修复流程其实是自动化的,主要包括智能分析、画质修复、画质增强和智能编码四个主要模块。

智能分析:首先对视频进行不同维度的分析,包括帧级别的运动复杂度、画面复杂度、噪声强度的分析,场景级别的亮度、饱和度等的分析,整体视频的细节、失真程度分析等。

画质修复、画质增强:得到分析结果后,指导进行画质修复和画质增强,画质修复包括去划痕、降噪、去压缩失真等去除破坏画质的一些因素。画质增强则是对画面进行分辨率提升、色彩增强、倍帧等处理。

智能编码:最后一步是利用编码技术对视频进行智能压缩,在保证画质的前提下尽量压缩视频大小

843f78089d2477a0712e2ca6c148c56e.png

夏珍在修复张国荣《热·情》演唱会视频

哥哥演唱会其实不仅仅是一场演唱会,而且是一场艺术盛宴,每个环节都体现了哥哥想表达的艺术性,比如朦胧感、天使的白色和热情的红色等,如果基于算法在某些场景下视觉效果可能会更好,但对艺术性可能会有一些丢失,所以我们也会尝试不同算法去尽量保持艺术性。另外就是前面也有提到的人脸修复我们也是经过很多个版本优化。

5

吴洪声:在视频修复技术里,去划痕/雪花能力是非常重要的。老视频里经常有划痕和雪花点,极其影响观看体验。现在市面上其实已经有很多自动修复软件如Phoenix、Pfclean、MIT DRS Nova等,多媒体实验室的去划痕技术属于业界领先,那么你们的技术亮点和优势在哪里?

夏珍:其实老片修复在国外已经有非常多年的历史,博洛尼亚修复实验室从上世纪90年代就已经开始修复胶片电影,但在中国也是最近几年才开始关注到老片修复的领域,而对于胶片而言,其实很严重的一个问题是胶片会因为各种问题导致胶片上留下划痕、霉斑、雪花点等等问题,所以去划痕是一个非常重要的工作。

相比于市面上的软件其实去划痕还是很大程度依赖于人工处理,多媒体实验室研发的去划痕算法是基于深度学习的自动去划痕,利用算法对划痕进行识别和去除,一个是我们团队基于视频场景去做的模型,另一个我们自己建立了一个划痕的数据集

bc122fe59245db00b9a93f54e826242f.gif

张国荣《热·情》演唱会视频前后修复对比(受截图软件影响,画面有损失)

6

吴洪声:在《热·情》演唱会视频之前,多媒体实验室就已经在视频修复领域积累了比较丰富的经验,之前曾深度参与了包括《康熙王朝》、《天下人家》等多部经典影视剧高清修复工作。虽然都是修复视频,其实两者区别并不小。你们认为演唱会和影视类的视频修复的主要区别在哪里?

夏珍:其实《热·情》演唱会也是我们第一次修复演唱会,相比影视剧还是有非常大的不同,比如演唱会灯光、画面、运动切换、不同场景噪声程度、损失、模糊等也有非常大的区别,而在之前修复的影视剧大部分时候整个视频都是统一的风格、运动、灯光都会比较统一。

比如在演唱会场景下人脸修复会遇到很多问题,因为《热·情》演唱会是一场非常有艺术性的演唱会,从某个角度来看已经高于演唱会的形式,所以在整个过程中为了表现张国荣先生的艺术理念,会有各种颜色的灯光,在灯光打在脸上时会出现蓝色的脸、红色的脸等通常没见过的问题都需要单独去处理。

b9fa07dcba56aebd44b3bbc8e30d314c.png

7

吴洪声:你也反复提到,视频修复并不是单纯修复瑕疵,还要讲求修出艺术效果,那么在色彩方面可能还得需要艺术专业人员进行把控。我很好奇,AI能够取代专业电影修复师吗?技术和艺术之间如何“鱼与熊掌都能兼得”?

夏珍:正如前面也提到的,《热·情》演唱会不仅仅是一场演唱会,而是凝聚了哥哥对人生对艺术的理念表达,在不同章节色彩的表达不一样,确实需要艺术专业人员的把控,AI技术做的不是取代专业电影修复师,AI技术能解决两个问题:

一是AI技术能解决不同专业人员对艺术的偏差,比如不同专业人员对色彩的感知是会有差异的,甚至同一位专业人员不同的心情也会影响对色彩的认知,但AI是能做到非常好的统一,任何时候处理的效果都是统一的;

另一个是AI能大幅提升修复的效率,以前需要一帧一帧进行修复的视频,现在通过算法能自动化解决大部分的问题。在通过AI修复后,再结合电影修复师的专业精修,希望能做到“鱼与熊掌兼得”。

6861b34e1ba9dd9c03fa51f953f79658.gif

《热·情》演唱会超清修复片段(受截图软件影响,画面有损失)

8

吴洪声:这个4K演唱会的背后,可能很多人都忽视了一个幕后功臣,就是视频编解码技术。我们都知道越高清的视频占据的存储空间越大,很容易引起播放卡顿。多媒体实验室在视频编解码方面的研究也很深,你能介绍一下你们的这项技术吗?

夏珍:它所解决的问题可以用一句话总结:在不改变视频主观质量的前提下,压缩视频的大小,以更顺畅、高质地在各个平台播放

谈及至此,不得不提实验室的一项“王牌技术”:新一代国际编解码标准。该标准于2020年7月正式发布,在业内广受关注,成为视频产业跨时代的里程碑,相比上一代标准,其压缩性能显著提高,可在视频主观质量不变的条件下减少50%的数据大小,大大减少视频传输带来的流量、带宽成本,推动整个视频产业进化。

腾讯多媒体实验室正是这项标准制定的主要贡献者之一,提交的技术提案被国际和国内标准采纳,数量全球领先。同时,实验室专家们还在标准组织中担任包括新一代国际编解码标准联合主编、参考软件联席主席等重要席位。腾讯是中国最早参与并致力于开发视频信息压缩和解码标准的公司之一,现已在视频编解码技术上处于全球领先的地位。

9

吴洪声:在视频领域这么多年的从业经验里,若从现在回望过去,你认为视频处理技术实现了哪些重要突破?用户/观众对视频的需求又有哪些重要变化?

夏珍:我个人观点感觉最重要的是视频处理技术已经从以前基于传统信号处理的方式逐步扩展到基于深度学习来完成算法开发,而且还在快速的迭代中。一个是深度学习和算力的支持,另外也有更多的人才进入到视频技术领域。

用户/观众对视频的需求也在近十年发生了很大的变化,对分辨率、清晰度都要求非常高了。十年前下载一部200M的电影,画质是640x480可能会觉得效果还不错,但现在如果视频没有1080p甚至4K,你可能都不太想去看。

0376194938bd7d4465d2d73c651b6881.png

腾讯多媒体实验室视频处理技术负责人 夏珍

10

吴洪声:现在你们的视频修复主要还是处理2D视频,随着3D技术的发展,甚至是pony说的“全真互联网”、现在大火的“元宇宙”的到来,未来视频修复技术会往什么方向发展?会诞生哪些新的应用场景?

夏珍:目前的视频修复技术是基于2D视频来处理的,未来希望可以结合3D,在全真互联网或元宇宙里结合视频技术做出更多有创意和价值的探索。比如设想下以后是否可以在一个虚拟场景下感受演唱会现场的震撼感,相信这样的体验会更沉浸式更真实。

全球有非常多的诸如演唱会、电视剧、电影、纪录片等经典影像,腾讯多媒体实验室目前已经形成了较为完整的智能老片修复技术矩阵,未来希望通过超清沉浸感修复引擎,帮助更多的时代经典高质、高效地重现于观众面前。

未来,腾讯多媒体实验室将在多媒体技术领域中持续深耕,推动多媒体技术在多个产业领域中落地应用的同时,践行腾讯可持续社会价值创新,借助数字化技术助力传统文化和经典作品传承,也是腾讯技术价值外溢、科技向善的又一体

* 图片来源:腾讯多媒体实验室、视频号、哔哩哔哩@腾讯云与智慧产业

 END  

栏目统筹 | 赵九州

责任编辑 | 黄绮婷  庄雅捷 张洁

85456c8854dcea5af8be213acf3c9382.png

你有看张国荣的《热·情》演唱会吗?你认为视频修复的价值在哪里?欢迎在评论区分享你的看法~点亮“在看”+评论区留言,阿D将在4月27日(周三)下午15:00随机抽取1位粉丝,送出DNSPod定制口罩~

2459f5ccf7d8f108eb63ea476cf20b1d.png

9397dbd2dc9c2ab3585a4523cc8318df.png

c0bdb9605a374d51ac7aaab13fb75d85.png

b2f156e09362376698740fd763db2712.png

c99290fd9f232e46f51be0f4ae812289.png

44ce13b785aee245fe888408cb46fdaa.png

7960b40905afe4d7e8fae05934542585.png

ceff4e0ea213844a815dde2e0704ba9d.png

ac04359b649739073328a400028db66f.png

《DNSPod十问》是由腾讯云企业中心推出的一档深度谈话栏目,通过每期向嘉宾提出十个问题,带着广大读者站在产业互联网、科技领域精英的肩膀上,俯瞰各大行业发展趋势和前沿技术革新。

栏目嘉宾的领域在逐渐扩大,从最初的域名圈、站长圈到程序员圈、创业者圈、投资圈。腾讯副总裁丁珂、CSDN董事长蒋涛、Discuz!创始人戴志康、知识星球吴鲁加、腾讯安全学院副院长杨卿等技术大咖和行业领军人物都在这个栏目留下了他们的真知灼见。

《DNSPod十问》在腾讯云生态圈也极具影响力和活跃度。我们在腾讯内部平台——DNSPod公众号、腾讯中小企业服务公众号、腾讯云公众号、腾讯云主机公众号、腾讯云服务器公众号、腾讯云助手、腾讯乐问、腾讯码客圈、腾讯KM平台、腾讯云+社区、腾讯云+大学等平台累计关注度高达数十万,同时我们积极开拓与外部媒体的合作,如腾讯科技、腾讯新闻、新浪微博机构号、CSDN社区技术专栏、知乎机构号、企鹅号、搜狐号、头条号、开源中国技术社区、IT之家、InfoQ社区资讯站点、Twitter机构号、Facebook机构号等媒体阅读总量逾百万。

未来,我们希望这个栏目的影响力会覆盖更加多元的受众,把更多正确的理念对外传递出去。欢迎各位读者在评论区留下你想看到的嘉宾和想问的问题,我们邀请你共同成为《DNSPod十问》栏目的提问者与发声者。


合作联系:

qitinghuang@tencent.com

▼点击直达DNSPod官方社区

00026045c11511b1cb928e8af5815234.png

▼扫码加入DNSPod官方用户群

4df7f7eb9ba17cd9d6ca0c7e6a65e8b5.png


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 从高级程序员到CTO的4次能力跃迁!如何选择适合的技术负责人?
    本文讲解了从高级程序员到CTO的4次能力跃迁,以及如何选择适合的技术负责人。在初创期、发展期、成熟期的每个阶段,创业公司需要不同级别的技术负责人来实现复杂功能、解决技术难题、提高交付效率和质量。高级程序员的职责是实现复杂功能、编写核心代码、处理线上bug、解决技术难题。而技术经理则需要提高交付效率和质量。 ... [详细]
  • 程序员如何选择机械键盘轴体?红轴和茶轴对比
    本文介绍了程序员如何选择机械键盘轴体,特别是红轴和茶轴的对比。同时还介绍了U盘安装Linux镜像的步骤,以及在Linux系统中安装软件的命令行操作。此外,还介绍了nodejs和npm的安装方法,以及在VSCode中安装和配置常用插件的方法。最后,还介绍了如何在GitHub上配置SSH密钥和git的基本配置。 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • Go语言实现堆排序的详细教程
    本文主要介绍了Go语言实现堆排序的详细教程,包括大根堆的定义和完全二叉树的概念。通过图解和算法描述,详细介绍了堆排序的实现过程。堆排序是一种效率很高的排序算法,时间复杂度为O(nlgn)。阅读本文大约需要15分钟。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • 本文介绍了如何使用MATLAB调用摄像头进行人脸检测和识别。首先需要安装扩展工具,并下载安装OS Generic Video Interface。然后使用MATLAB的机器视觉工具箱中的VJ算法进行人脸检测,可以直接调用CascadeObjectDetector函数进行检测。同时还介绍了如何调用摄像头进行人脸识别,并对每一帧图像进行识别。最后,给出了一些相关的参考资料和实例。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 知识图谱表示概念:知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说,知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Obj ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
author-avatar
LKD2008_561
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有