2019年10月17日-18日,由亿欧公司、EqualOcean主办,粤港澳大湾区研究院、四方网盈、深圳市智慧城市建设协会联合主办的BATi 2019大湾区国际科创峰会于深圳宝安区前海华侨城JW万豪酒店正式举行。本届大会以“科技赋能、青年引领”为主题,围绕5G、硬件创新、工业数字化、AI企服、科技出海等热点进行探讨。“预见·5G娱乐生态论坛”作为本次大会的分论坛,围绕5G产业及5G赋能下的新文娱行业进行了深度探讨,为现场观众带来了真知灼见。
其中,ZEGO即构科技研发副总裁陈今今出席本次论坛,并发表了《从5G看面向未来的音视频网络》的主题演讲。
即构科技研发副总裁 陈今今
在演讲中,陈今今表示,作为一家专业的音视频云服务提供商,即构科技目前已为全球200多个国家和地区提供服务,5G的到来使万物互联成为可能,音视频服务的需求将进一步激增,即构科技将以更灵活的云端架构,为全球客户提供更好的音视频云服务。
以下是陈今今的演讲原文,亿欧AI科技频道在不改变嘉宾原意的基础上,进行了编辑。
大家好!感谢大家今天过来。我今天分享的主题是《从5G看面向未来的音视频网络》。
我先介绍一下即构科技,我们是音视频云服务的提供商,在物理网络上面搭建了一个虚拟网络,为各个企业提供最优质的音视频云服务。现在所有企业都需要音视频服务,因为它是最直接也是最高效的沟通方式。
回顾移动通信发展的历程,我们可以看到,基本上每十年就有一个大升级,技术发展到一定阶段就会进入下一代的技术。2020年我们将迎来第五个周期,从移动互联网进入万物互联的新阶段。
我之前长期在海外负责跨国业务,面向未来的网络架构转型、部署以及落地的工作。其实早在五六年前,他们就非常大规模地投入人力、物力和财力进行5G的研究。那个时候走了很多的弯路,也踩了很多的坑,到现在,基本上已经完成了核心网的云化以及承载网的改造。随着5G标准的落地,接入侧的网络将会开始大规模部署,所以真正5G的时代已经来临了。
5G拥有三大场景。一是高带宽。主要场景包括4K/8K、增强的移动媒体、无线宽带,也包括云游戏、AR/VR能力;二是低时延。包括自动驾驶、工业自动化、远程的手术、会诊等;三是海量连接,我们将通过万物互联的方式进行联系。
大家可以看到,在这些所有的场景里面,基本上都离不开音视频的应用,这也为我们提供了机会。目前,我们在全球为100多个国家提供音视频云服务,基本上每天的通话实现5亿分钟以上,面向的终端也是几亿终端的平台。
对我们来讲,音视频应用有什么样的技术难点呢?
第一个方面,端。终端要实现广覆盖和兼容性。
音视频面向的受众是非常广的,所有的用户都需要接入。终端的种类也是多种多样的,包括手机、iPad、摄像头、麦克风等,所以,要做好所有的行业上的终端的应用是非常困难的一件事情。我们的团队是从腾讯QQ系的技术团队出来的,QQ面向的终端数量是非常庞大的,所以我们能够做好终端的处理。
此外,音视频端具有很高的技术门槛,尤其是模拟信号的处理上,包括回声消除、噪声抑制、自动增益等。在音视频领域上需要很深的算法积累。
第二个方面,网络。我们遍布全球的云化平台,需要利用分布式网络架构的处理,怎么去调度?在恶劣的网络环境下提供最好的体验,要基于各行各业的诉求。比如说,教育行业可能对声音质量的要求特别高,直播可能对图像要求特别高,我们怎么在各行各业的诉求下打造一张匹配需求的音视频网络,这在技术上是一个难点,也是我们的优势。
我们现在说的5G网络,能够给音视频带来好处的也是在网络的部分。5G出来以后,很多技术上的困难就能迎刃而解了。带宽包括时延可以解决很多技术上现在解决不了的问题。
第三个方面,云。目前像花椒、映客、喜马拉雅等头部大客户,基本上70%的互联网客户都是在用即构音视频的平台提供服务。
即构科技在音视频领域深耕了18年,我们在全球构建一个端到端音视频的虚拟网络,并努力把这张网打造成为由能力针对行业特性的高品质,低成本音视频基础架构。要构建这样一张网,首先是要能获取最优质的计算/存储/网络资源,我们的口号是AnyWhere,AnyTime,AnyResource,能给客户带去最佳体验。
要达成这样的目标,关键是真云化的架构,可以部署在任何公有云,私有云的平台上,任意迁移,因此技术上匹配未来网络的架构是可持续发展的关键。目前即构的技术架构是完全5G Ready的,和未来网络转控分离的架构是完全契合的。然后,保持网络中立是非常重要的,只有保持开放才能利用到行业内无所不在的资源。
其次,在5G架构下,越来越多的分布基站/节点,对运营和运维也有很大挑战,这点即构也有非常丰富的经验,后台有大数据平台进行整体调度/调优的支撑。
接下来我们看一下音视频对5G有哪些诉求。
第一个是对大带宽的诉求。云游戏、AR/VR、4K/8K、全景直播的传输都需要非常大的带宽,这在4G下无法实现,只有5G能够满足。
第二个是低时延的诉求。包括远程手术、远程会诊、自动驾驶等,都需要更低的网络延迟。
我从一个很具体的小问题跟大家分享一下。比如现在的多人合唱的场景,目前可以看到线上很少有合唱的,因为合唱对网络时延的要求特别高,一旦合唱时候大家的网络质量不一样,听众听起来就会觉得很奇怪。
现在要解决合唱的问题,要把好几个歌手的音视频数据合在一起再给观众听。但这种做法是在技术上去解决物理上的限制,体验其实是不好的。观众听到的声音延迟是非常高的,歌手A和歌手B之间也没有办法互动。
但5G到来以后,时延如果控制在百毫秒以内,是可以做到多人同时互动的。这可能是个很小的点,但最终所有行业的发展,都是由一些很小的点汇聚而成的,用创新改善大家的体验。
与音视频相关的5G网络架构的优化,我认为主要有以下几点:
一是C/U分离,C/U分离是控制面和用户面的分离,这样就可以把用户面更灵活地部署到任意一个角落。比如说我们现在去海外旅游,网络漫游的流量是要先绕回到国内再出去,时间是非常长的。未来如果实现C/U分离,就可以很方便地把核心网的网源布到你最近的地方。
二是网络切片。我们认为,网络切片可以给不同的应用提供不同的QOS体验,给音视频分一个高优先级的切片,可以保证它不跟其他互联网流量混在一起,就能够带来更好的体验。
三是边缘计算。数字化和智能化的算力需求迅速增加,成本随之快速上升,边缘计算兼顾时延和成本,更靠近客户就能提供更好的性能和功能。
四是更密集的微基站部署。以前是宏基站,离手机比较远,功耗也很大。现在的微基站非常小,只有一个盒子大,功耗也很小,基本速率可以达到800-900兆带宽,传高清的4K视频也非常流畅。再往下还有皮基站等更小、更便携的基站,你可以带在身边提供非常高的带宽速率。
接下来我们看未来云的架构。5G场景下,云端首先是分层的架构,有些业务对时延要求较高,必须分布在云端,我们把它称为基于业务体验的网络架构部署。所以你要区分你的业务,业务如果对时延不敏感的话,把它集中放在一个核心数据中心里就可以,如果你对时延比较敏感,可能需要边缘计算。
如何构建一个“ready for 5G”的全球音视频实时云?什么样的音视频云服务架构能满足未来的5G发展和兼容呢?我们认为有几点:
第一,转控分离的架构。我们可以把控制面、转化面和 5G架构匹配在一起,分离到各个不同的分离点,这样的架构一定要能够部署在任意的数据中心。以前在菲律宾等地也没有数据中心,但当地有服务提供商,我们就直接把业务部署在当地的服务提供商里,给海外的客户最快程度地接到整个服务里面来,这样一定要求是真云化的架构。
第二,多中心控制。意思是架构分散在不同的点,任意一个点故障了可以迅速切换到其它点上去,保证整体的可靠性。
第三,网络中立。能够随时随地获取到最优质的资源,这是我们的诉求。目前边缘云下沉是各大运营商和云服务商,大家都在抢占先机进行部署。每下沉需要的成本,只有大的云商或运营商才能够支撑,因此仅靠自建网络是无法享受5G时代边缘云的红利和优势的,只有AnyWhere,AnyTime获取AnyResouce,才能在未来抢占先机。
上图是目前我们公司所有客户所在的位置,其实已经非常多了,等5G来了以后,我们希望这个图更亮一点,能够发出更强的光,给大家提供更好音视频云服务。谢谢大家!
本文系投稿稿件,作者:陈今今;转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。