随着我国三网融合业务的迅速发展以及电信市场竞争的日益加剧,以 OTT(Over The Top)视频技术为主导的互联网电视、多屏互动和移动视频业务增长非常迅速。而在传统的电视领域,4K机顶盒和4K智能电视已经大规模进入普通家庭的客厅。用户对超高清电视节目内容产生了强烈的需求,同时也对超高清电视的视频质量产生了极高的要求。用户对视频体验提出了更高要求,希望看4K超高清极致画面的时候没有马赛克、没有任何卡顿。
由于4K视频的高码率特点,所以在传输4K超高清视频的时候,需要更大的带宽、更小的延迟,为此业界迫切需要探索出一套在融合网络下的超高清传输质量监测和保障体系的方法论。 广州珠江数码集团作为广东地区较大规模的有线电视运营商,有线电视总用户数超过200万户,宽带用户数超过40万户。 4K超高清视频业务作为珠江数码三网融合业务的主要增长点,势必同IPTV三大电信运营商的IPTV电视业务竞争。
虽然人们已经习惯了传统有线电视低廉的收费标准、不中断的业务可用性和快速的频道切换时间,但是三大运营商靠高效服务、捆绑网络、提高收视互动能力等方法,不断的加大市场占有率,传统有线电视用户数呈下降趋势。所以如何保证4K超高清视频用户体验,成为有线电视留住用户,同时也是4K超高清视频业务成功的关键要素。这些用户体验其中主要包括清晰流畅的视频体验、快速的频道切换和VOD点播操作等。网络的变化势必也会带来业务的管理、网络维护的新的困难和挑战,例如:如何使传统数字电视业务和4K超高清视频业务顺畅地融合在同一个网络并保证各自的业务质量?如何客观地评价和测量视频业务终端用户的QoE(视频体验质量)?如何快速诊断4K超高清业务质量问题的根本原因和故障点?IP网络设施是否能够满足不断增长的4K超高清用户和流量增长的需要?
1.1 4K超高清视频用户体验质量评价体系的算法研究
根据4K超高清视频特点和HEVC(H.265)编解码算法的特点,结合视频主观评估技术方法和客观评价的技术方法,构建一套有效的数据模型。
视频主观质量评估就是让一群观察者对同一段视频片段按视觉效果的好坏进行打分,观察者对不同的视频序列的视频质量进行打分,观察者也可用不同的方法对视频质量进行打分,然后求得视频质量平均分,最后对所有数据进行归纳分析。视频主观质量评估实现起来比较复杂,不但需要考虑多种影响因素,还需要非常严格的测试环境。客观视频质量评估使用算法自动实现评估,较主观评估而言,简单容易实现,而且不受外部条件和人为因素的影响,是当前最主要的视频质量评估方法。客观视频质量评估,根据在评估算法中是否引入原始视频作为参数分为三类,即完全引入原始视频作为参照(Full reference),部分引入原始视频(Reduced reference)和完全不引入原始视频三种评估方法(No reference) [1]。
根据超4K超高清视频编码和HEVC算法的特性,并完全考虑对视频质量产生影响的所有因素,把视频质量评估体系分为三层结构,这个三层结构如下:
1. 网络监控层:对当前视频传输的网络进行实时监测,统计检测网络性能指标。
2. 视频编码压缩损伤分析层:以该视频编码算法的动态图像质量为衡量的标准,提取视频的码流信息和编解码信息,得到通过视频编码和视频压缩后的视频质量下降程度。
3. 终端视频质量分析层:根据网络状况指标,采用全参照或者部分参考的视频质量评估算法,进而得到较为准确的视频质量评分[2]。
1.2 4K超高清视频CDN服务器性能指标体系研究
4K视频质量不但会受到CDN服务器的性能的影响,也会受到CDN服务器部署位置的影响,而这些影响是至关重要的。包括:(1)CDN服务器应尽量部署在靠近其所服务的机顶盒的网络位置,以减少视频流量对IP骨干网的压力,确保网络带宽能满足超高清视频流码流要求;(2)CDN服务器的负载压力应处于适合的水平,保持良好的性能状态,从而能快速响应机顶盒的HTTP请求,并提供较高的视频流下载吞吐率。
由上可见,为了保障超高清视频质量,就必须能有效地监测各CDN服务器的性能状况和服务质量,当CDN服务器出现性能问题时需要及时告警,并应根据CDN服务器的性能和负载情况,合理地进行CDN服务器的负载均衡调度、网络部署位置优化。CDN服务器的主要QoS指标包括[3]:
1. HTTP请求数:为下载视频文件,智能终端所发起HTTP GET请求消息数量。
2. HTTP成功响应数:服务器对客户端HTTP请求的成功响应数量。
3. HTTP请求成功率:依据计算公式为S1 / S2,其中S1为所有智能终端向这个CDN服务器向发送HTTP请求,CDN服务器成功响应的数量总和;S2为所有智能终端向这个CDN服务器发送的HTTP请求的数量总和。
4. HTTP返回码:为下载视频文件所发起的HTTP GET请求消息所对应的HTTP响应消息的返回码
5. HTTP错误返回码个数:为下载视频文件所发起的HTTP GET请求消息所对应的HTTP响应消息的终端错误返回码的数量,包含“4XX“终端错误返回码” 以及“5XX服务器错误返回码。
6. HTTP响应时延:CDN服务器对客户端HTTP请求的响应时延(以毫秒为单位),即从客户端发起视频分片的HTTP GET请求消息到收到该分片第一个数据包的时间差。
因此,4K超高清智能用户QoE感知系统可以通过分析高清用户STB终端和服务器CDN的交互数据,通过对应QoS指标中关键指标的趋势变化情况做到对CDN服务器的负载均衡调度、网络部署位置优化。
1.3 4K超高清视频测量技术研究
影响4K超高清视频用户QoE的因素有很多,包括:
1. 技术因素:视频和音频(媒体)质量,如:清晰度、播放流畅度等;用户互动质量,如:视频点播时延,用户操作(如暂停、搜索)的响应速度[4]。
2. 其它因素:价格收费、节目内容的丰富性、操作界面易用性等。
本文主要从技术角度来分析如何测量4K超高清智能用户视频体验质量,重点阐述4K超高清视频质量测试的方法。以下是4K视频分片在网络传输中的五种典型场景。
场景1(最优情况):准时进行视频分片传输;传输分片的整段时间快于分片可以播放的时间。此时节目播放流畅,4K超高清智能终端和视频服务器前端之间传输分片调度正常,网络传输速度快,4K超高清智能用户观看体验较好。
场景2(良好情况):传输分片的整段时间快于分片可以播放的时间;传输分片的时间间隔短于播放该分片的时间。此时节目播放流畅,4K超高清智能终端和视频服务器前端之间传输分片调度正常,单不算最优情况,会有资源浪费现象,网络传输速度快,4k超高清智能用户观看体验较好。
场景3(临界情况):准时进行视频分片传输;传输分片的整段时间接近于分片可以播放的时间。此时节目播放流畅,4K超高清智能终端和视频服务器前端之间传输分片调度正常,网速偏慢。当用户网络出现波动,4K超高清智能用户观看体验就会下降。
场景4(缓冲区下溢):传输分片的整段时间快于分片可以播放的时间;然而相邻分片间传输时间间隔过大,未能及时传输。4K超高清智能终端和视频服务器前端之间传输分片调度异常,网络传输速度正常,4K超高清智能用户观看体验较差。
场景5(缓冲区大幅度下溢):传输分片的整段时间慢于分片可以播放的时间;并且分片传输间隔大于其播放时间。4K超高清智能终端和视频服务器前端之间传输分片调度异常,网络传输速度较慢。4K超高清智能用户观看出现严重卡顿。
综上所述,在4K节目源正常前提下,视频文件分片是否能及时下载(即视频文件下载时间)是4K超高清视频播放流畅主要因素。而视频文件分片是否能及时下载取决于IP网络性能和视频服务器与4K只能用户终端的交互情况。
1.4. 4K超高清视频用户故障隔离方法研究
1.4.1 故障排查第一步:网络性能与服务器性能隔离
为了进一步诊断导致4K超高清视频卡顿的原因,需要对4K超高清视频下载过程进行分段测试,通过多QoS指标关联分析可隔离IP网络和Web服务器性能问题。
4K超高清视频卡顿故障诊断的基本方法如下:
1. 诊断IP网络性能方面存在问题的依据:(网络丢包严重和网络时延大)其中网络丢包严重会造成TCP的重传率过高,网络时延过大会造成TCP建立连接时间比较慢。
2. 诊断视频服务器性能性能问题的依据:当网络时延较小,TCP建立连接速度比较快;但是HTTP响应速度比较慢,且HTTP响应成功率较低。
1.4.2 故障排查第二步:服务器性能分析
CDN服务器的性能和CDN服务器部署位置都会对4K视频的质量造成影响,而这些影响又是提升4K超高清智能用户体验的关键。因此有效地监测各CDN服务器的性能状况和服务质量,在CDN服务器出现性能问题时给与及时告警,并且通过CDN服务器的性能和负载情况,及时并合理地进行CDN服务器的负载均衡调度、网络部署位置优化就比较重要[5]。CDN服务器的主要QoS(用户服务指标)指标包括: HTTP请求成功率、HTTP响应时延、HTTP错误返回码个数、HTTP请求数、HTTP成功响应数。
1.4.3 故障排查第三步:中间网络故障定位
中间网络性能定位分析的基本思路是:我们选取多个数据检测点,这些检测点在用户终端和前端视频源之间选取,通过这些检测点,得到监测点的视频流数据[6]。通过对这些视频流数据的对比分析,可以对故障点的位置进行精准定位。当然,在实际工作中,如果没有部署视频监测探针,这种方法投入十分巨大,而且同时获取多个监测点数据的工作量非常繁杂。基本上我们能获取到的视频数据都来源于用户终端,所以,我们可以通过对以下视频数据的对比和分析,减小网络故障的排查范围:
1. 对视频下载速率进行监测:超高清视频媒体流的有效下载吞吐率应大于视频原始码率。可通过带宽测速来判断接入带宽是否达标,从而定位带宽瓶颈。
2. 对TCP重传率进行分析监测:我们知道TCP协议具有差错恢复机制,判断其上游节点是否存在网络丢包或者该测试节点是否存在网络丢包,都可以通过TCP协议具有差错恢复机制进行判断。如果在网络的中间节点检测到TCP重传包,同时TCP重传机制已经将这些丢包恢复就,因此可以得出此结论,TCP重传包是指为补偿网络丢包所重传的TCP包。
3. 对TCP重复应答报文进行监测:监测TCP重复应答报文可有效判断上行网络链路拥塞问题。因为当网络的上行链路出现问题时,终端的TCP应答报文将无法上传给服务器。由于服务器未收到应答报文,就无法根据终端反馈重传正确的报文,导致传输受阻,终端也只能重复发送相同的TCP应答来通知视频服务器。
总结:故障排查的三步实现对4K超高清视频用户故障的详细定位,按照区域维度对网络故障、CDN故障、终端故障事件归类计算,从而发现隐性的问题。可以从非直观的视野观察4K超高清用户故障趋势的变化情况,从而做出下一步定位解决。
通过故障趋势的变化情况及时发现较为隐蔽且严重的故障点,进而对每一个故障进行查看,确定该故障对4K超高清智能用户的影响情况。并且整个故障告警形式通过自学习的方法来进行准确的预警,以此来实现高清智能系统对每一个高清用户的收视的全面准确管控。
2.1 监测探针软件模块
如图7所示,Java网络服务模块负责从数据库读取探针初始的启动信息,同时在中心管理平台不同的模块需要获取网络各个层面参数时提供数据库查询结果。
C++引擎模块是监测探针的核心模块,用来从网卡实时抓取数据包、解析并生成KPI参数后,再写入数据库。该软件模块以操作系统的服务进程方式运行,后台程序没有任何的界面操作,避免了因为一些异常的用户行为造成的异常中止。该模块的多线程设计,其主要运行过程如下:
1. 网卡抓包线程冲网卡抓取网络包,通过IP地址进行哈希运算来分配网络包到不同的内存缓冲区。
2. 每个缓冲区都拥有一个解析线程,用来解析该缓冲区内的内容,并生成原始采样参数。在到达采样周期时,每个线程都对原始参数进行运输生成最终KPI,然后将最终结果投递给数据库线程[7]。针对最终KPI线程会根据用户配置的门限值进行校验,如果符合触发条件将产生告警,告警结果也会一并提交给数据库线程。在多次采样后,根据多次告警的状态生成专家提示。
3. 支持TCP/IP、HTTP、MPEG-TS、H264/H.265等协议解析。
4. 该模块和网络通信协议密切相关,采用C++编写又引入内存使用时的各种问题,如内存泄流,访问越界和非法指针读取等等。因此软件的模块化和程序的易读性包括注解都有很高的要求。程序调试借助微软的VC++、GFlags、WinDebug等等工具。
2.2 监测探针中心管理平台
探针中心管理平台负责管理监测探针,汇总探针信息并展示给最终用户的管理软件模块。探针管理器集成了Apache WEB服务器,对用户提供统一的WEB界面操作。探针信息存放在MySQL数据库,用户可以通过Flex的WEB界面进行添加、修改和删除操作。探针管理器的引擎进程通过Adobe公司的Blazeds通信模块和探针的WEB服务进行交互获取探针的状态和检测参数。
Flex AS3设计的WEB界面通过对象接口模块Blazeds实现对象的异步交互,从Java网络服务模块获取信息。Java网络服务模块通过JDBC来读取数据库信息,通过RMI进程通信接口来和引擎进行交互,再通过Blazeds来获取机顶盒软探针的信息。引擎设计成操作系统的服务进程,随着计算机的启动而自动启动,使得探针管理器在重启后能够立刻开始获取探针的最新状态,同时将状态存入数据库。
通过整个管理平台的设计从而实现闭环的故障排查方式和流程;让4K超高清用户可以接收到极致的视听体验。通过先整体后单一的方式实现不同用户QoE体验的感知精准定位和高效性故障排查解决方式。
随着4K超高清视频内容的增加,越来越多的用户喜欢4K超高清视频内容,使得网络流量增加迅速。为了增加用户粘性,引入各种新型业务内容,也使得网络的传输情况和流量组成更为复杂,4K超高清智能终端和高清智能终端不同操作系统的引入都会造成新的兼容性问题。而这些因素,使得4K超高清智能用户体验提升变得更加迫切并且也更具挑战性。
作为一名长期从事广电视频业务的技术人员,在工作过程中深切体会到:引发视频故障的原因非常多,并且非常复杂,故障定位非常困难,同时解决故障耗时太长。而提高解决视频故障效率和降低解决视频故障成本,则需要工程师探索出一套有效的视频故障诊断方法体系,特别是4K视频逐渐增多以后。所以,利用工具来进行视频故障定位和故障排查就变得越来越迫切。通过智能电视终端的视频质量监测系统,可以非常好地帮助我们进行视频故障排查,工具软件可以通过QoS指标分析和QoE技术指标进行关联对比分析,可以最大限度地定位视频故障的位置。通过对4K视频业务运行设备和业务承载网络进行QoS指标监测、故障诊断和用户体验质量(QoE)性能验证,可以快速、高效、精准地实现对4K超高清视频平台进行主动运维,对网络建设、网络管理和维护工作提供重要的科学依据。所以,对4K超高清智能用户感知系统等工具软件进行研究和探索,对于是推进4K超高清视频业务的健康发展有非常重要的意义。
推荐阅读
经典栏目
精彩专题
关注我们
大视频行业颇具影响力的行业社群平台,重要新闻、热点观察、深度评论分析,推动电视行业与各行各业的连接。
集合电视台、网络视听、潮科技等各种好玩信息。
专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。
UHD、4K、8K的最新资讯和最深入的分析,都在这里。
视频产业的专业圈子,人脉、活动、社区,就等你来。
我们只沉淀有深度的信息和数据。
致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。