一种IPTV屏显报障的快速收集方法

期刊: 环球科学 2023年第8期 DOI: PDF下载

肖哲 孔晓琨

中国移动通信集团河北有限公司,河北 石家庄 050000

摘要

本方法突破从传统探针工作原理,从视频流质量分析转为抓取机顶盒侧电视屏幕呈现的真实报障提示,绕开传统的用户投诉、用户描述的故障收集方式,可以跳过客服、用户、装维的多层沟通成本。本办法不关注视频流质量,而是集中在通过系统的方式统一收集用户电视屏幕上显示的报错信息,聚焦业务流程导致的问题(例如,鉴权失败、连接失败、订购不成功等流程问题),实现真实客户信息的收集,及聚类分析告警信息,实现对IPTV故障的分钟级感知及逆向溯源,可以有效提升故障处置效率,提升IPTV业务的品牌形象。


关键词

屏显报障;电视业务;码流分析;指导;感知;溯源

正文


1 现有技术的技术方案

IPTV即交互式网络电视,是一种利用宽带有线电视网,集互联网、多媒体、通讯等多种技术于一体,向家庭用户提供包括数字电视在内的多种交互式服务的崭新技术。通过在机顶盒内置感知软探针,实现对用户视频播放流畅度、卡顿、花屏进行表征。传统探针是以流媒体质量判断为目标,判断范围局限在视频是否流畅,并无法实现对认证、鉴权类、支付类错误,无法对“无法播放”行为进行有效探查。

2 现有技术的缺点及本方案提案要解决的技术问题

IPTV属于长流程业务,涉及终端、用户侧网络、接入网络、传输网络、CDN分发系统、业务平台、播控平台、终端管理平台等多个环节,不仅故障定位困难,而且缺乏统一故障发现顶层设计,只能通过用户报障、投诉发现故障,但普通用户往往难于精准描述故障现象及有效测试;如何快速发现问题、准确收集故障信息是效率提升的关键。[1]

本方法绕开传统的用户投诉、用户描述的故障收集方式,跳过客服、用户、装维的多层沟通成本;不关注视频流质量,而是集中在通过系统的方式统一收集用户电视屏幕上显示的报错信息,聚焦业务流程导致的问题(例如,鉴权失败、订购不成功等流程问题),实现真实客户信息的收集,及聚类分析告警信息,实现对IPTV故障的分钟级感知及逆向溯源,有效提升故障处置效率,提升IPTV业务的品牌形象。

3 本技术方案的详细阐述

本方法直接采集用户终端能够呈现的报错逻辑,拆分成终端自判断、标准协议上报、传输协议载荷三种类型,对IPTV全系统、全流程关键逻辑部件拆分环节,实现对用户侧问题快速、准确采集,提升维护人员的主动运维能力。

类型一:终端自判断

终端自判断类集中在用户机顶盒已经获取网络连通性,但是由于网络类、系统类故障导致机顶盒与相应业务模块业务连通性失败,无法接收server侧提示,由于机顶盒判断当前业务状态异常,进而上报的告警提示。

采集方案:此类问题由机顶盒内置软件逻辑判断,由于机顶盒软件均采用android系统开发,可以直接将错误提示码等报错信息做系统内广播,机顶盒内置的告警收集客户端可以直接抓取。

类型二:标准协议上报

电视屏幕显示的保障提示,在标准协议过程中存在显著特征,IPTV终端多采用BS架构,机顶盒使用HTTP标准协议进行认证、鉴权、支付等的信息交互[2]。针对网络类失败、超时等问题,HTTP协议接口字段不匹配,HTTP模块逻辑问题,通常在HTTP reponse消息的返回码中表现为1xx,4xx、5xx。各系统通常采用ngnix、tomcat进行服务,采用集群方式部署,HTTP类问题需要结合host字段综合分析,可以对质差对端直接定位分析。

采集方案:此类问题由内置的告警收集客户端获取,直接过滤HTTP协议response的返回码,可以方便识别存在问题的对端server。

类型三:传输协议载荷

传输协议载荷识别属于码流分析重点,需要协同IPTV能力平台、订购支付平台、广电EPG模板、第三方SP EPG模板采集错误代码特征,通过抓包方式开展特征报文识别,以及特征错误码信息提取。

通常情况下,在机顶盒网口inbound、outbound进行特征提取。一是部分平台返回的错误码信息,会直接server返回的HTTP报文的URL中有所体现,这种可以通过inbound方向直接抓取;另一方面,有平台侧设计的错误码上报逻辑是,server返回的错误码的详细信息包含在HTTP body信息内部(本质上是一个跳转信息,http-body内form action看到ERROR_TYPE=2&ERROR_ID=02)。这种场景下,告警收集客户端不对HTTP报文body体内信息开展解析(因为很多情况下HTTP消息体内包含视频媒资信息,容量较大且分析效率低下)。

上一步机顶盒接收到告警的跳转信息后,机顶盒下一步会向跳转节点请求告警提示资源(图片等),告警收集客户端此时抓取机顶盒发去的HTTP post消息,从POST消息的URL中,能够识别到机顶盒将要出现的告警提示信息。

以下按照本方法逻辑,对典型的、完备的IPTV告警提示逻辑拆分,对能够实现的抓取手段进行细化。如下图1,告警识别探针通过预置告警信息的HTTP报文识别,能够准确抓取单个电视界面向用户呈现的告警码信息,直接跳过用户报障的告警发现环节。

图片3.png

1 屏显保障、播放质量信息抓取流程示意图

4 告警收集客户端的上报方案

告警收集客户端与业务感知可以合设,如果需要单独设立场景,应该尽可能减少数据上报量及上报频率,仅实现必要信息的最小集收集,降低对机顶盒的性能消耗。

步骤一:启动上报

在机顶盒开机启动时,告警收集客户端向服务端发送启动数据,采集机顶盒物理参数及接入配置,来实现对告警用户的识别,方便后台的聚类处理,信息字段见包括:终端Mac、终端无线mac、 机顶盒型号、网络接入方式、DNS地址。

步骤二:告警上报

在告警收集客户端侦测到异常事件并满足告警阈值时,向软探针平台发送相应的告警数据,仅在故障发生后,网络流量识别后上报一次,恢复时无需上报;采集具体的告警信息、server的网络地址、告警提示出现时间等信息,来实现对告警的识别,方便后台的聚类处理,信息字段包括:机顶盒网络地址、对端服务地址、请求URL、请求HTTP method、HTTP返回码、告警特征码、告警时间。

步骤三:告警收集客户端的信息聚类

通过机顶盒内置的告警识别信息采集,软探针平台实现5~10分钟级用户分布、告警类型的关联上报,即可实现对用户各种非播放类故障的快速采集,实现对系统问题的快速发现,极大程度摆脱用户上报、装维确认的时间成本,实现对IPTV故障的分钟级感知及逆向溯源,有效提升故障处置效率,提升IPTV业务的品牌形象。

5 结语

综上所述,通过机顶盒内置告警收集客户端提示码的报文特征,系统层面实现对用户认证、鉴权、支付问题的远程高效采集明确告警识别信息的上报方案(启动、告警),以及轻量化的上报信息建议

参考文献:

[1]李天校,探针技术在OTT TV质量监测系统中的应用[J].中国有线电视,中国有线电视.2019(01):45-49.

[2]王大鹏,电子节目指南(EPG)在机顶盒中的实现[C].中国杭州,国际有线电视技术研讨会.2003:423-427.

作者简介

肖哲(19849),男,汉族,河北张家口,硕士研究生中级工程师,研究方向家庭网络,IPTV电视业务。

孔晓琨(198512),女,汉族,河北邯郸,硕士研究生中级工程师,研究方向5G专网,工业互联网。


...


阅读全文