Dolphin1000智能广告监播分析系统】
(智能自动截取工业级 详情见www.zghpc.com)
1,广告公司、电视购物公司、广告投放量大的企业都需要解决以下问题:
实时收看将要播出的电视广告(有线电缆内包含的全部频道);
监控广告播出情况,对漏播、延播、广告前后环境实施录像,以便日后核对;
将同业的个别或全部产品广告实施录像,以便随时参阅、分析、筛选产品和时段;
实现无人值守的电视广告录像,以提高员工工作效率;
利用系统自动地对电视广告播出视频进行广告识别、条目登记,直接生成广告监播报表和分析图表;
相关部门经理需要在工作笔记本上随时随地的监控电视广告的播出;
鉴于以上问题,现将系统的关键性环节说明如下,以利于尽可能的靠近用户的现实需要:
2,传统的广告监播方式
用传统的广告监播方式来处理一套电台(电视)节目中广告信息的过程通常包括下列步骤:
**日: 用传统的录像机、录音机录制节目并保存
**日: 广告监测人员通过回放录音/录象,记录出现的广告信息
第三日: 广告监测人员将监看数据交监播**处理
第四日: 获取监播报告
我们通常说广播、电视广告监测是大量的人力堆积起来的数据,这一点都不夸张,尤其是电台广播,因为人的耳力无法辨别以倍速播放声音的内容,但却能大致看明白以倍速播放的视频图象。也**是说,一个监测员若要真实可信地处理前**全部24小时的数据,**必须花26-30个小时的时间。这样,一个电台一个频段每天24小时的监测数据处理,将需要3-4个人工来完成,而后还需要人员录入、QC,*后才能生成监播结果报告单,总共需要4-5个人工来完成。
3,基于音频的广告智能监播技术原理
在电台或电视节目中播放的广告普遍具有下列特征:
1、 同一版本的某个广告的播出时间上具有重复性和连续性,时间短的会重复播放一星期,长的甚至会达到半年以上。
2、 重复播放的广告都具有相同的音频特征(声纹和频谱)。
3、 不同版本的广告具有完全不同的音频特征。
例如,下面看到的**是某个广告样本的“音频特征波形图”:
如果能够通过语音识别引擎将某套节目中**出现的某广告的音频特征信息提取出来,制作为该广告的音频识别样本,**可以通过语音识别引擎用该样本对后续数据进行连续自动识别,并将识别出的广告记录到数据库中,从而实现基于音频的广告自动监播。
实现基于音频的广告自动监播的技术关键是语音识别引擎的设计,需要解决下列技术难题:
? 广告识别准确度。如果识别准确度低于80%,系统的可信程度**不可接受。而识别准确度高的算法往往计算量也非常大。
? 计算能力。语音识别算法的计算量非常大,普通的CPU难以负担,只能采用专用DSP硬件实现的方案。
? 处理速度。一般而言,实际的应用系统都需要同时监播数十套电台、电视节目。这对识别引擎的硬件设计提出了很高的要求。
4,ZG DOLPHIN 1000型 智能广告监播系统,
ZG DOLPHIN 1000型 智能广告监播系统以99%的识别准确度为设计目标,充分利用了飞速发展的DSP技术,攻克了上述技术难题,使基于音频的广告自动监播进入实用阶段。
ZG DOLPHIN 1000型 智能广告监播系统采用基于高速DSP高速、高精度语音识别算法,实现了电台、有线电视节目中播出广告的自动识别和分析统计。根据操作员预先确定的广告样本,本系统能从电台、电视的声音信号中准确地识别出某个广告是否出现、在什么时间出现(精确到0.1秒),以及该广告播放的时间长度。识别出的广告的相关信息被自动存入数据库。
ZG DOLPHIN 1000型 智能广告监播系统除了具备广告智能监播功能以外,同时还具有节目监录功能。通过挂接大容量的海量存储设备,ZG系统够将全部节目数据保存30天以上甚至更长,以便事后查证。
4.1,语音识别工作站
语音识别工作站是整个音频广告自动监播系统的核心设备,包括广告识别所需的全部硬件部分和软件,具体包括:
a,工业级的高性能专业计算平台及相应的调度软件,满足系统24小时连续不间断运行的需要。
b,专用的超大容量音频数据采集硬件及相应软件,可以同时对多达10路电台音频(或电视伴音信号)进行数字化,并将数字化的声音数据和视频数据以文件方式保存到工作站的本地硬盘或外挂的磁盘阵列上。
c,专用的视频数据采集硬件及相应软件,采用*先进的MPEG4压缩技术,可以同时对多达10路输入视频信号进行数据采集和压缩,将视频数据的码流将到了*低。
d,专用硬件构成的超级语音识别引擎,用以对输入的原声数据提取音频特征。语音识别引擎使用了目前*先进的DSP芯片阵列和识别算法,可以同时对多达10路输入原声数据的音频特征进行并行计算。
e,每台识别工作站可以同时处理多达10套广播或电视节目。
4.2,磁盘阵列
音频、视频信号数字化后,每天产生的数据量是相当可观的。对于电台节目,每天24小时产生的数据大约为1G(1000M bytes)左右;对于电视节目,采用*先进的MPEG4压缩格式,每天24小时产生的数据大约为6G左右(包括声音原声数据和视频图象数据)。
例如,如果需要在一台识别工作站上同时监测16套电视节目和16套广播节目,并且要求声音和图象数据都至少保存90天,那么需要的存储空间大约为:
6G*16*90 = 8640 G
1G*16*90=1440G
如此大的存储要求需要使用海量存储设备,通常是磁盘阵列。
4.3,操作员终端
本系统中,所有需要人工参与的工作都是在操作员终端上进行。操作员终端提供友好、方便的图形化人机交互界面,实现正常节目的确定、广告样本的提取、广告监听/监看、自动识别、广告识别结果的存储和管理等功能。
操作员每天的主要任务,主要包括下列内容:
(1) 打开保存在工作站上的某套电台或电视节目某天的录音和录象文件。
(2) 系统用前一日(或多日)的样本库对当日原声进行自动预识别。识别出的广告会自动标注到波形上,同时将相关信息保存到数据库中。
(3) 利用终端软件提供的工具听取(查看)原声数据(和图象),从中发现新广告,将新出新广告制作成样本。
(4) 给新样本输入主题词并保存。此时终端软件会自动在当日原声文件中对新样本进行自动识别,将识别出的新样本在波形上进行标记,并记录到数据库中。
(5) 操作员重复步骤(3)~(4),直到完成对该日全部新广告的提取和处理。
操作员终端按照实际需要进行配置。一般而言,如果每天24小时的数据都需要处理,每3~4套节目需要配置一台操作员终端。
下面是操作员终端的一个操作界面:
4.4,监播结果数据库服务器
数据库服务器上主要存放每套节目的样本信息和监播结果的数据库。
监播结果数据库集中存放各套节目监播结果。数据库中每条记录都包含下列信息:
? 媒体来源,如某某广播电台FM xx.xxxHz,某某广播电台AM xx.xxxHz,某某电视台
? 广告名称(主题词)
? 节目类型。对于17号令的应用而言,分公益广告、酒类广告、影响进食类广告、普通广告、禁止播放类广告、节目
? 播出日期、时间
? 广告/节目持续时长
用户收益:
? 实现实时监督播出的广告播出长度,播出时间的精确性
? 可以监督电视台因工作过失产生的漏播,缺帧等情况
? 可作为电视台是否落实广告播出合同的依据
? 可实现在同一时刻内同时监控多个广告播出情况的功能
? 可有效地收集同业的媒介广告播出情况,利于用户有效地进行行业分析