peakzhang 发表于 2008-9-21 18:16:58

SIP在视频通信中的应用

一、视频技术的发展

  1989年ITU-T制订的H.320标准是视频会议的早期建议之一,主要是针对窄带ISDN网上传送活动图像、语音、应用数据等信息形式的多媒体数据提出的。 窄带ISDN是一种基于电路交换的网络,采用E1专线方式或ISDN2B+D的接入方式接入视频终端,使用公用交换电话网络传输视频数据,具有一定传输速率和时延稳定、时延小、误码率低的特点,视频会议的质量容易得到保证。通信带宽通常为384~2048kbit/s,通常使用384kbit/s带宽就可组成具有较好质量的视频会议组。H.320系统的缺点是带宽利用率较低,开放性很差,各厂商的系统互通困难。

  随着IP网络的迅速发展,1996年ITU-T制定了H.323基于分组交换网的多媒体会议系统标准。H.323会议系统由网守(GK)、H.323终端、网关(GW)、多点控制单元MCU等实体组成。H.323系统在开放式网络平台和应用平台上进行视频通信、多媒体监控、多媒体呼叫中心、数据会议等业务。H.323协议具有资源利用率高、协议互通性高等特点。目前国内中国联通、中国电信、中国铁通、中国网通等运营商先后开通面向公众运营的视讯会议业务都是基于H.323协议框架的。

  现在,视频通信的应用不仅局限于视频会议,越来越多的家庭和个人使用视频通信业务,腾讯的QQ、微软的MSN等网络聊天工具都支持视频通信功能。H.323协议的网络适应性不是很好,比如H.323系统不能支持防火墙穿透、不能支持NAT(网络地址转换)。同时,H.323协议还存在着本身过于复杂,生成业务困难。因此,新的协议和方案将会补充到现有框架中,其中SIP协议得到了广泛的关注。   二、SIP实现视频通信

  1.SIP实现点对点视频通信

  SIP通过向被叫终端发送请求表明意图,被叫终端根据请求进行操作,产生相应的响应表明请求的处理结果。在会话建立时候,SIP为了保证呼叫的正确建立,SIP采用三次握手机制(INVITE/200/ACK)来完成。SIP终端通过REGISTER请求向注册服务器进行注册,在管理域中登记自身的地址信息,以便服务器进行状态管理、呼叫路由等。通过BYE和CANCEL请求终止SIP建立的会话。

  如前所述,SIP不是完整的通信系统,SIP本身并不提供任何服务,SIP只提供消息机制实现不同的呼叫机制。用户代理(UA)可通过在消息中携带消息体完成某些多媒体呼叫。SIP在实现视频通信时,需要使用SDP描述此次会话使用的媒体集合。SIP采用SDP基本的offer/answer模型完成终端多媒体能力的协商。在offer中终端将自身的视频通信能力、视频传输机制、语音通信能力,语音传输机制发送给被叫终端,被叫终端根据自身的视音频通信能力,从offer中选取视音频能力,在answer中放入选取的视音频能力和自身的视音频传输机制来响应offer完成能力协商。

  主被叫双方建立通话连接,主被叫分别建立媒体流传输通道,采用RTP传输实时视音频数据,采用RTCP提供QoS反馈。主被叫分别为视频媒体流和语音媒体流建立RTP/RTCP通道,在RTP上分别传输视频流和音频流。当媒体流到达终端时需要解决音唇同步问题,应该采取RTP包中的时戳实现音唇同步,而且需要采用音频流RTP包中的时戳作为基准,因为语音包间隔短,大约20ms一个语音数据包,而视频数据包大约30~40ms一个。

  2.SIP实现视频会议

  众所周知,SIP的会议控制功能不强。SIP系统完成视频会议可以通过两种方式实现:第一,在SIP系统中增加多点控制单元;第二,借助H.323系统的多点控制单元(MCU)。

  在第一种方式中,到达会议召开时间,多点控制单元分别通过INVITE请求邀请与会者参加会议,在INVITE请求中SDP需要描述此次会议的属性,例如会议ID等信息。多点控制单元将媒体流定位到媒体处理器完成视频的分屏,与音频流的混合,分别发送给各个SIP终端。如果是SIP终端临时召开会议,那么SIP终端应该具有多点控制功能,邀请与会者,使用媒体处理器进行音频流的混合。

  在第二种方式中,需要借助H.323系统的MCU进行视频会议。H.323系统具有完善的会议发起和会议控制机制,这种方式将会议的控制交给MCU进行。在这种方式中需要在SIP系统和H.323系统之间引入IWF设备。IWF可实现不同网络、不同协议实体的互通,具有SIP和H.323协议转换、路由解析、终端能力协商、媒体通道打开与关闭、维护呼叫状态机,并可发起呼叫和当作被叫。在SIP侧,IWF就相当于代理服务器的功能,完成SIP消息的转接、转发功能,将SIP请求传送到目的地。在H.323侧,IWF相当于网关(GW),将SIP实体的请求转换为H.323终端请求,屏蔽两个系统的协议之间的差别。会议由H.323系统中的MCU发起,IWF将H.323协议消息转换为SIP消息,完成SIP终端用户参加会议。

  第二种方式同时完成了SIP系统和H.323系统的互通,但是对于SIP终端的会议控制,例如摄像头的调节、SIP终端作为会议主席等功能,在现有的SIP和扩展中定义的消息还无法完成。

  3.SIP实现视频通信的安全

  在开放的网络中传输呼叫信令和媒体流,安全性是一个至关重要的问题。在呼叫控制过程中,保证SIP信息的机密性和完整性,防止信息欺骗、恶意攻击是电信运营中必须要面对的问题。SIP采用消息头域为视频通信系统提供SIP安全机制,保证呼叫的正确建立。SIP可以采用HTTP摘要认证方式来验证SIP终端的有效性。分两个阶段验证终端的有效性,注册阶段和呼叫阶段,在呼叫阶段可以根据业务不同对终端采取不同的认证方式。HTTP摘要认证方式采用challenge/response机制。SIP消息在WWW-Authenticate头域中携带challenge,在Authorization头域中携带response。

  4.服务质量保证

  SIP本身不提供服务质量保证,视频通信的服务质量主要通过分组网络提供的服务。在MCU之间采用MPLSVPN承载方案保证视频质量。在SIP终端的接入层采用基于IP地址设置IP优先级、源/目的MAC地址区分业务、设置VLAN和优先级等方式保证视频服务质量。

  三、SIP的优势

  1.与现有的Internet应用紧密结合

  SIP标准与WWW相似,利用Internet结构,通过智能SIP终端提供业务,包括Web以及Email业务,而点击拨号(ClicktoDial)和点击传真(Clickto Fax)等协议都是基于SIP的,SIP可利用URI来动态组网。

  2.良好的扩展性

  SIP采用和HTTP相类似的方法和头域组成SIP消息,SIP消息采用UTF-8消息集合进行明文编码;对头域的结构没有限制;对头域出现在消息中的顺序没有限制;SIP本身不提供业务,而是提供使用SIP消息提供会话建立的机制;SIP消息可以携带任何格式的消息体。这些SIP特性使SIP具有非常良好的扩展性,可以通过定义新的方法和消息头域丰富SIP自身的呼叫控制,可以通过携带不同的消息体完成不同的数据业务。

  3.端到端的通信

  SIP是实现端到端业务的协议,主要的业务实现是在用户代理实体中。SIP的Proxy等服务器完成消息的转发,消息的路由功能,并不对业务进行处理,这样可以大大降低了对核心网络服务器的压力,在同样情况下,可大幅提高系统对呼叫的处理能力。在SIP系统中增加业务,只需要终端增加业务处理,不需要在Proxy上实现,促进了智能终端的发展,同时降低了网络更新频率,符合Internet的发展趋势。

  4.实现容易

  SIP信息是基于文本的,UTF-8消息集合进行明文编码,实现起来简单,开发容易。

  四、结束语

  随着Internet的迅猛发展,视频通信的大众化以及SIP相关技术的逐渐成熟,SIP将逐渐成为视频通信领域的主流信令控制协议之一。SIP终端业务计费、SIP视频应用和现有视频会议系统的融合问题将会逐步得到解决。

作者:中国电信股份有限公司北京研究院邓建伟 支金龙

编者注:----摘自《通信世界》
页: [1]
查看完整版本: SIP在视频通信中的应用