本文由联德律师事务所标准必要专利业务团队[1]撰写
视频作为一种兼具娱乐性和高效信息传递功能的媒介,近年来已从传统的娱乐和信息传播场景,持续扩展至社交、教育、办公、医疗、电商及各类数字服务之中,并逐渐成为各类产品和服务的基础组成部分。视频数据的压缩、传输与存储高度依赖视频编解码技术,而随着视频应用场景的持续扩张以及实施主体数量的不断增加,围绕视频编解码领域标准必要专利(Standard Essential Patent, 以下简称SEP)的许可谈判也显著增多。在标准竞争态势、标准化组织知识产权政策、视频编解码技术许可相关主体类型等多重因素交织作用下,视频编解码领域的SEP许可呈现出与其他技术领域明显不同的模式,同时也面临着一些新的挑战和难题。近年来,因视频编解码领域SEP许可引发的诉讼纠纷在全球多个司法辖区呈明显上升趋势,若干SEP相关法律纠纷中的新争议点不断涌现并引起了业界高度关注。有鉴于此,联德律师事务所SEP业务团队持续跟踪国内外视频编解码领域SEP许可与纠纷诉讼动态,梳理相关统计数据与法律争议问题,拟就视频编解码领域SEP许可背景及其特点、2019-2025年视频编解码领域SEP全球法律纠纷案件统计与分析,以及该领域若干已经出现或可能出现的核心法律争议问题完成系列研究并与业界分享。
本文为上述系列研究之一,拟通过梳理视频编解码领域标准化现状、视频相关标准制定组织专利政策及视频编解码标准必要专利所涉及的各方市场主体类型,剖析视频编解码领域SEP许可模式形成的背景原因并解释该领域许可谈判可能面临的挑战与争议。
一、 视频编解码领域标准必要专利许可背景分析
(一) 视频编解码领域所涉多种技术标准相互竞争且迭代并存
自20世纪末以来,以离散数字信号记录和传输动态图像的数字视频逐渐兴起并开始产业化。由于数字视频数据量巨大,未经压缩的原始视频在传输中会占用大量的存储空间和传输带宽,因此为了实现视频的高效存储、传输和高质量还原,视频编解码技术应运而生并持续演进。具体而言,视频编码技术[2]的核心思想是对原始视频数据进行压缩,去除其中的冗余信息,在尽可能保证视频质量[3]的前提下,减小视频文件的大小,通过预测、变换、量化、熵编码等步骤,最终输出为码流,进入信道进行传输[4]。而视频解码技术是相对视频编码技术的逆过程,即通过熵解码、反量化、反变换、预测等步骤将编码形成的码流转换成可观看的视频画面[5]。同时,由于信道传输的带宽与端侧缓冲区大小都有限,编码时还需要进行码率控制,确保生成的码流被控制在目标码率范围内,从而实现顺利解码与播放[6]。

图1:视频编解码过程简化示意图[7]
为了实现“任何视频编码后输出的码流能在不同厂商的设备上稳定解码播放”的互通目标,相关标准化组织通过制定技术标准来规范视频编码所生成的码流和解码流程,但一般对视频编码过程不作具体规定。MPEG[8](Moving Picture Experts Group,动态图像专家组,简称MPEG)官方知识库对此的解释是:凡能生成语法上合规码流的任何编码算法,均视为符合MPEG相关标准,并强调该做法的优势在于可以在不修改标准文本的前提下持续演进编码技术,并可面向不同需求(如速度/压缩率、功耗)形成多样化实现[9]。
回顾视频编解码技术发展历史,有多个组织、联盟或厂商尝试制定或推动相关视频编解码技术标准,使得视频编解码技术领域有多套技术标准同时并存并分别迭代发展(见图2)。篇幅所限,在此仅介绍其中较为常见的几类视频编解技术标准。

图2:视频编解码标准的演进[10]
1. H.26x系列标准
早在1990年,国际电信联盟电信标准化部(International Telecommunication Union-Telecommunication Standardization Sector,以下简称ITU-T)在借鉴静态图像压缩标准的基础上,搭建了H.261标准,该技术标准主要应用于专用硬件系统和通信设备,以实现实时视频通话。但由于该标准的设计目标偏向实时传输而非本地存储,为了实现在电脑上播放本地存储的视频,苹果公司推出了QuickTime并配套Cinepak等编码器。随后,微软公司和Intel共同开发在Windows系统上可以播放视频的播放器Microsoft Media Player。受当时视频编解码技术所限,前述苹果公司和微软/Intel开发的视频编解码技术方案仅限在其各自的Mac或Windows系统上才能使用,难以实现跨设备的播放和传输。为解决兼容性问题,国际标准化组织(International Organization for Standardization,以下简称ISO)成立了动态图像专家组(Moving Pictures Experts Group,以下简称MPEG)以制定一种开放、跨设备、跨操作系统的数字视频压缩标准,而第一个国际标准MPEG-1于1993年发布。随着消费者对数字电视以及DVD等高质量视频需求的日益突出,MPEG于1994年又发布了改进的MPEG-2标准。同时,MPEG与ITU-T始合作制定统一的视频标准,MPEG负责制定标准的系统、音频部分,ITU-T负责视频部分,共同发布标准,并以各自组织内的编号命名[11]。2003年,ITU-T的视频编码专家组(Video Coding Experts Group,以下简称VCEG)与ISO的MPEG联合成立的联合视频工作组(Joint Video Team,以下简称JVT)完成首版的H.264/AVC标准。在技术层面,该标准相较前代标准,在大致相同主观视频质量条件下显著降低了所需码率[12],实现了更高的压缩效率。在专利许可层面,与该标准相关的大量SEP主要通过MPEG LA[13]的AVC专利池进行集中许可,采取按编解码设备和付费内容计费,并对面向终端用户免费的互联网视频长期免收许可费等安排(具体内容后文展开)。该技术标准在技术上的优越性与高兼容性,加上相对开明的专利授权机制与费率,使得H.264/AVC标准成功实现了广泛的商业应用。ITU曾在2013年表示H.264/AVC标准已占据80%以上的网络视频,是当时全球部署最广泛的视频压缩标准[14]。时至今日,H.264/AVC标准在4K以下的视频编解码中仍占据主导地位。
随着4K/8K超高清视频时代的到来,ITU-T与ISO/IEC组建视频编码联合协作组(Joint Collaborative Team on Video Coding,以下简称JCT-VC),于2013年发布H.265/HEVC标准。该标准仅需原先的一半带宽即可播放相同质量的视频,在对网络的适应性方面也有显著提升,可更好地运行在移动互联网等环境中。然而,由于该标准所涉技术牵涉众多权利人的专利,在前期采取的多专利池并行运营,导致许可路径碎片化、费率水平偏高且结构复杂,实施方在合规与成本评估上的顾虑显著增加,从而使其推广速度与覆盖范围远未达到在市场上全面替代其前代标准H.264/AVC的效果。
为了满足16K视频、沉浸式与屏幕共享等更广泛场景,VCEG与MPEG于2017年成立合作视频专家团队(Joint Video Experts Team,以下简称JVET),并在2020年完成首版H.266/VVC标准的制定和发布。相较前代标准,H.266/VVC标准可在保证相同视频质量下,减少约50%的数据大小与带宽成本。有数据指出,该标准在国内头部视频平台的渗透率已超过70%[15]。但由于其较高的编码复杂度及与前述H.265/HEVC标准同样的许可困境,导致其全面推广仍存在阻碍。
目前,JVET正在主导下一代支持元宇宙和高级自主系统等未来技术的标准的制作,预计于2028年7月或10月左右完成初版H.267标准的制定与发布。总体而言,得益于起步较早且由两大国际标准化体系长期协作推动,H.26x系列标准一直处于视频编解码标准的主流阵营。
2. 微软WMV系列技术
如前所述,微软自2000年起陆续推出WMV(Windows Media Video,Windows媒体视频)系列编解码器,到2003年发布WMV9时,微软同步公布了面向WMV9的专利许可计划,声称该技术仅需MPEG-4技术约二分之一、MPEG-2技术约三分之一的码率,即可实现相同的视频主观质量[16],且其授权周期及费率都优于包括MPGE-4和MPEG-2在内的其他技术[17]。2006年,微软宣布其WMV9技术被纳入电影电视工程师协会(Society of Motion Picture and Television Engineers,以下简称SMPTE)发布的VC-1标准中[18],直接与其他标准形成竞争。WMV/VC-1标准曾在DVD设备与Windows运营商生态中发挥过重要作用。但随着流媒体时代的演进,DVD逐渐退出主流市场,WMV/VC-1也在标准的快速更迭中走向边缘化。
3. VS系列标准
我国原信息产业部科学技术司于2002年批准成立数字音视频编解码技术标准(Audio Video coding Standard,AVS)工作组,制定了一系列视频编解码标准。2006年颁布的AVS1标准编码效率与同期国际标准H.264/AVC的压缩效率相当,并在数字广播电视等领域取得一定应用。2016年成为国家标准的AVS2压缩效率已超越同期国际标准H.265/HEVC,已被中央广播电视总台4K频道及多地超高清频道采用[19]。支持8K、全景视频等的AVS3标准更是于2019年3月完成主档[20],比2020年制定完成的H.266/VVC标准更早,第一次实现视频编解码技术标准化工作的领跑,在同等主观质量下较AVS2进一步实现约30%的码率节省,并已在我国8K超高清频道、冬奥会转播、监控与行业视频等场景实现多领域部署[21],近期也被正式纳入人工智能生成内容(Artificial Intelligence Generated Content,以下简称AIGC)国家标准实践指南[22]。尽管如此,与H.26x系列及AOM[23]系列标准相比,AVS系列标准在全球规模化商用道路上仍未形成强势的正面竞争。
4. SVAC系列标准
SVAC标准(Surveillance Video and Audio Coding,安全防范监控数字视音频编解码技术)由我国公安部主管并在全国安防报警系统标委会归口管理,并于2010年发布第一代国家标准(GB/T25724-2010)[24],2017年更新为第二代(GB/T25724-2017)[25],现已发展至第三代,压缩效率比H.265/HEVC标准提升36%[26]。SVAC标准设计的初衷是为了解决通用视频编码标准(如H.264/AVC标准)在安防监控领域应用时存在的不足,例如H.26x系列标准更关注压缩视频的高效,而对于加密和认证等安全功能,则被设计为编码层上的可选模块。SVAC技术标准则在将安全能力深度耦合至编码层的同时,牺牲了一定的通用性和兼容性,以换取更强的安全保障[27]。这也使得该标准虽然在信息安全领域具有不可替代的优势,但在成本和兼容性上并未形成强势的竞争力,目前其应用主要局限于国内相关安保产品。
5. AOM系列标准
自2006年收购YouTube起,Google长期面临视频编解码领域高昂的专利许可费与既有编解码格式传输效率不理想的问题。为此,2009年Google收购On2 Technologies,并获得该公司开发的VP8视频编解码技术。同年5月,Google发布WebM开放媒体项目,并公开VP8的技术规范,将一套示范版的编解码器源代码完整公开,便于开发者与厂商直接集成与商用,同时对符合VP8/WebM规范的实现提供全球、免许可费、不可撤销的专利授权[28]。鉴于VP8标准的编码速度与压缩性能未能显著优于H.264/AVC标准,Google于2013年推出迭代标准VP9,其压缩效率接近H.265/HEVC,并在YouTube以及其他领先的网络视频平台上被大规模采用。Google声称超过20亿个端点支持VP9解码,包括Chrome、Opera、Edge、Firefox和Android设备,以及数百万台智能电视[29]。VP9标准成功后,Google即着手下一代VP10标准的研发。2015年7月,HEVC Advance公布首版许可方案,将非实体内容分发(含互联网流媒体、广播、卫星等)纳入收费对象(后于2016年及2018年取消)[30]。受当时相对较高的费率及多池并存的许可路径的影响,2015年9月开放媒体联盟(Alliance for Open Media, 简称为AOMedia/AOM)成立。该联盟创始成员包括Netflix、Google/YouTube、Amazon等流媒体平台;微软、Mozilla等浏览器厂商;思科、Intel等芯片和网络基础设施厂商,其共同目标是在公开开发模式下制定免许可费的下一代视频标准[31]。AOM联盟整合了Google的VP10技术、思科的Thor技术与Mozilla的Daala技术等多个项目的技术路线,并于2018年3月28日发布AV1 1.0比特流技术规范。在主流测试中,AV1标准相较VP9标准约提升30%压缩效率,对比H.265/HEVC标准亦可节省约 25%–35%的带宽,成为当时视频压缩效率最高的技术标准之一[32]。AV1由此成为H.26x系列标准之外的重要主流替代路线。目前AOM正在推进AV2(亦称AVM)方向的探索性研发,目标是在进一步提升压缩效率的同时降低编码复杂度。
综上所述,在视频编解码领域,相关技术标准并非单线演进,而是长期处于并行与竞争态势,其中应用最广泛的当属H.26x系列标准与AOM系列标准。在此两类标准的具体实施过程中,也并非简单地后一代际标准取代前一代际标准,而是多个代际标准并行,即新一代标准发布后,旧一代仍因生态、成本与兼容性等因素仍被持续大规模使用。Bitmovin[33]于2025年7月调研并发布的《第九版视频开发者报告》展示了各编解码标准当前的采用情况及未来12个月的增长趋势[34](见图4,柱状部分代表当前在生产环境中的采用比例,红色折线则对应计划在未来12个月内采用的比例)。该图表更直观地呈现出:无论是不同技术体系之间,还是同一体系内的各代标准,实际上都在相互竞争;市场选择也并非“N 选 1”,而是长期存在“N 选多”的并行格局。对照 Bitmovin 于2024年9–12月调研发布的《第八版视频开发者报告》中的同类图表[35](见图3),可见各标准的采用度与趋势处于持续动态变化之中:H.264/AVC标准仍然是占比最高的主流标准,虽然其生产环境采用率从2024年的79%降至2025年的65%,但优势地位依旧明显;H.265/HEVC标准继续位居第二梯队,采用率由2024年的49%小幅回落至2025年的41%。与此相对应,AV1标准的生产采用率由2024年的13%提升至2025年的16%,而“计划采用”的比例虽从2024年的32%回落至2025年的 21%,但在各标准中仍然最高,表明部分此前处于规划阶段的部署正逐步落地;旧一代的VP8则呈现缓慢下滑,而VP9基本维持在约13%的稳定水平;其他标准在生产中的占比仍处于个位数,但“计划采用”的比例大致维持在 5%–8% 区间,显示出一定的试水和观望态势。

图3:Bitmovin《第八版视频开发者报告》中受访者关于生产中使用/计划使用哪些视频编解码标准的回答汇总图表(2024年9月-12月)

图4:Bitmovin《第九版视频开发者报告》中受访者关于生产中使用/计划使用哪些视频编解码标准的回答汇总图表(2025年7月)
总体而言,受技术迭代与市场环境演进共同驱动,视频编解码标准将长期维持多线并行、此消彼长的竞争态势。
此文为《视频编解码领域标准必要专利许可与纠纷相关法律问题系列研究报告一》,全文共16414字。请点此查看全文及脚注