火山引擎:架起视频行业创新与用户体验的“云底座”
- 来源:懂懂笔记
- 时间:2023-08-25 07:53:22
2018 年我们用手机刷着抖音的时候,绝对想不到短短几年时间,视频会发展如此之快,在我们的生活、工作中已经无处不在。
购物都是看直播,春晚可以边看边“玩”,在线教育上大课、小课都很轻松,身处异地也可以多人连线K歌……
(相关资料图)
作为一个普通的用户,这几年可以感受到视频的快速发展,以前很多不能实现的场景,慢慢来到我们的生活中,甚至很多超出想象的场景,也在不断被制造出来。生活、工作的方式,正在逐渐被视频所改变。
前台的内容越精彩、形态越丰富,后台就需要越强大的技术支撑。当“行业+视频”成为新常态,视频云也正在成为智能社会的新基建。
抖音用户的流畅体验,背后是亿级DAU打磨的火山引擎视频云。一方面其技术能力快速成长,满足平台不断创新应用的需求,另一方面其也在将这种行业领先的能力外溢,帮助更多的企业、行业创新。
“当下,视频化是数字时代的重要特征,正在为全行业输出商业创新与变革的源动力,重塑工作模式与商业逻辑。”火山引擎总裁谭待在火山引擎视频云&AIGC技术大会表示。
超视频时代:助力千行百业体验创新
不知不觉,你发现在万物互融时代,人人看视频,人人发视频,万物皆可拍,万物皆可播,正在进入超视频时代,视频对社会的影响在不断加深,正在改变人们生活、工作的方式。
过去几年,在C端应用中视频已经几乎成为了标配,手机中的社交、资讯、电商、音乐等各类应用都开始增加不同形式的视频功能,因视频的直观、生动、丰富,已经成为增强用户粘性的必要手段。据统计,TOP100 APP中搭载了点播、直播或实时音视频功能的比例高达69%。
如今,视频化的趋势已经蔓延到B端。无论是从行业竞争,还是从用户体验来看,每一个行业、每一个企业都有迫切创新的需求。人们常说,AI把每一个行业重新做一遍,事实上视频也正在催生这种变化,把每个行业都重新做一遍。因为视频,一些行业的运行模式在发生变化,用户的使用方式也在随之而变。
2022年中国视频直播带货规模约3.5万亿元,在整个网上零售额中占比达到25.4%。每一个品牌、商家都将直播带货视为重要的营销手段,看直播也成为消费者购买决策的重要渠道。
旅游行业,短视频、直播带火了多个城市、无数个景点。到网红景点打卡已经成为人们出游的必选项。当然,如果不方便出行,也可以通过3D沉浸式体验“逛”景区。字节跳动与火山引擎视频云联合中国第一历史档案馆、敦煌研究院、甘肃简牍博物馆、国家图书馆(国家典籍博物馆)打造了VR《古籍寻游记》项目,依托三维重建技术,我们可以通过Pico、抖音裸眼VR等方式,用户不仅可以穿越空间,还可以穿越时间,亲自“参与”历史事件。
教育是非常大的市场,除了K12,还有各种兴趣培训、职业教育、知识传播等等。权威投资机构报告显示,素质教育、职业教育等互动直播增长势头强劲,知识传递的方式也因为视频化有所突破。今天,不仅学生对线上课堂习以为常,用户接触、学习知识的方式也更灵活多样,刷短视频快速了解一个知识点,看直播了解投资理财知识,在线学画画、刺绣,跟着直播练瑜伽。
疫情加速了在线会议的发展进程。中国云视频会议市场从2021年的37亿持续增加到2022年的43亿,打破空间限制,极大提升办公效率,商业传递方式在也发生改变。疫情虽然过去,但是这种先进的生产方式被固化了下来。
很明显的一个趋势是,视频化呈现出从游戏、电商、社交等消费互联网,向医疗、金融、教育、汽车等行业互联网渗透的趋势,视频应用转向产业互联网领域,创新出各行各业场景化的视频智能应用。
一个新的挑战摆在企业面前:如何抓住视频化的机遇,创新业务模式,进行数智化升级?在超视频时代业务融合、体验需求、快速创新的趋势下,视频云正在成为智能社会的新基建。与视频快速发展相匹配的是,近两年视频云的技术在快速迭代,市场规模也在快速扩张。
体验倒逼技术:前台越丰富,后台越强大
当下,一方面行业创新应用非常迫切,另一方面用户的体验需要不断提升。千行百行都希望通过快速创新,找到未来突破的方向。
比如,春晚寄托着每一位华人的各种情结,办好春晚不仅要在节目上创新,还要在形式上创新。抖音通过网络直播春晚,观看人数破1.3亿,并且每一个人看到的都是高清、丝滑、低延时的内容。通过网络,用户不仅看,还可以“玩”,抢红包,聊天,送祝福,邀请好友一起看,在看春晚的同时通过互动增进了亲情,也让喜庆的氛围更浓郁。
火山引擎视频云与千行百业的客户一起做着类似春晚创新这样的探索。娱乐场景的多人互动大合唱方案,让传统综艺增加了参与感,焕发新活力;营销场景的互动直播,有效的提升了用户消费转化;虚拟直播间让品牌和商家可以24小时无休地卖货,永不关门的店铺;VR云制播方案为新品发布会、赛事直播和文旅直播等行业带来了新体验。
前台业务越丰富,就需要后台的支撑越强大,体验倒逼技术进步。作为智能社会的新基建,视频云效率提升是依赖全链路的技术提升,包括底层需要芯片、云计算、数据库、人工智能等融合支撑。
为了满足新需求,火山引擎通过技术创新努力突破三个边界:算力边界,大规模视频数据与技术迭代速度不匹配;效能边界,视频应用普及与落地接入效率不匹配;融合边界,行业深入渗透与场景需求碎片不匹配。
在超视频时代,企业端不仅要更快速地创新,并且是跨业务、跨平台融合,在用户端需要极致的体验,比如高清、低延时,这都对计算性能和异构计算资源的运用提出更多的要求,同时也需要一个能够应对快节奏的视频处理框架,帮助客户把各种创新快速落地。
面对复杂的需求,火山引擎基于抖音集团大规模应用实践和打磨,实现了从通用计算到异构计算的跃进,建立起异构计算的大底座。
ASIC算力是未来的重点方向,火山引擎在这一次的峰会上带来了自研视频编解码芯片,其一台芯片服务器的转码能力相当于百台CPU服务器的算力;同时火山引擎自研视频编码芯片的压缩效率也相当优秀,比行业主流硬件编码器提升30%+,可以使单个视频的计算、存储和传输的边际成本达到平衡。这一芯片在视频直播、超低延时、视频点播、VR直播/点播、图片转码等场景带来明显的提升。
FPGA算力相比ASIC密度、吞吐稍差,但是具有可擦写、更灵活的优势,也是当下算力必不可缺的一部分。火山引擎通过技术优化,FPGA编码器整体编码性能比行业标准编码器提升了30%。该编码器也在2023 MSU赛事中获得最佳4K FPGA编码器称号。
首次推出了火山引擎自研ARM阵列服务器,把编转码内核在ARM指令集上深度集成和优化之后,经过大规模实测发现这种算力资源在密度、成本方面相较x86服务器有很大优势。
异构计算、扩展协同、复杂场景对框架提出了更为苛刻的要求,基于亿级DAU实践下,火山引擎带来了通用且易用的下一代视频处理架构BMF。开发超分模块,基于原有架构大约占用2周的时间,基于BMF,开发者只需1周即可完成上线。在这个更先进的架构上,企业的互动娱乐场景、直播营销场景、虚拟直播间等方案都可以更快速地落地。
火山引擎视频云是在抖音的实践中成长起来的,随着千行百业对视频需要的增加,火山引擎视频云将能力向各行各业输出。技术的价值体现在对业务的赋能上,为了更好地帮助开发者、帮助企业创新,BMF以开源的姿态示人,用一种普惠的方式加速视频化的进程。
AI落地:为视频创作注入新价值
技术的终极目的是为了业务创新,创造新的业务价值,进而提升用户体验,所以应用落地是关键。
落地,从场景出发,AIGC是最好的一个注脚。
近日,火山引擎联合抖音对100部香港经典老电影进行4K修复消息刷爆了朋友圈。一是行业内人士非常兴奋,二是每一个热爱电影的用户也都非常兴奋。赋予老电影二次生命,这就是技术对艺术的增值。
今年随着生成式AI的大火,虚拟主播成为一种流行。国信证券与火山引擎合作了AI虚拟人直播,以吉祥物阳阳为原型,采用火山引擎提供的AIGC技术,围绕投资者关心的内容自动生成AI短视频,由3D 虚拟人担任主播进行全天候的投资咨询和行情解读服务。通过AIGC技术,实时读取行业板块、大盘指数和资讯热点,结合自研的数据视频自动渲染合成动画特效技术,实现直播视频的自动定时生成内容。此外,通过一些预设的模板,直播间会有数据图表、动画特效、自动字幕等形式帮助用户提升观感。
不仅如此,AIGC还给虚拟主播赋予更多人格,设计了27款表情和动作,并全方位覆盖和还原了行情播报场景所需的动作和表情库。3D虚拟人主播可实现高精度的唇形及表情驱动,能预测并控制音色的重音、停顿,赋予音色多样的语气,演绎出更加真实生动的播报效果。
ChatGPT带火了大模型,AIGC是最快落地的一个场景。今天,已经到了人人都是创作者的时代。不仅每个人都喜欢随手拍、随手发,企业的内容创作也大爆发,比如一个车企,不仅有官方的APP内容,还有视频平台的内容,矩阵号,员工号,经销商号,企业内宣,等等。
内容无处不在,从拉新、促活、转化的维度为企业创造着更大的增量。
抖音商家通过精彩的短视频或是生动的直播实现拉新,汽车之家通过内容社区互动不断沉淀更多的新用户;金融行业数字人直播通过内容促活,激发业务增长;自如通过VR看房提升效率的同时,也大大增加了转化率。
内容的爆发,对创作工具有了更高的要求:自动生成内容,无需人工剪辑,激发更多创意,批量生产,多个帐号运营……为了帮助企业高效生产内容,火山引擎智能创作云为企业提供体系化的内容生产工具,涵盖从创意策划、内容制作、内容管理、内容发布、数据反馈的创作全流程。
今天人们都在讨论大模型的时候,火山引擎已经逐步让AI在内容生产的全流程落地,AIGC可以实现脚本撰写、改写、扩写,数字人分身技术可以让每一个员工都有一个数字备份,AI可以快速制作海报,视频的自动生成,通过文字自动生成图片,这些AI工具大大地解放了生产力,让企业有了更大胆的创新空间。
相信很快,在火山引擎视频云的支持下,更多的行业创新将涌现出来。
【结束语】
谭待表示:“在新基石的技术演进过程中,我们面临三大边界限制:首先,一面是更高清、更交互、更沉浸的视频体验成为用户需求常态,而另一面是技术突破天花板见顶,导致我们面临技术的边界限制;其次,当视频化已经成为应用标配,一面是快速试错验证模式,而另一面是应用接入复杂度高,导致我们面临效率的边界限制;最后,随着视频化在细分行业不断渗透,一方面视频场景需求碎片,而另一面是行业方案场景化能力弱,形成行业融合的边界限制。”
作为新基石的代表,火山引擎视频云不断努力,从底层技术创新、开放架构、场景落地等维度,全方面助力行业创新,实现科技带来的增量空间。在视频把每个行业重新做一遍的过程中,火山引擎视频云成为必不可少的一个角色。
关键词: