时间: 2024-04-24 04:14:15 | 作者: 打印机
近日,美国软件巨头Adobe宣布,将在知名视频编辑软件Premiere Pro的新版本添加多款文生视频AI工具。近两个月震动全球科学技术圈的Sora,以及两款同种类型的产品Gen-2和Pika,都会在不久的将来加入“Adobe全家桶”。
有了Sora等第三方AI工具的助力,新版Premiere Pro除了编辑处理预先拍摄的常规视频外,还能按照每个用户输入的文本即时生成AI视频,并将两者融为一体。
Adobe放出了一条官方演示视频:一个男人走向窗前,观看整个城市的夜景。用户无需拍摄实景,只需输入一段文字,即可利用Sora生成一段城市雨夜的视频,并与前面的视频无缝衔接,效果几可乱线月初次亮相,OpenAI放出几段演示视频,但并未公布产品进展和上线时间。如今,
另一边,背靠抖音的视频剪辑软件剪映,同样朝着AIGC(人工智能生成内容)方向前行。但截至目前,剪映尚未拿出令人惊艳的成绩。
目前,剪映的AI玩法不少,包括一键成片、剪同款、AI克隆音色、数字人口播等,但并不具备根据文本直接生成视频的能力。它的海外版本Capcut在2月底推出文生视频功能,但效果距离Sora相去甚远。
如今,Sora除了在技术和产品上领先剪映,还得到了Adobe的青睐。Adobe在全球拥有超3300万付费用户;Sora接入“Adobe全家桶”,有望获取订阅收入分成,从而初步构建商业模式。
映,追赶Sora的难度将慢慢的变大。剪映被外界视为抖音搭上AIGC时代快车的关键筹码。得益于抖音的加持,剪映已成为用户量最大的手机视频剪辑软件之一,每天产出大量短视频;在此基础上更进一步,从UGC(用户生产内容)迈向AIGC,似乎水到渠成。
今年2月7日,抖音功勋老将张楠辞去集团CEO职务,亲自带队剪映。她在官宣职务变动的内部信中称,AI图像生成对她产生很大的触动,潜力巨大,并决定“放下一切”,义无反顾地出发。
剪映的发展根基不可谓不好,抖音的重视程度也很高。但两个多月过去,剪映依然没有过大动静,Sora反而继续高歌猛进。
字节八年前布局AI,成立了专门的实验室,招募大批业内精英,但成果却停留在内容审核、自动翻译、搜索服务等。2022年下半年,ChatGPT引爆行业;字节随即增加大模型投入,一口气推出AI聊天机器人等十几款应用,却迟迟没有拿出震动行业的技术和产品。
今年1月底的年度全员会上,字节CEO梁汝波感叹,字节“该有的大公司病全有了”。他特别点名AI业务,称:“公司层面的半年度技术回顾,直到2023年才开始讨论GPT,而业内做得比较好的大模型勇于探索商业模式的公司,都是在2018年至2021年创立的。”
剪映2019年上线年推出PC端的专业版。它显著拉低了UGC视频的创作门槛,普通人只需准备好素材、点击几下,就能生成一段质量尚可的视频,并一键发布至抖音。
此外,作为一款工具软件,剪映还带有一定的社区属性。除了官方提供的视频创作课堂外,用户还可以借鉴达人制作的视频模板进行创作,也就是“剪同款”。这有助于提高用户留存率和活跃度。
映仅用了三年就获得超1亿月活跃用户,跃升至同类软件的第一名。剪映海外版CapCut的增长同样惊人。
Capcut上线年,与TikTok关联密切。移动应用分析平台点点多个方面数据显示,目前Capcut的月活跃用户超2亿。另据市场调查与研究机构data.ai的数据,截至2023年8月,Capcut在iPhone和安卓端的用户超4.9亿,相当于TikTok全球用户量的1/4。
数据、算法和算力是AI大模型的三大基础要素,其中数据是根基。要想提升大模型的综合能力,就要一直“投喂”多模态数据,主要是网络文本、图像和视频。
OpenAI、Adobe等公司都不直接掌握数据,必须从第三方付费获取,成本不菲。据新闻媒体报道,OpenAI每年仅采购版权新闻文章授权的费用,就高达100万~500万美元;Adobe为了训练自家的文生视频大模型,以每分钟3美元的价格,向另一个大模型服务Midjourney购买视频片段。
相比之下,剪映在国内绑定抖音、在海外背靠TikTok,每天有大量用户使用它剪辑和上传视频。这让剪映能够以相对低廉的成本,接触到大量视频内容,为训练大模型、探索AI文生视频功能打下基础。
映并未研发出强大的AIGC能力,反而早早启动了商业化。剪映很早就上线了VIP会员,用户每月支付二三十块钱,能够正常的使用专属素材、精选模板等,AI玩法也被列为会员权益之一。根据官方介绍,AI玩法最重要的包含“无限创作”“无限运镜”和“瞬息宇宙”,基于现有视频素材进行AI美化编辑。
不难看出,剪映的AI玩法距离Sora这样的文生视频相去甚远。此外,它的收费也并不低廉:会员每月可获得1200积分,而使用一次“无限运镜”就需要480积分。积分耗尽后,用户都能够选择继续充值,兑换比例为1元:100积分。
剪映诞生之初的定位是,尽可能拉低短视频创作门槛,促进抖音UGC生态的繁荣。过去五年,它的确完成了这一任务,大量抖音爆款视频背后,都有剪映提供技术和模板。特别是那些趣味特效视频、踩点视频,抖音红人发布之后,大量用户迅速群起效仿、共同推高热度;没有剪映的帮忙,恐怕不易做到这一点。
映的天花板设定地太低了。它原本有机会成为Sora这样的划时代产品,却始终停留在视频剪辑软件的范畴。今年以来,剪映开始奋起直追,但先机已失、对手已至,追赶难度也迅速增大。剪映被Sora甩开,字节在AI领域仍然没能跳出“起大早、赶晚集”的怪圈。这也从侧面印证了梁汝波此前批评的“平庸的重力”。
映乃至整个字节AI板块的难题。剪映除了开设付费会员、将AI玩法纳入权益包,还在APP内增加了不少广告位。例如,用户点击“剪同款”,映入眼帘的除了手机照片和视频素材,还有悬浮在素材上方、几乎毫无关联的横幅广告。
作为一款用户破亿的工具软件,剪映的常规投入和金钱上的压力并不会特别大。它之所以早早发展会员和广告,或许与字节的做事风格和评判标准有关。
众所周知,字节是一家超快节奏、高度内卷的互联网巨头。如果个人、团队或业务无法迅速带来肉眼可见的产出,就非常有可能被调整,甚至彻底出局。
早在2016年,字节就设立了AI LabAI实验室,并引入多位学界和行业精英。彼时,OpenAI同样初出茅庐,正朝着通用AI的愿景前行,将自己视为非营利组织。
相比之下,AI Lab虽然名为“实验室”,实际上仍然需要密切配合和服务业务。它的官网宣称,其研究重点是开发为字节内容平台服务的新技术;具体领域则包括自然语言处理、数据挖掘、计算机视觉、机器学习等,且和抖音各业务板块贴合紧密。
随后几年,字节拿出了一系列AI工具,比如提供翻译服务的Byte Translator,AI写稿机器人Xiaomingbot,以及头条和抖音的搜索服务等。
直到2022年下半年,OpenAI多年磨一剑,ChatGPT席卷全球,生成式AI成为全世界科技公司竞逐焦点,字节才把更多精力投入到这一新浪潮中。
已经淡出字节一线管理的张一鸣,对AI产生强烈兴趣,并鼓励团队大举投入。他在2023年4月的一封内部信中称,“字节跳动无法错过AGI(通用AI)”,它是抖音和TikTok在全球发现新的增长机遇不可或缺的伙伴。
创始人发话后,字节各业务部门闻风而动。从那时起,字节陆续上线十多款AI产品,如豆包、话炉、扣子、Gauth等,剪映、飞书等也增添了AI功能。
豆包等产品均为现有AI技术的场景化应用,而非对于AGI的原生探索。例如,去年3月,微软上线 Copilot,全球办公软件市场为之震动。一个月后,飞书宣布即将上线AI助手“My AI”,以对话形式提供多种功能,包括优化和续写文字内容、创建日程、自动汇总会议纪要、搜索企业内部知识库等。
一年后,GPT已经在微软“全家桶”遍地开花,带动后者股价从250美元一路上涨至400美元以上。飞书却没能依靠My AI完成逆袭,反而在3月底宣布裁员。
又比如,Sora今年2月16日发布演示视频,CapCut一周后就宣布推出这一功能,每人每天可免费生成5段视频。CapCut的技术力显然无法与OpenAI比肩,其文生视频功能也较为简陋;仓促上线、对标Sora,不免带有蹭热点、强行完成KPI的味道。
从张一鸣点名AGI至今,字节AI又走过了一年,并未显著拉近与OpenAI的差距,甚至有扩大的趋势。
2023年11月,字节抽调多个部门的精兵强将,组建AI部门Flow。TikTok技术负责人朱文佳、字节产品与战略副总裁朱骏、字节技术副总裁洪定坤、飞书产品副总裁齐俊元均加入其中。
字节通过Flow统筹AI发展、消除重复建设的意图。目前,字节曝光度最高的AI产品——豆包、扣子、话炉等,均由Flow部门负责。剪映、飞书、大力教育等虽然也有AI业务,但声量已经逐渐被Flow盖过。
另一方面,字节云雀大模型已经打磨近一年时间,多模态大模型BuboGPT也取得进展,为Flow批量产出AI应用奠定根基。假以时日,Flow有望扭转字节AI总是慢人一步的局面。
不过,字节毕竟不是OpenAI,没有微软这样的超级金主。AGI固然重要,但对于现存业务的拉动尚不明显,需要更长时间的沉淀和打磨,才能释放商业经济价值;字节对AGI的投入不可能无止境,一定要考虑中短期的投入产出比。
短期来看,字节需要用钱、用人、用资源的地方很多,比如抖音货架电商、生活服务等,都需要大量真金白银。随之而来的现象是,
据Tech星球近日报道,抖音生活服务刚刚成立一支AI团队,希望利用AI技术创造增量业务价值,且已开启对相关AI产品的研发,包括搭建生活服务相关的内容创作平台等。
抖音生活服务之所以拉起这样一支队伍,或许与竞争对手美团和饿了么的动作有关。
美团近日开始小规模测试AI助手服务“问小袋”,可为用户推荐符合其需求的外卖商品,以及用餐建议。饿了么则在4月初面向零售行业商家发布“AI经营助手”,可为商家智能生成各类经营关键报表和关键数据。
在此情况下,不让美团饿了么专美于前,或许是抖音生活服务入局AI的基本目标之一。
在张一鸣和梁汝波的督促下,外界无需质疑字节做AI的决心。但倘若再过去一年、两年,字节仍然跟不上OpenAI的节奏和水准,那么它或许应思考另一种选择:退回“卖水者”的角色,做AGI训练素材提供商。
如前所述,数据是大模型的三大基础要素之一,而字节麾下的今日头条、抖音、TikTok等,已经积累了数以亿计的文本、图片和视频。字节可以用这一些数据训练自家大模型,也可优先考虑更进一步,在妥善解决安全和隐私问题的前提下,将其出售给OpenAI等第三方公司。
字节如今的现金牛——广告和电商业务,都建立在流量变现的基础上;如果把AI公司转变为新客户,那么字节心心念念的第二增长曲线问题将迎刃而解。另一方面,OpenAI既然能够与微软、Adobe合作,与字节合作也并非不可想象。毕竟,抖音和TikTok是Sora等AIGC服务最庞大的落地场景。倘若字节与OpenAI达成“竞合”关系,那么字节将跳出一步慢、步步慢的循环,在OpenAI的助力下搭上AI快车。
开36万元的小米SU7上班,遇到老板的奔驰E300L,同事纷纷驻足围观
136名NBA球员选文班亚马为DPOY、建队基石、最佳新秀,联盟新门面
男子车位被霸停5天一怒焊死引热议!当事人称属实没办法:对方叫嚣车多,开不开无所谓
春香漫溢四月天,太和书声绕梁间。在昆明市“最美公共文化空间”,体验一场书香盛宴。#第三届全民阅读大会...
三星Galaxy Z Fold 6/Z Flip 6可折叠手机新细节曝光
高通骁龙 X Plus 处理器规格提前泄露:配备 10 个 Oryon 核心
手机微信扫码
访问微信公众号官网