世界不是由一张张静态图片组成的,而是连续流动的视频。 但在过去很长一段时间里,AI 处理视频的方式却显得极其“笨拙”:先把视频解压成一帧帧图片,再像翻连环画一样去理解。这种行业惯例带来了巨大的算力浪费——毕竟,视频中90% 的信息都是冗余的 ...