总台央视听媒体大模型技术实践
通过生成对抗网络(GANs)、潜在扩散模型(Latent Diffusion Models)等技术,分析学习不同时期、地区和文化背景下的艺术风格,进而创作出雕塑、书法、绘画等风格奇幻的视觉影像
通过生成对抗网络(GANs)、潜在扩散模型(Latent Diffusion Models)等技术,分析学习不同时期、地区和文化背景下的艺术风格,进而创作出雕塑、书法、绘画等风格奇幻的视觉影像
“人人皆可创作”的趋势下,专业工具学习曲线陡峭。调查显示,超过 60% 的一线视频制作人员因工具壁垒无法将创意转化为视频,导致大量商业想法因无法被快速验证而错失市场良机。
媒体库(FFmpeg)、播放器(VLC)、流媒体服务器(SRS)、传输协议(WebRTC、SRT)等媒体框架、媒体服务器、开放Codec、播放器、传输协议等多个方面以FFmpeg为例:腾讯2019~2022向社区提交的Patch数目 > 610个,被merge的Patch > 300 个,是社区前10的贡献者
实验室负责推动最新的国际和国内视频标准制定,持有数百项标准必要专利。近年在视频领域的应用方向产生了大量有影响力的技术成果...
任何产品的成功取决于零售商业场景的成败——人工智能和视力友好也不例外, 现阶段人工智能和视力友好在零售商业场景中都困难重重, 对人工智能+视力友好的预期——不是抱团取暖,而是碰撞出燎原的星火, 人工智能+视力友好的闭环,需要用户体验的催化和链接
强化推理链路与记忆机制、向长上下文与个性化发展; 安全性、可控性、节能性成为重点研究方向; 从“能力增强”迈向“系统演化”。