
内容理解: AI内容理解不仅可以看到封面图、精彩剪辑或角色的场景,还可以帮助内容推荐、广告平台。 内容理解还有助于改进视频处理,例如为每个视频内容选择不同的编解码器,或者选择相关的编码工具。
图像增强:将SDR转换为HDR视频、将720p转换为1080p或将30帧/秒视频转换为60帧/秒。
AI和ABR:AI的出现可以进一步提高ABR的效果,最有名的要素是MIT提出的Pensieve。
语音识别与语音合成:从Siri到冰,从智能手机到智能音频,语音识别随处可见。 语音合成是计算机将文本转换为语音的方式,从而能够复原例如谷歌开源的Tacotron为99%的语音。
回声清除:对于某些低端Android设备,如果只有一个麦克风,则需要使用AI清除回声,效果非常好。
声纹―人声识别与音乐识别: DNN掌握更多声音特征,降低风险。 音乐识别没有多大的风险,各个音乐应用程序都综合了相关的功能。