VSP-LLM:可通过观察视频中人的嘴型来识别唇语

内容摘要2月28日 消息:VSP-LLM是一种通过观察视频中人的嘴型来理解和翻译说话内容的技术,也就是识别唇语。该技术能够将视频中的唇动转化为文本(视觉语音识别),并将这些唇动直接翻译成目标语言的文本(视觉语音翻译)。不仅如此,VSP-LLM还能智
 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备2021030705号-4