36氪获悉,科大讯飞1024全球开发者节上,科大讯飞首次公开展示其多模态视觉交互技术和超拟人数字人能力。仅需一张照片,其超拟人数字人就可以与用户进行面对面的实时对话,口唇、表情、动作均由大模型自动生成,并能够充分匹配文本的意图。据官方介绍,本次超拟人数字人已在科大讯飞旗下的讯飞智作产品开通了内测通道。
36氪获悉,科大讯飞1024全球开发者节上,科大讯飞首次公开展示其多模态视觉交互技术和超拟人数字人能力。仅需一张照片,其超拟人数字人就可以与用户进行面对面的实时对话,口唇、表情、动作均由大模型自动生成,并能够充分匹配文本的意图。据官方介绍,本次超拟人数字人已在科大讯飞旗下的讯飞智作产品开通了内测通道。