## 7. 收费服务 微信:wxwubug 备注需求 Email: lipku@foxmail.com Telegram: https://t.me/livetalking ### 7.1 wav2lip高清版 对wav2lip网络结构做了升级优化;音频特征改为hubert;用lstm网络添加前后帧关联。 分为两个版本: 1. 192 在显卡3060上能达到实时,价格¥2000. 2. 384 在显卡4070上能达到实时,价格¥3000. 该价格提供192和384两个版本模型,购买过192模型的用户可以加¥1000升级到384 btw:高清模型使嘴型准确、牙齿清晰,不是使视频高清。视频高清需要提高原始视频分辨率,修改aiortc中h264.py提高编码码率。 ### 7.2 功能优化 1. avatar视频不限时长 通过cache管理图片内存,只加载最近需要用到的图片,显著降低内存占用。支持不限时长的avatar视频,适用于特定场景使用如直播 2. vue客户端 提供vue前端代码,支持数字人透明背景。客户端下载 3. python客户端 独立视频窗口显示,提供python接口交互,更方便与python项目集成如直播场景。 4. 语音交互 (1)数字人说话过程中用唤醒词打断提问 (2)数字人说话过程中不被其他杂音干扰 (3)可以检测到数字人回答完一个问题 5. avatar实时切换 交互过程中可以实时切换avatar形象,适合根据不同场景做不同动作。与动作编排的区别:动作编排只能播放提前录制好的音视频;avatar切换在播放动作时可以让数字人说指定的话。 6. 多数字人同时出镜 同一个画面支持多个数字人对话,通过api指定数字人说话和对应音色 7. 摄像头驱动数字人动作和表情 主播在摄像头前不用说话,可以做表情和动作,通过api驱动主播唇形同步