7. 收费服务
微信:wxwubug 备注需求
Email: lipku@foxmail.com
Telegram: https://t.me/livetalking
7.1 wav2lip高清版
对wav2lip网络结构做了升级优化;音频特征改为hubert;用lstm网络添加前后帧关联。 分为两个版本:
192
在显卡3060上能达到实时,价格¥2000.384
在显卡4070上能达到实时,价格¥3000. 该价格提供192和384两个版本模型,购买过192模型的用户可以加¥1000升级到384
btw:高清模型使嘴型准确、牙齿清晰,不是使视频高清。视频高清需要提高原始视频分辨率,修改aiortc中h264.py提高编码码率。
7.2 功能优化
avatar视频不限时长
通过cache管理图片内存,只加载最近需要用到的图片,显著降低内存占用。支持不限时长的avatar视频,适用于特定场景使用如直播vue客户端 提供vue前端代码,支持数字人透明背景。客户端下载https://pan.quark.cn/s/d7192d8ac19b
python客户端
独立视频窗口显示,提供python接口交互,更方便与python项目集成如直播场景。语音交互
(1)数字人说话过程中用唤醒词打断提问
(2)数字人说话过程中不被其他杂音干扰
(3)可以检测到数字人回答完一个问题avatar实时切换
交互过程中可以实时切换avatar形象,适合根据不同场景做不同动作。与动作编排的区别:动作编排只能播放提前录制好的音视频;avatar切换在播放动作时可以让数字人说指定的话。多数字人同时出镜
同一个画面支持多个数字人对话,通过api指定数字人说话和对应音色摄像头驱动数字人动作和表情
主播在摄像头前不用说话,可以做表情和动作,通过api驱动主播唇形同步