[ComfyUI]腾讯开源黑科技Sonic,插件更新,更加可控啦

news/2025/2/15 13:27:10/

一、Sonic更新介绍

大家还记得我前分享过腾讯开源的Sonic这个项目吧,通过照片+声音就可以生成非常不错的数字人开口说话的视频。

当时我就挺满意的,不过那时候输出还只能输出正方形的视频,这点就让我留有遗憾。

今天我再去翻作者的项目官网,我发现作者给力,把这块给更新了,现在支持非正方形的输出了,爱了爱了。

今天给大家说一下修改的地方,参数有了一些小调整。

二、详细说明

工作流稍微改了一点,主要是里面的参数,大家直接看我这个最新工作流截图:

我把变动点说一下:

SONICTLoader 节点变简单了,不需要自己配置路径
参数默认按我截图设置即可。

SONIC_PreData:这个节点核心参数多了一个duration,这个就是截取视频时长的意思,单位为秒。我这里直接把视频里面的时长传递过来了。

然后最重要的是现在min_resolution这个参数就对应最短边了,不会全部裁剪成正方形输出了。

最后,主模型要选择svd_xt_1_1.safetensors了,这个模型之前也需要,把它拷过来放到 ComfyUI/models/checkpoints

另外sonic这个模型还要

三、云端镜像

大家如果没有本地 ComfyUI 环境,或者本地显卡配置低于 16G 的,可以使用嘟嘟部署的仙宫云镜像,可直接加载使用。后续分享的工作流都会更像到镜像中,一周更新一次,方便大学学习。

目前整合了2个镜像,一个是Flux绘图用的,另外一个是针对视频模型的,之所以分开是一些模型兼容问题,分开比较好处理。

今天这个数字人案例已经弄到镜像上了,欢迎体验。

镜像名称:嘟嘟AI绘画趣味学


云平台镜像地址:

https://www.xiangongyun.com/image/detail/d961a7dc-ade3-4bd5-a7c6-92ac49ff5e4b?r=37BCLY

https://www.xiangongyun.com/image/detail/81716d29-4461-4b0b-ba4b-7b9b7dd569d3?r=37BCLY

新用户通过邀请码注册,总共可获得 8 元奖励,体验 4 个小时的 4090 作图时长

四、总结

这就是Sonic的更新介绍了,效果我还是很满意的,感觉可以用来搞东西玩了。
后面给大家介绍一些声音克隆的软件,结合起来效果就很好。
上个用CosyVoice V2克隆声音的画面。


技术的迭代是飞快的,要关注最新的消息才不会掉队。​

嘟嘟每天分享最新的ComfyUI技术前沿。​

本篇中的工作流和模型网盘链接:https://pan.quark.cn/s/dd5da20b5287

我是嘟嘟,专注于 AI 绘画以及 AI 工具分享,欢迎来一起交流。​

如果觉得文章有帮助,请帮忙点赞收藏关注一下呦~​


http://www.ppmy.cn/news/1572250.html

相关文章

Git标签管理:从基础到高阶自动化实践

引言 在软件发布过程中,88%的生产事故与版本标记错误相关。Git标签(Tag)作为版本控制的关键锚点,不仅是发布流程的里程碑,更是代码审计和问题追溯的重要依据。本文将深入Git标签的底层机制,揭示企业级标签…

100.18 AI量化面试题:如何评估DeepSeek等模型的生成质量?请列举常用的评估指标及其计算方法

目录 0. 承前1. 解题思路1.1 评估维度1.2 评估方法维度1.3 应用场景维度 2. 自动评估指标2.1 基础文本相似度指标2.2 语义相似度指标 3. 人工评估框架3.1 评估维度设计3.2 评估流程设计 4. 特定任务评估4.1 对话质量评估4.2 代码生成评估4.3 文本摘要评估 5. 综合评估框架5.1 多…

【Python的FastAPI 与 Uvicorn】快速启动你StableDiffusion模型Web 应用

Uvicorn是什么? Uvicorn是一个基于ASGI(Asynchronous Server Gateway Interface)规范的轻量级服务器,用于运行异步Python web应用。它特别适合与FastAPI和Starlette等现代Python web框架一起使用。 Uvicorn的主要特点包括&#…

Python爬虫-猫眼电影的影院数据

前言 本文是该专栏的第46篇,后面会持续分享python爬虫干货知识,记得关注。 本文笔者以猫眼电影为例子,获取猫眼的影院相关数据。 废话不多说,具体实现思路和详细逻辑,笔者将在正文结合完整代码进行详细介绍。接下来,跟着笔者直接往下看正文详细内容。(附带完整代码) …

用vue3写一个好看的wiki前端页面

以下是一个使用 Vue 3 Element Plus 实现的 Wiki 风格前端页面示例&#xff0c;包含现代设计、响应式布局和常用功能&#xff1a; <template><div class"wiki-container"><!-- 头部导航 --><el-header class"wiki-header"><d…

macOs在vscode编辑器的cmd中,比如npm i 总是提示权限不够需要sudo

mac Os Apple M2 Pro在vscode 编辑器的cmd中比如npm i 总是提示权限不够&#xff0c;总要sudo npm i : 报错如下&#xff1a; npm warn peer webpack"^2.0.0 || ^3.0.0 || ^4.0.0" from the root project npm error code EACCES npm error syscall open npm error p…

React源码解读

配置React源码本地调试环境 本次环境构建采用了node版本为16、react-scripts 版本号为 3.4.4&#xff0c;源码下载地址 react源码调试: react源码调试环境 使用 create-react-app 脚手架创建项目 npx create-react-app react-test 进入刚刚下载的目录&#xff0c;弹射 crea…

第 14 天:UE5 C++ 与蓝图(Blueprint)交互!

&#x1f3af; 目标&#xff1a; ✅ 了解 C 与蓝图&#xff08;Blueprint&#xff09;交互的方式 ✅ 在 C 中调用蓝图函数 ✅ 让蓝图访问 C 变量和方法 ✅ 使用 UFUNCTION、UPROPERTY 进行蓝图暴露 ✅ 提高开发效率&#xff0c;让 C 和蓝图开发者高效协作 1️⃣ 为什么要让 C…