DataWhale10月动手实践——Bot应用开发task04学习笔记

server/2024/10/22 7:13:26/

一、图像流

1. 什么是图像流

图像流是一种直观的图像处理流程工具,用户可以灵活组合各类图像处理模块。该系统将不同的图像处理工具模块化,并通过可视化界面,将这些模块以拖拽方式组合,构建完整的处理流程。用户可以根据具体需求选择不同的处理模块,例如裁剪、亮度调整、滤镜添加等,并自由调整模块的顺序和参数,形成灵活的图像处理“流水线”,以实现最佳效果。

2. 图像流的组成

图像流是由多个工具节点组合而成的一整套流程。工具节点是组成图像流的基本单元。

3. 图像流的能力范围

COZE平台提供的图像流主要功能分为一下四类:

  1. 智能生成
    • 图像生成:通过文字描述/参考图生成图片。
    • 图像参考:为图像生成添加参考图,并设定参考条件。
  2. 风格模版
    • 风格滤镜:为你的照片创建风格化的滤镜,支持毛毡、粘土、积木、美漫、玉石、搞笑涂鸦风格。
    • 宠物风格化:为原图调整风格,适用于宠物场景。
  3. 智能编辑
    • 提示词推理:推理图像中可能包含的提示词。
    • 提示词优化:智能优化提示词图像。
    • 智能换脸:为图片替换参考图的人脸。
    • 背景替换:为图片替换背景图。
    • 光影融合:让画面融合。
    • 智能扩图:为图像扩充相应范围的内容。
    • 画质提升:提升图像清晰度。
    • 美颜:自动识别人脸,并智能变美
  4. 基础编辑
    • 画板:自定义画板排版,支持引用添加文本和图片。
    • 裁剪:自定义裁剪。
    • 调整:调整图片的亮度、对比度、饱和度。
    • 添加文字:为图片添加文字。
    • 叠图:为图片添加图片。
    • 旋转:旋转图片。
    • 缩放:缩放图片。

4. 图像流的应用方向

  1. AI生图:内置了生图模型,无需自建服务器,就可以用AI生图;
  2. 商品广告图案批量修改:无需PS,可快速实现广告图案的换脸、换衣服、换场景、换文案的多种修改操作,;
  3. 海报制作:高可控性画布,与AI生图搭配,可以制作精美的海报;
  4. 小红书等自媒体图文操作:可嵌入工作流中,进行图文生成,制作绘本、商业软文;
  5. 证件、写真、节日大头像照片:个人旅拍、节日头像等照片生成;

二、单词卡片生成Bot的实践

教程中看到,单词卡片由一下四元素组成:

  • 单词:字符形式,可以让用户输入单词,确定要解释的单词是什么
  • 单词解释:字符形式,可以让用户输入,也可以直接让大模型生成,目的是给单词添加解释
  • 图片:图片形式,和单词关联的图片,有智能生图组件生成
  • 背景:背景图

1. 创建图像流

创建一个生成单词卡片的工作流,可以将它拆结为一个处理用户的工作流和一个生成单词卡片的图像流的结合体。

首先可以点击左侧的资源库,再点击创建图像流

image-20241021203206299

图像流也是由开始,结束节点和其余节点组成的。

首先我们定义开始节点,设置两个参数,wordword_content,分别代表输入的单词和单词的解读。

image-20241021203352121

我们在插入一个提示词优化组件,对上一步的word_content进行修改。

image-20241021203441829

接着来到了我们的生图环节,我们插入一个图像生成组建,将上一插件的输出data作为输入引入,选择模型,设定图像的比例。

image-20241021203556181

紧接着我们需要将生成的图片与用户输入的wordword_img进行组合,可以使用画板插件来实现。将三个元素分别设置好来源,并点击下面的画板编辑,在画板中对三种元素进行组合。

image-20241021203742187

在结束节点中输出画板组件的output参数。

image-20241021203838821

试着运行一下上面的图像流,我们这里以moon为例。

image-20241021204029230

2. 创建工作流

我们可以使用工作流来对用户输入的word进行处理,从而为用户省去输入word_content这一描述信息的步骤。

首先我们按照如下图所示,设置开始节点。

image-20241021204207209

在这一步骤中,最关键的就是我们要使用大模型组件来代替之前的输入描述语句。我们可以插入一个大模型组件。我们设置input参数为上一组件中输入的word参数,并设置适当的用户提示词(Prompt),来让大模型生成必要的解释性信息。

image-20241021204316203

紧接着,我们插入一个刚才写好的图像流的节点,该节点接受开始节点传入的input以及大模型节点的output参数。输出生成的图片。

image-20241021204536924

我们将整个工作流连接起来,并测试,看看最终的效果。

image-20241021204627171

我们还是以moon为例,看看这次的输出结果。

image-20241021204742674


http://www.ppmy.cn/server/133828.html

相关文章

【图文指引】5分钟搭建Django轻量级框架服务

本篇内容为从零开始搭建一个Django项目,背景是windows系统且安装了最新版本的python3.13,至于python的相关安装过程省去,可自行查看其它教程。为了保证后续各项目之间依赖包隔离,以免产生冲突问题,首先配置虚拟环境。 …

XShell 中实现免密登录 Linux 服务器的详细流程

个人主页:Jason_from_China-CSDN博客 所属栏目:Linux系统性学习_Jason_from_China的博客-CSDN博客 所属栏目:Linux知识点的补充_Jason_from_China的博客-CSDN博客 XShell 中实现免密登录 Linux 服务器的详细流程: 一、在本地生成…

倍福TwinCAT程序中遇到的bug

文章目录 问题描述:TwinCAT嵌入式控制器CX5140在上电启动后,X001网口接网线通讯灯不亮,软件扫描不到硬件网口 解决方法:硬件断电重启后,X001网口恢复正常 问题描述:TwinCAT软件点击激活配置后,…

Yolo目标检测:Yolo v1简介

一、Yolo系列介绍 YOLO(You Only Look Once)是一种基于深度学习的目标检测算法,由Joseph Redmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题,通过一个神经网络直接预测目标的类别和位置。YOLO算法将输入图…

CloudStack图形化界面-创建资源域zone配置及正常关机

1.进入系统,创建资源域 打开浏览器访问http://192.168.100.10:8080/client (默认账户:admin / password) 直接跳过指南 2. 首页—》基础架构–》查看全部 在右上角—》添加资源域 基本–》名称: zone1 DNS:114.114.114.114 虚拟机管理程序:K…

补题:J. Robot Factory

传送门:Problem - 1600J - Codeforces 题意:给定一个二维矩阵,每个矩阵中的元素均为 [ 0, 15 ]的范围内,每个矩阵中的元素二进制位上为1时,就代表一堵墙(不能通过),求二维矩阵联通块…

Solon 3.0 新特性:HttpUtils 了解一下

Solon 3.0 引入一个叫 HttpUtils 小插件,这是一个简单的同步 HTTP 客户端,基于 URLConnection 适配(也支持切换为 OkHttp 适配)。使得编写 HTTP 客户端代码更加直观和易于阅读。 使用 URLConnection 适配时(大小为 40…

RestHighLevelClient操作es查询文档

目录 利用RestHighLevelClient客户端操作es查询文档 查询match_all dsl语句: ​编辑 java代码 小结 match字段全文检索查询 dsl语句 java代码 multi_match多字段全文检索查询 dsl语句 java代码 term精确查询 dsl语句 java代码 range范围查询 dsl语句 j…