调用百度API实现图像风格转换

news/2024/11/21 1:28:30/

目录

  • 1、作者介绍
  • 2、基本概念
    • 2.1 人工智能云服务与百度智能云
    • 2.2 图像风格转换
  • 3、调用百度API实现图像风格转换
    • 3.1 配置百度智能云平台
    • 3.2 环境配置
    • 3.3 完整代码实现
    • 3.4 效果展示
    • 3.5 问题与分析

1、作者介绍

张元帮,男,西安工程大学电子信息学院,2022级研究生
研究方向:语音信号处理
电子邮件:2899460070@qq.com

陈梦丹,女,西安工程大学电子信息学院,2022级硕士研究生,张宏伟人工智能课题组
研究方向:机器视觉与人工智能
电子邮件:1169738496@qq.com

2、基本概念

2.1 人工智能云服务与百度智能云

人工智能云服务是一种基于云计算、虚拟化和分布式处理技术的在线服务,提供了各种人工智能相关的功能,包括自然语言处理(NLP)、图像识别、声音识别、机器学习、深度学习等。人工智能云服务通过API的方式对外提供接口,用户可以通过调用这些API来使用相应的人工智能功能,而无需在本地搭建和维护复杂的人工智能系统,可以简化开发流程,缩短研发时间,并且具有良好的可扩展性和兼容性。目前,市面上存在多种人工智能云服务提供商,例如百度、阿里、腾讯、华为等。百度智能云是百度提供的一系列云端API接口,其中就包括人工智能云服务,可以用于实现文本分析、图像识别、语音识别和自然语言处理等各种应用场景。

2.2 图像风格转换

图像风格转换是一种利用深度学习和神经网络模型来实现图片风格转换的技术。该技术可以将一张图片按照指定的艺术风格进行重构,使得原图片的内容保留不变,同时又呈现出了与所选艺术风格相似的视觉效果。
在这里插入图片描述
通俗地说,就是将一张照片做成另一个不同风格的照片。例如:将一张普通的花卉照片以著名画作《向日葵》的风格呈现出来。这种技术常常被应用于数字艺术、电影制作、游戏动画等领域。

其中,百度智能云的API支持将图像转化成卡通画、铅笔画、彩色铅笔画,或者哥特油画、彩色糖块油画、呐喊油画、神奈川冲浪里油画、奇异油画、薰衣草油画等共计9种风格。下面演示如何使用百度智能云的API接口实现图像风格转换。

3、调用百度API实现图像风格转换

3.1 配置百度智能云平台

注册并登录百度智能云账号进入下图界面,选择右上角“控制台”模块:
在这里插入图片描述
选择“产品服务”中“人工智能”模块的“图像增强与特效”项目:在这里插入图片描述
点击领取免费的接口资源(实名认证后可获取):
在这里插入图片描述

选择全部可领接口,然后点击0元领取(这里已经领取,不能再领)在这里插入图片描述
“应用列表” 中点击 “创建应用”,免费创建图像风格转换模块:
在这里插入图片描述
创建成功的应用模块如下,从中可以获取个人应用模块的**API Key和Secret Key**:
在这里插入图片描述

3.2 环境配置

代码使用python3运行,导入的模块有Requests、base64、json、PIL、io、os。在运行代码前,需要检查运行环境是否齐全。以下是对这些导入模块的介绍:

  • Requests是Python编程语言第三方库,用于发送 HTTP 请求和处理响应。它是一个常用的Python HTTP客户端库,可以发送HTTP/1.1请求,包括GET、POST、PUT、DELETE等请求方法。
  • base64库是Python标准库之一,提供了一些用于将二进制数据(比如图片、音频、视频文件等)转换为 ASCII 字符集中可打印字符的编码方法,以便在网络中传输或存储。
  • Json库是Python语言自带的标准库之一,用于将Python对象(如列表、字典等)转换为JSON格式的字符串以及将JSON格式的字符串转换为Python对象。
  • PIL(Python Imaging Library)是Python编程语言中一个常用的图像处理库。这个库通过内置的图片格式扩展模块及自带的工具,可以对常见的图像文件进行读写并进行多种基本的图像处理操作。
  • Python标准库中的io库提供了一个通用的Python I/O体系结构,可以轻松地访问各种类型的文件(文本文件、二进制文件、管道和套接字等),并统一这些不同文件类型的输入输出操作。
  • os库是Python标准库提供的操作系统接口库,它封装了大量实用的函数来和操作系统交互。通过该库,我们可以实现一些常见的文件和目录相关的操作、操作系统平台相关功能的调用、进程相关操作等等。

3.3 完整代码实现

在代码的指定位置填入API_Key、Secret_Key、图片位置、风格,然后运行代码。其中可选风格如下:

  • cartoon:卡通画风格
  • pencil:铅笔风格
  • color_pencil:彩色铅笔画风格
  • warm:彩色糖块油画风格
  • wave:神奈川冲浪里油画风格
  • lavender:薰衣草油画风格
  • mononoke:奇异油画风格
  • scream:呐喊油画风格
  • gothic:哥特油画风格

代码实现:

import requests
import base64
import json
from PIL import Image
import io
import os###############修改这里,然后运行##################
"""
可选图片风格:
cartoon:卡通画风格
pencil:铅笔风格
color_pencil:彩色铅笔画风格
warm:彩色糖块油画风格
wave:神奈川冲浪里油画风格
lavender:薰衣草油画风格
mononoke:奇异油画风格
scream:呐喊油画风格
gothic:哥特油画风格
"""API_Key=' 你的API_Key '            #API_Key
Secret_Key=' 你的Secret_Key '      #Secret_Keyimg_location='picture.png'                      #图片放置位置
style="warm"                                    #图片风格
###############################################class BaiduImgStyleConv:def __init__(self, API_Key,	Secret_Key,request_url,headers):self.req_url = request_urlself.AK=API_Keyself.SK=Secret_Keyself.headers=headersdef set_para(self,img_location,style):'''该方法实现图片和风格设置'''try:f = open(img_location, 'rb')    #尝试打开图片except:print("错误:没有找到图片或者图片格式不支持,请检查图片路径")#无法打开图片exit()img = base64.b64encode(f.read())# 二进制方式打开图片文件if style in {'cartoon','pencil','color_pencil','warm','wave','lavender','mononoke','scream','gothic'}:#检测风格是否在列表中self.params = {"image": img, "option": style}else:print("错误:图像风格不对,请检查拼写")exit()def get_accessToken(self):'''该方法实现获得Token'''host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + self.AK + '&client_secret=' + self.SKresponse = requests.get(host, headers=self.headers)json_result = json.loads(response.text)try:print('token获取正常=',json_result['access_token'])return json_result['access_token']except:print('token获取出现问题,这是错误原因:',json_result['error'], json_result['error_description']+'\n建议先检查百度智能云的图像风格转换应用是否可用,其次保证上面的API_Key和Secret_Key填写正确')exit()def get_convImg(self):'''该方法实现图像风格转换'''access_token = self.get_accessToken()request_url = self.req_url + "?access_token=" + access_tokenresponse = requests.post(request_url, data=self.params, headers=self.headers)#获取响应if response:# 解码base64编码图片并保存为jpg格式img_data = base64.b64decode(response.json()['image'])pil_image = Image.open(io.BytesIO(img_data))pil_image.show()# 保存为jpg格式,并以log_id命名文件output_filename = str(response.json()['log_id']) + ".jpg"pil_image.save(output_filename, "JPEG")print("转换后的图片已保存在",os.getcwd()+'\\'+output_filename)else:print('错误:解析返回数据时出现问题')if __name__=='__main__':#实例化对象img_conv=BaiduImgStyleConv(API_Key=API_Key,Secret_Key=Secret_Key,request_url = "https://aip.baidubce.com/rest/2.0/image-process/v1/style_trans",headers={'content-type': 'application/x-www-form-urlencoded'})#设置图片和风格img_conv.set_para(img_location=img_location,style=style)#得到转换后的图片img_conv.get_convImg()

3.4 效果展示

下图为原图经不同风格(卡通、铅笔、呐喊)转换后的效果图:
在这里插入图片描述

3.5 问题与分析

  • 已对部分常见报错在代码中进行了解释,根据要求检查即可。
  • 弹出“token获取出现问题……”,这一般是因为百度智能云没设置好或者key填错了导致的,如果确定两个key没有填错,务必检查API调用的余量

http://www.ppmy.cn/news/82770.html

相关文章

提高生产效率,掌握VSCode使用技巧

VSCode是一款非常好用的编辑器,提供了丰富的功能和工具,能够帮助开发者提高生产效率。本文介绍了VSCode常用的快捷键、自定义设置、快速编辑、插件扩展和调试功能等技巧,帮助用户更好地掌握和使用VSCode,打造高效的开发环境&#…

CMake Practice 学习笔记二---子目录、安装

让前面的Hello World更像一个工程: 为工程添加一个子目录src,用来放置工程源代码;添加一个子目录doc,用来反之这个工程的文档hello.txt;在工程目录添加文本文件COPYRIGHT,README;在工程目录添加…

探究ChatGPT与GPT-4的缺陷不足,揭示大预言LLM模型的局限性——没有完美的工具

目录 ChatGPT与GPT-4的缺陷不足——任何工具都不是万能的1. 引言2. 事实性错误2.1 问题示例2.2 原因分析2.3 解决方法 3. 实时更新3.1 问题示例3.2 原因分析3.3 解决方法 4. 总结 参考资料其它资料下载 ChatGPT与GPT-4的缺陷不足——任何工具都不是万能的 1. 引言 2022 年末 C…

通过nginx解决vue项目打包后跨域代理失效问题

这里 我的接口是写在 http://localhost:80上的 接口名是user 需要一个id路径参数 我们知道 80是默认 所以就可以不带端口因此访问就是http://localhost/user/1 然后 我vue项目中的 vue.config.js 配置如下 const { defineConfig } require(vue/cli-service) module.exports …

第14章_视图

第14章_视图 1. 常见的数据库对象 对象描述表(TABLE)表是存储数据的逻辑单元,以行和列的形式存在,列就是字段,行就是记录数据字典就是系统表,存放数据库相关信息的表。系统表的数据通常由数据库系统维护,程序员通常不…

基于SOPC的音乐播放系统设计

1 目的 1. 让自己能真正用SOPC做出一个实际的定西,学习基于SOPC的嵌入式软件开发的基本流程; 2. 了解一些比较实用的定西,比如SD卡,VS1003,TFT等,并且能做到同时操作,而不…

算法修炼之练气篇——练气一层

博主:命运之光 专栏:算法修炼之练气篇 前言:每天练习五道题,炼气篇大概会练习200道题左右,题目有C语言网上的题,也有洛谷上面的题,题目简单适合新手入门。(代码都是命运之光自己写的…

多表联查及mybatis中@Results,@ResultMap注解的应用

在实际的项目中,为了保证数据的简洁和查询的效率,通常会到采用多表联查。 那么什么是多表联查呢? 一般查询语句都是针对一个表的,但是在关系型数据库中,表与表之间是有联系的,所以在实际应用中&#xff0…