Python web实战之 Django 的 ORM 框架详解

news/2024/10/22 14:44:57/

8d8e8b4196f2412ba8d5e7e961cf7823.png


本文关键词:Python、Django、ORM。

概要

在 Python Web 开发中,ORM(Object-Relational Mapping,对象关系映射)是一个非常重要的概念。ORM 框架可以让我们不用编写 SQL 语句,就能够使用对象的方式来操作数据库,大大提高了代码的可读性和可维护性。Django 作为一款流行的 Web 框架,自带了强大的 ORM 框架。

本文将会详细介绍 Django 的 ORM 框架,包括基本使用方法、高级查询、性能优化等方面。


 

1. 基本使用方法

1.1 定义模型类

在 Django 里可以使用模型类来定义数据库表。模型类需要继承自 django.db.models.Model,并且定义表的各个字段。例如,下面是一个简单的模型类,用来表示一个博客文章:

from django.db import modelsclass Blog(models.Model):title = models.CharField(max_length=100)content = models.TextField()pub_date = models.DateTimeField(auto_now_add=True)

上面的代码定义了一个 Blog 类来表示博客文章。这个类继承自 django.db.models.Model,并且定义了三个字段:标题、内容和发布日期。其中,标题和内容都是字符串类型,使用 CharField 和 TextField 来定义。pub_date 是一个日期时间类型,使用 DateTimeField 来定义。auto_now_add=True 表示在创建新记录时自动设置为当前时间。

1.2 创建表

定义完模型类之后,我们需要创建对应的数据库表。在 Django 中,可以使用 manage.py 命令来进行数据库迁移操作。具体来说,我们需要执行以下两个命令:

# 生成迁移文件
python manage.py makemigrations# 执行迁移操作
python manage.py migrate

执行完上面的两个命令之后,Django 会根据模型类自动生成对应的数据库表。

注意:在进行迁移操作之前,请确保已经仔细确认了所有相关设置和代码,并且备份了数据。

1.3 插入数据

插入数据可以使用模型类来表示一条记录,并且调用 save() 方法来将记录保存到数据库中。例如,下面的代码演示了如何向 Blog 表中插入一条记录:

blog = Blog(title='Hello World', content='This is my first blog post.')
blog.save()

1.4 查询数据

查询数据可以使用模型类的 objects 属性,该属性是 Manager 类的实例,提供了各种查询方法。例如从 Blog 表中查询所有记录:

blogs = Blog.objects.all()for blog in blogs:print(blog.title, blog.content, blog.pub_date)

1.5 更新数据

更新数据可以先查询出需要更新的记录,然后修改对应的字段,最后调用 save() 方法进行保存。例如将 Blog 表中所有记录的标题修改为 'Hello Django'

blogs = Blog.objects.all()for blog in blogs:blog.title = 'Hello Django'blog.save()

1.6 删除数据

删除数据可以先查询出需要删除的记录,然后调用 delete() 方法进行删除。例如删除 Blog 表中所有记录:

blogs = Blog.objects.all()for blog in blogs:blog.delete()

 

2. 高级查询

2.1 条件查询

Django 的 ORM 框架提供了非常方便的条件查询功能。例如查询 Blog 表中标题为 'Hello World' 的记录:

blogs = Blog.objects.filter(title='Hello World')for blog in blogs:print(blog.title, blog.content,blog.pub_date)

可以看到,我们使用了 filter() 方法来指定查询条件,其中 title='Hello World' 表示标题等于 'Hello World'filter() 方法返回一个 QuerySet 对象,可以使用 for 循环遍历查询结果。

2.2 聚合查询

聚合查询可以使用 aggregate() 方法来实现。例如统计 Blog 表中记录的数量:

from django.db.models import Countcount = Blog.objects.aggregate(Count('id'))
print(count['id__count'])

可以看到,我们使用了 aggregate() 方法来指定聚合操作,其中 Count('id') 表示统计 id 字段的数量。aggregate() 方法返回一个字典,其中键是聚合操作的名称(例如,id__count 表示统计数量),值是聚合操作的结果。

2.3 连接查询

连接查询可以使用 select_related() 方法和 prefetch_related() 方法来实现。例如,下面的代码演示了如何查询 Blog 表中的记录,并且同时连接查询关联的 Author 表中的作者信息:

class Author(models.Model):name = models.CharField(max_length=50)class Blog(models.Model):title = models.CharField(max_length=100)content = models.TextField()pub_date = models.DateTimeField(auto_now_add=True)author = models.ForeignKey(Author, on_delete=models.CASCADE)blogs = Blog.objects.select_related('author')for blog in blogs:print(blog.title, blog.content, blog.pub_date, blog.author.name)

可以看到,我们使用了 select_related('author') 方法来指定需要连接查询的外键字段(即 author 字段),这样就可以同时查询 Blog 表和 Author 表中的数据。注意,select_related() 方法只能用于一对一和多对一关系的查询,上面的例子是多对一关系。

2.4 原生 SQL 查询

Django 的 ORM 框架也支持原生 SQL 查询。例如使用原生 SQL 查询 Blog 表中的记录:

from django.db import connectionwith connection.cursor() as cursor:cursor.execute("SELECT * FROM myapp_blog")blogs = cursor.fetchall()for blog in blogs:print(blog[1], blog[2], blog[3])

可以看到,我们使用了 connection.cursor() 方法来获取数据库连接的游标,然后调用 execute() 方法执行 SQL 查询。最后,使用 fetchall() 方法获取查询结果。

 

3. 性能优化

3.1 使用索引

索引是提高数据库查询性能的重要手段。在 Django 中,可以使用 db_index=True 参数来为字段创建索引。例如为 title 字段创建索引:

class Blog(models.Model):title = models.CharField(max_length=100, db_index=True)content = models.TextField()pub_date = models.DateTimeField(auto_now_add=True)

3.2 批量操作

批量操作可以使用 bulk_create() 方法和 bulk_update() 方法来实现。例如,下面的代码演示了如何批量插入 Blog 表中的记录:

blogs = [Blog(title='Blog 1', content='Content 1'),Blog(title='Blog 2', content='Content 2'),Blog(title='Blog 3', content='Content 3'),
]Blog.objects.bulk_create(blogs)

可以看到,我们使用了 bulk_create() 方法来批量插入记录,其中 blogs 是一个包含多个 Blog 实例的列表。

3.3 延迟加载

延迟加载可以使用 defer() 方法和 only() 方法来实现。

使用 defer() 方法时,Django 将不会立即从数据库中获取指定字段的数据。它会在需要访问这些字段的数据时,再去查询数据库。这样可以避免一次性从数据库中取出大量的数据,减轻数据库的负担,提高查询效率。

使用 only() 方法可以指定只查询需要的字段,而不是查询整个表的所有字段。这样可以减少数据传输的大小,节省网络带宽和内存资源,提高查询效率。

例如延迟加载 Blog 表中的记录,并且只查询 title 和 pub_date 两个字段:

blogs = Blog.objects.defer('content').only('title', 'pub_date')for blog in blogs:print(blog.title, blog.pub_date)

可以看到,我们使用了 defer('content') 方法来延迟加载 content 字段,这样查询结果中就不会包含 content 字段的数据。同时,使用 only('title', 'pub_date') 方法来指定只查询 title 和 pub_date 两个字段的数据。

3.4 缓存查询结果

缓存查询结果可以使用 Django 的缓存框架来实现。Django的缓存框架可以配置为使用不同的缓存后端,下面是常见的几种缓存后端的配置方法:

3.4.1 内存缓存

使用内存缓存作为缓存后端是最简单的配置方式,它可以快速地缓存数据并且不需要额外的配置。在settings.py文件中进行如下配置:

CACHES = {'default': {'BACKEND': 'django.core.cache.backends.locmem.LocMemCache','LOCATION': 'unique-snowflake',}
}

BACKEND 指定了缓存后端为内存缓存,LOCATION 是一个可选的参数,用于指定缓存的名称,可以是任何字符串。

3.4.2 文件缓存

使用文件缓存作为缓存后端可以将缓存数据存储到文件系统中,需要指定缓存文件的路径。在settings.py文件中进行如下配置:

CACHES = {'default': {'BACKEND': 'django.core.cache.backends.filebased.FileBasedCache','LOCATION': '/var/tmp/django_cache',}
}

BACKEND 指定了缓存后端为文件缓存,LOCATION 是一个必选的参数,用于指定缓存文件的路径。

3.4.3 Memcached

使用Memcached作为缓存后端可以将缓存数据存储到Memcached服务器中,需要指定Memcached服务器的地址和端口号。在settings.py文件中进行如下配置:

CACHES = {'default': {'BACKEND': 'django.core.cache.backends.memcached.MemcachedCache','LOCATION': '127.0.0.1:11211',}
}

BACKEND 指定了缓存后端为Memcached,LOCATION 是一个必选的参数,用于指定Memcached服务器的地址和端口号。

3.4.4 Redis

使用Redis作为缓存后端可以将缓存数据存储到Redis服务器中,需要指定Redis服务器的地址、端口号和数据库编号。在settings.py文件中进行如下配置:

CACHES = {'default': {'BACKEND': 'django_redis.cache.RedisCache','LOCATION': 'redis://127.0.0.1:6379/0','OPTIONS': {'CLIENT_CLASS': 'django_redis.client.DefaultClient',},}
}

BACKEND 指定了缓存后端为Redis,LOCATION 是一个必选的参数,用于指定Redis服务器的地址、端口号和数据库编号。OPTIONS 是一个可选的参数,用于指定Redis客户端的选项,这里使用默认选项。

需要注意的是,在使用Redis作为缓存后端时,需要额外安装 django-redis 库。可以使用pip命令进行安装:

pip install django-redis

例如缓存 Blog 表中的记录:

from django.core.cache import cacheblogs = cache.get('blogs')if blogs is None:blogs = Blog.objects.all()cache.set('blogs', blogs, timeout=3600)for blog in blogs:print(blog.title, blog.content, blog.pub_date)

可以看到,我们使用了 cache.get('blogs') 方法来从缓存中获取查询结果。如果缓存中不存在查询结果,则使用 Blog.objects.all() 来查询数据库,并且使用 cache.set('blogs', blogs, timeout=3600) 方法将查询结果存入缓存中。其中,timeout=3600 表示缓存的过期时间为 3600 秒。

 

技术总结

本文详细介绍了 Django 的 ORM 框架,包括基本使用方法、高级查询和性能优化等方面。ORM 框架可以让我们不用编写 SQL 语句,就能够使用对象的方式来操作数据库,大大提高了代码的可读性和可维护性。同时,我们还介绍了一些性能优化技巧,例如使用索引、批量操作、延迟加载和缓存查询结果等。希望本文对你学习 Django 的 ORM 框架有所帮助!

 

欢迎点赞收藏转发,感谢🙏

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


http://www.ppmy.cn/news/1000593.html

相关文章

无人驾驶实战-第一课(自动驾驶概述)

在七月算法上报了《无人驾驶实战》课程,老师讲的真好。好记性不如烂笔头,记录一下学习内容。 ————————————————————————————————————————— 无人驾驶汽车的定义: 无人驾驶汽车是可载人的移动智能机器…

LeetCode ACM模式——哈希表篇(二)

刷题顺序及思路来源于代码随想录,网站地址:https://programmercarl.com 202. 快乐数 编写一个算法来判断一个数 n 是不是快乐数。 「快乐数」 定义为: 对于一个正整数,每一次将该数替换为它每个位置上的数字的平方和。然后重复…

MATLAB算法实战应用案例精讲-【自动驾驶】路径规划(补充篇)

目录 前言 几个高频面试题目 无人车运动规划,路径规划,轨迹规划的区别和联系?

【css】css位置布局position

position 属性规定应用于元素的定位方法的类型。元素其实是通过使用top、bottom、left 和 right 属性来定位的。但是,需要首先设置了 position 属性,否则这些属性将不起作用。根据不同的 position 值,它们的设置特点不同。 其有五个不同的位…

自然语言处理学习笔记(二)————语料库与开源工具

目录 1.语料库 2.语料库建设 (1)规范制定 (2)人员培训 (3)人工标注 3.中文处理中的常见语料库 (1)中文分词语料库 (2)词性标注语料库 (3…

AI工程师的崛起:填补AI革命中的空白

在一个拥有大约5000名语言学习模型(LLM)研究员,但大约有5000万软件工程师的世界中,供应限制决定了一种新型专业人才—AI工程师的迅猛增长。他们的崛起不仅仅是一种预测,更是对科技世界动态变化的必然反应。AI工程师作为…

企业内网终端安全无客户端准入控制技术实践

终端无代理/无客户端准入控制技术因其良好的用户体验而倍受创新企业的青睐。无代理/无客户端准入控制技术,顾名思义,是一种在网络中对终端实施访问控制的方法,无需依赖特定的客户端软件。 不同于银行、医院等传统行业的终端准入控制需求&…

QT遍历文件夹读取文件名

一、获取文件夹下的所有文件名 可以使用QDir类的entryList()函数获取文件夹下的所有文件名: QDir dir("folder_path"); QStringList files dir.entryList(QDir::Files);Copy 其中,folder_path为文件夹的路径,files为获取到的所有…