dbt doc 生成文档命令示例应用

server/2024/10/18 1:29:40/

DBT提供了强大的命令行工具,它使数据分析师和工程师能够更有效地转换仓库中的数据。dbt的一个关键特性是能够为数据模型生成文档,这就是dbt docs命令发挥作用的地方。本教程将指导您完成使用dbt生成和提供项目文档的过程。

dbt doc 命令

dbt docs命令有两个子命令:generate和serve。generate命令用于创建项目文档,而serve命令用于在web浏览器中查看此文档。

  • 生成工程文档

要为dbt项目生成文档,在终端中导航到dbt项目的根目录,并运行以下命令:

dbt docs generate

该命令将为您的项目创建一个带有文档的静态站点。该站点包括关于您的模型、测试、源代码等的信息。

  • 项目文档服务

生成文档之后,您可以使用serve命令在本地查看它。在终端上运行以下命令:

dbt docs serve

这将启动web服务器实例,并在默认的web浏览器中打开文档。我们可以浏览文档以查看有关dbt项目的信息。

  1. 浏览文档

生成的文档提供了关于dbt项目的大量信息。您可以使用project /Database切换在项目文件夹层次结构视图和以数据库为中心的表和视图集合之间切换。您还可以使用搜索栏来查找项目中的特定模型。

  1. 数据血缘关系

dbt文档的强大特性是它能够可视化模型之间的关系。我们可以通过点击模型页面中的“Lineage”选项卡来访问这个特性。这将显示所选模型的上游或下游的所有模型的图表,提供数据沿沿性的清晰视图。
在这里插入图片描述

dbt docs 示例

假设我们dbt项目有一个简单的模型,可以将原始销售数据转换为更有用的格式。模型定义了名为sales.sql的文件中:

-- models/sales.sql
{{ config(materialized='table') }}select    order_id,    product_id,    customer_id,    quantity,    price,    quantity * price as total_price,    order_datefrom raw.sales

同时定义模型的描述文件,sales.yaml:

# models/schema.yml
version: 2models:  - name: sales    description: This table contains transformed sales data.    columns:      - name: order_id        description: The unique identifier for each order.      - name: product_id        description: The unique identifier for each product.      - name: customer_id        description: The unique identifier for each customer.      - name: quantity        description: The quantity of the product sold in the order.      - name: price        description: The price of the product.      - name: total_price        description: The total price of the order, calculated as quantity * price.      - name: order_date        description: The date the order was placed.

这里只是示例,当然可以使用中文,更符合用户习惯。

现在可以使用dbt docs generate为这个模型生成文档。在命令行界面中导航到dbt项目根目录并运行生成文档命令:

dbt docs generate

该命令将在dbt项目中生成**target目录。在这个目录中,可以找到manifest.jsoncatalog.json**文件。这些文件包含有关dbt项目的元数据,基于这些元数据能生成文档web网页。

接下来,我们可以使用dbt docs serve在本地启动文档服务:

dbt docs serve

该命令将启动一个web服务器,并打开文档默认web浏览器。在这里可以看到sales模型的文档页面,其中包含在sales.yaml描述文件中定义的所有列描述和其他信息。

总结

dbt docs命令是为dbt项目生成和提供文档的强大工具。通过使用这个命令,我们可以确保团队和其他相关人员能够访问数据模型的最新的、准确的文档信息。期待您的真诚反馈,更多内容请阅读数据分析工程专栏。


http://www.ppmy.cn/server/131287.html

相关文章

模板方法模式、策略模式(C++)

模板方法模式: 定义:定义一个操作算法的框架,实现步骤延迟到子类中去实现 策略模式: 定义:定义一系列的算法,把它们一个个封装起来,并且使它们可相互替换。该模式使得算法可独立于使用它的客户…

macOS Sequoia 15.0.1

macOS Sequoia 推出了一系列新功能,可助你在 Mac 上提高生产力和创造力。通过最新连续互通功能 iPhone 镜像,你可以在 Mac 上访问整个 iPhone。轻松平铺窗口快速打造理想工作空间,还可查看通过演讲者前置演示时即将共享的内容。经过重大更新的…

使用 iperf3 工具测试TCP/UDP吞吐量

测试目标 - 测试网络的 TCP 和 UDP 吞吐量性能,包括不同并发连接数和目标带宽条件下的表现。 测试环境 - **测试工具**: iperf3 - **固定 IP 地址**: - 服务器 IP: 192.168.1.10 - 客户端 IP: 192.168.1.20 - **端口号**: 5201 测试准备 1. **安装 iperf3**&a…

Python网络爬虫技术

Python网络爬虫技术详解 引言 网络爬虫(Web Crawler),又称网络蜘蛛(Web Spider)或网络机器人(Web Robot),是一种按照一定规则自动抓取互联网信息的程序或脚本。它们通过遍历网页链…

安全工具 | 搭建带有 Web 仪表板的Interact.sh

介绍 Interactsh 是一个用于检测带外交互的开源工具。它是一种旨在检测导致外部交互的漏洞的工具。本文将主要介绍在子域上设置私有 Interact.sh 服务器以及部署其 Web 应用程序。只需一个 AWS EC2 或 VPS 实例和一个域。 要求 •具有静态IP的AWS EC2 / VPS •拥有自己的域…

QML tableView设置role为index的问题

项目中,需要将一个tableview的第一列表示为索引,且索引需从1开始。于是编写代码如下: 下面展示一些 内联代码片。 ListModel {id: com_model;} GE_TableView {id: tableview;height: 510;anchors.top: root.top;anchors.left: root.left;anc…

鸿蒙OS启动流程

启动流程(基于openharmony4.1) 系统上电加载内核后,按照以下流程完成系统各个服务和应用的启动: 内核加载init进程,一般在bootloader启动内核时通过设置内核的cmdline来指定init的位置。init进程启动后,会挂载tmpfs,…

51单片机-第十四节-AD/DA(XPT2046触摸屏)

一、AD/DA介绍: AD:模拟-数字转换,将模拟信号转换为计算机可操作的数字信号。 DA:数字-模拟转换,将计算机输出的数字信号转换为模拟信号。 二、运算放大器: 1.介绍: (1&#xf…