Excel玩转自然语言查询

news/2024/11/24 11:29:55/

ChatGPT火出圈,人类被人工智能替代又成为热门话题。有人欢喜,有人忧,也有人不以为意,觉得离自己工作远着呢,比如现在是用Excel做报表,有本事你动动嘴就直接把Excel里面的数据查询出来啊。

 

1c7c0f97014d9cf6e71c473ed2cc949a.jpeg

你可别说,还真能做到动动嘴或是输入问句,用户就能从Excel查询到自己想要的数据,有视频有真相。

 

上面效果是通过自然语言产品——Smartbi 对话式分析来实现的,它通过对话的方式,查询分析Excel的数据,无需在Excel中手动汇总、复杂计算。

1、对话就能分析Excel数据,探寻根因。

比如,我们需要分析出“上海分部合同金额去年同比下降”的原因。

先输入“去年合同金额排名前五的分部”,直接显示汇总表,发现排名第一的上海同比下降了18%。然后继续问上海每个月的情况,看到好几个月都同比下降得厉害。接着抽查8月份的数据,从行业角度和销售的角度看销售具体情况。

最后,我们使用自然语言就快速分析出了了上海分部8月份合同额下降的原因,给用户带来更大的方便性。

2、图表多种形式展示汇总数据

上述效果其实我们喂给Smartbi对话式分析的是下图明细的Excel数据,对话出来的结果是汇总后的分析数据

c6c8ce3ac3729f6f09acc33f971b7f2e.jpeg

能用表格,也可以用更直观的图形来展示数据。

3、语义场景自适应

Smartbi对话式分析有一个和其他同类产品不一样的地方:其他自然语言查询工具,需要比较完整正确的说出业务字段名称,但是Smartbi是不需要的。比如上述例子中的“广州分部合同金额排名前十销售”,系统会根据当前的语句自动识别是想要对“销售姓名”排名还是“销售分部”排名,在这句话中,系统给出的选择是使用“销售姓名”进行排序。

4、支持时间智能计算

Excel通常是写复杂公式函数来实现数据二次计算,Smartbi对话式分析不用做任何设置,根据需要选择就能自动生成计算字段,比如如同环比、同环增长率等时间智能计算,我们对比一下结果也是对的。

 

实现步骤

看到上面视频演示,你可能心动,但是又觉得想要实现,一定很难吧。要会什么机器学习、AI、知识图谱等各种高新技术才行。

但是,实际上你只需要一个Excel文件提供数据Smartbi 对话式分析工具进行可视化设置就可以实现。

下面我们以一个实例详细教程,一步步手把手教大家。

1、准备Excel文件

2、导入Excel数据

3、进行建模工作

4、训练模型

5、进行对话式查询

1 准备Excel文件

先准备Excel文件,这个示例里面的数据表包括合同明细表、地区表、销售表。这些表的数据结构、E-R关系图和样例数据如下:

bdbae99eb33a2bdecc05f63061ccf4a2.jpeg

4edbb73f8c208793c80b9d1c20ab5a57.jpeg

图:Excel明细数据演示

PS:Excel文件业务的随机数据,请自动忽略数据不合理之处 ^_^。

2 导入Excel数据

接下来我们把Excel文件数据导入到Smartbi系统中去,这里通过Smartbi数据模型来实现。Smartbi数据模型支持多种数据来源,对于Excel的数据,直接选择Excel文件类型,然后根据指引,就可以完成导入。

​​​​​​​

 

3 进行数据建模

导入Excel数据后,下面我们需要把Excel数据转换为业务用户更好理解和使用的数据模型。数据模板建模操作包括设置表关系、生成指标维度等,当然这些都是可视化界面操作,你跟着指引就能自己动手。

3.1 建立表关系

这里需要把《合同表》和《销售表》、《地区表》关联起来。

它们之间表关系的创建非常简单,以《合同维表》和《合同类型表》为例,如下图拖拽出关联线后,会自动弹出表关系对话框,然后根据需要设置表关系即可。

以此类推,最终确认的关联关系如下图:

a1964658eb178a3c87975039648096ac.jpeg

图:拖好常规关系

4fa227e79d4d25934d91131386eb5ffd.jpeg

3.2 生成指标和维度

表关系设置好后,我们需要生成指标和维度。

1. 生成指标。

通过双击就可以把事实表中的数值字段转成指标,比如双击“合同金额”。

82f79efad438d7f17c7e2a320ef6cf17.jpeg

2. 处理普通维度。

我们把需要的字段根据需要进行组合、修改别名等操作,生成普通维度,对于有些不需要的字段(ID、编码等)直接隐藏掉就可以。

32cc7aa70c92934a62c9e4442b108330.jpeg

图:隐藏“合同维表”

0efb3230b56c08d7c686f800364bd4c9.jpeg

图:显示“合同名称”

3. 创建时间维度。

通过日期字段可以一键生成时间维度。如果觉得默认的名字和格式不好,可以进行修改。

858db809957d9c3bc5c05740e022b58a.jpeg

图:创建时间层次结构

6957aefad81d6e6396192ec833333527.jpeg

图:选择时间层次结构

79e1961af035c6be514bad0f03a0fd05.jpeg

图:生成的时间层次

9d4dbf3e82f0e61d6316518c054a03dd.jpeg

图:改名后的时间层次

3.3 自定义指标可选

除了合同金额,如果我们还想知道“合同个数”,我们需要对“合同编码”做唯一计数。

66513ecd863998795bae6cc21ac11266.jpeg

图:生成“合同个数”指标

此外,对于原有指标衍生的计算指标,,在Smartbi中不用写复杂的公式,通过简单的拖拽操作即可生成。

3.4 模型抽取和验证

完成数据建模后,我们需要抽取Excel的数据。

51d06f3f3b92dac5141c77e3d4a070ce.jpeg

如果需要的话,可以验证下模型数据是否正确。使用【交互仪表盘】把用到的维度和指标都拖上来,看看是否有数据,数据是否正确。

1ed9db62350b30836a784299e3f794af.jpeg

以上是创建数据模型完整的过程,你会发现Smartbi的数据模型建设过程非常简单,全程就是鼠标拖拽就实现了,基本不需要使用键盘,更不需要写SQL语句或者其他程序语言。

4 一键训练模型

Smartbi 对话式分析是在“数据模型”之上,再建立了一个知识模型(知识图谱)。这个知识图谱,需要有一个训练过程。不过Smartbi已经把这些工作都包装好了,我们只需要点一个训练按钮就可以实现知识图谱的训练了。

8ce5e5b8de49dced6831fb2270484a30.jpeg

5 进行对话式分析

完成数据准备和建模工作,我们就可以进行对话了。你可以直接在PC端打开对话窗口,根据需要输入想问的问题,系统会在对话框中把你想看的数据以图表的方式展现出来,你也可以在移动设备上安装一个APP,通过语音来进行数据分析。

如果你想免费体验一下,可以到Smartbi的demo体验中心:

登录 – 思迈特软件统一登录平台 


http://www.ppmy.cn/news/43550.html

相关文章

应届生,实力已超6年,太卷了!

你好,我是田哥今晚上,给一位朋友做模拟面试,原本说好的90分钟左右,结果整了2个多小时。很多人估计也很好奇,我们这两个多小时聊聊什么,下面我给大致总结一下:面试技巧面试中,我们回答…

【AXU3EG】UltraScale+ MPSoC以及开发板介绍

Copyright © 2012-2020 芯驿电子科技(上海)有限公司 UltraScale MPSoC Zynq UltraScale MPSoC 系列是 Xilinx 第二代平台,其在 FPGA 内部集成了完整 ARM 处理子系统(PS),包含了四核 Cortex-A53 加双核…

红黑树探险:从理论到实践,一站式掌握C++红黑树

红黑树揭秘:从理论到实践,一站式掌握C红黑树引言为什么需要了解红黑树?红黑树在现代C编程中的应用场景树与平衡二叉搜索树树的基本概念:二叉搜索树的定义与性质:平衡二叉搜索树的特点与需求:红黑树基础红黑…

超详细Django+vue+vscode前后端分离搭建

文章目录一、Django后端搭建1.1 创建项目和app1.2 注册app1.3 运行项目1.4 配置mysql数据库1.5 创建数据库类1.6 使用Django后台进行数据管理2、Django rest framework配置2.1 序列化2.2 添加视图2.3 添加路由2.4 在项目根目录下的urls中加入如下代码2.5 api测试2.6 筛选和搜索…

2023年数据治理工程师哪个证书含金量高?当然CDGA/CDGP

DAMA认证为数据管理专业人士提供职业目标晋升规划,彰显了职业发展里程碑及发展阶梯定义,帮助数据管理从业人士获得企业数字化转型战略下的必备职业能力,促进开展工作实践应用及实际问题解决,形成企业所需的新数字经济下的核心职业…

射频功率放大器在液体超声声强的光电测量中的应用

实验名称:液体中超声声强的光电测量 研究方向:光电测量 测试目的: 声强是描述声场的基本物理量口,超声效应直接与声强有关。例如在工程技术领域,液体中的声场分布直接影响流场分布口,声强的大小影响着超声波…

整体二分

引入 我们看一道题: 给定一个长度为 n(n≤50000)n(n\leq 50000)n(n≤50000) 的数组 a1,a2,...,ana_1 , a_2 , ... , a_na1​,a2​,...,an​ 和 q(q≤10,000)q\ ( q \leq 10,000 )q (q≤10,000) 次询问,每次询问: QQQ iii jjj kkk 表示区间 …

【手把手刷CCF】202303-2-垦田计划100分(超简单思路,含详细解释注释与代码)

文章目录:故事的开头总是极尽温柔,故事会一直温柔……💜一、🌳代码如下:二、🌵解题思路❤️❤️❤️忙碌的敲代码也不要忘了浪漫鸭!故事的开头总是极尽温柔,故事会一直温柔……&…