2023-2024山东大学软件学院web数据管理期末

ops/2024/10/18 5:50:16/

一、填空(30*1' = 30')

都是PPT上的,这里列几个复习可能忽略掉的地方:

word2vec是用来计算____和___(king-man+woman)

爬虫模型使用___判重

fastText是一个_____和_____工具,使用_____方法/概念。

PLSA的全称是______。它通过文档-词项信息  p (w | d)  进行训练,得到______和________。

csv文件是_____结构化文件

其余的题都比较基础,一眼能知道答案(只要好好看PPT了的话.....)

 

二、名词解释(5*8' = 40')

1. 正则表达式

2. web数据抽取

3. HMM模型

4. Bag of words model

5. 忘了(但不难)---统计语言模型

三、简答题(3*10'=30')

1. 简述包装器,比较两种抽取方法

2. CBOW的结构、思想、训练过程及应用

3. 常用的图像局部特征,以及它们的思想

 

 

还是那句话,做好事积德……

 


http://www.ppmy.cn/ops/48714.html

相关文章

HTML做成一个粒子漩涡特效页面

大家好,今天制作制作一个粒子漩涡特效的页面! 先看具体效果: 要在一个单一的 index.html 页面中实现粒子漩涡特效,我们可以使用HTML、CSS和JavaScript(不需要外部库)。下面是一个简单的例子,展…

es6基础语法

简介 ECMAScript 6.0(以下简称 ES6)是 JavaScript 语言的下一代标准 let const 声明变量的关键字 es6 之前使用var es6 引入let const 特点 没有变量提升 不能在未声明之前使用形成块作用域 声明的变量只在当前它所在的代码块有效,可以使用不可重复…

通勤路上的美好伴侣:倍思H1s头戴式蓝牙耳机

在繁忙的都市生活中,通勤往往占据了人们大量的时间。而在这个过程中,无尽的嘈杂声——公交车的播报声、地铁的轰鸣声、街头的喧嚣——往往成为我们心情的干扰源。在这样的环境下,一款优质的头戴式蓝牙耳机,会让我们的通勤之旅变得更加愉快和舒适。 通勤路上要更舒适—— 倍思…

爬虫的法律风险是什么?以及合法使用爬虫技术的建议。

爬虫的法律风险是什么? 网络爬虫技术,虽然在数据获取方面具有巨大优势,但其使用过程中可能引发的法律风险也不容忽视。这些风险主要包括违反数据保护法规、侵犯知识产权、构成不正当竞争等。下面将详细探讨网络爬虫的法律风险,并在…

6.11 作业

以下是一个简单的比喻,将多态概念与生活中的实际情况相联系: 比喻:动物园的讲解员和动物表演 想象一下你去了一家动物园,看到了许多不同种类的动物,如狮子、大象、猴子等。现在,动物园里有一位讲解员&…

WPF第三方开源UI框架:打造独特体验的魔法师

引言 在WPF(Windows Presentation Foundation)的世界中,除了微软提供的原生控件,还有许多第三方开源UI框架为开发者提供了更广阔的天地。这些框架以其创新和灵活性,帮助开发者打造出与众不同的用户体验。本文将带您走进…

孪生网络(Siamese Networks)和对比学习(Contrastive Learning)

目录 孪生网络(Siamese Networks) 对比学习(Contrastive Learning) 区别 SimCLR (A Simple Framework for Contrastive Learning of Visual Representations) MoCo (Momentum Contrast for Unsupervised Visual Representati…

现代密码学-国密算法

商用密码算法种类 商用密码算法 密码学概念、协议与算法之间的依赖关系 数字签名、证书-公钥密码、散列类算法 消息验证码-对称密码 ,散列类 安全目标与算法之间的关系 机密性--对称密码、公钥密码 完整性--散列类算法 可用性--散列类、公钥密码 真实性--公…