HackerRank C++面试,中等难度题目 - Attribute Parser

server/2025/2/13 22:18:58/

去除字符串首尾的空白字符(包括空格、制表符、换行符和回车符)

void trim(string &s) {size_t start = s.find_first_not_of(" \t\n\r");size_t end = s.find_last_not_of(" \t\n\r");if (start == string::npos) {s = "";} else {s = s.substr(start, end - start + 1);}
}
  • 参数: string &s - 传入的字符串引用,函数会直接修改该字符串。
  • 通过使用引用,你可以确保函数内部对字符串的修改直接影响到传入的原始字符串,而不是它的副本。这样可以避免额外的拷贝和内存分配。
  • 在C++中,find_first_not_of 和 find_last_not_of 是 std::string 类的成员函数,用于查找字符串中第一个或最后一个不匹配指定字符集的字符的位置。
  • 使用 find_first_not_of 方法找到字符串中第一个不是空格、制表符、换行符或回车符的字符位置。
  • 如果 start 等于 string::npos,说明整个字符串都是空白字符,将字符串置为空字符串。
  • 否则,使用 substr 方法提取从 start 到 end 之间的子字符串,并赋值给原字符串 s。

从格式化的属性字符串中提取键值对,并将其存储在一个向量中

vector<pair<string, string>> parse_attrs(const string &s) {// 初始化一个空的向量attrs用于存储解析后的键值对。vector<pair<string, string>> attrs;// 初始化位置指针pos为0,用于遍历输入字符串。在遍历数组或容器时,size_t 常被用作循环变量的类型,因为它能够处理所有可能的索引值。size_t pos = 0;while (pos < s.size()) {// 跳过字符串开头的所有空白字符。while (pos < s.size() && isspace(s[pos])) {pos++;}if (pos >= s.size()) {break;}// 查找下一个等号的位置,如果找不到则退出循环。size_t equal_pos = s.find('=', pos); // 查找字符串 s 中从位置 pos 开始的第一个等号('=')字符的位置。if (equal_pos == string::npos) {break;}string attr_name = s.substr(pos, equal_pos - pos);trim(attr_name);pos = equal_pos + 1;// 跳过等号后的所有空白字符。while (pos < s.size() && isspace(s[pos])) {pos++;}// 检查当前字符是否为双引号,如果不是则退出循环。if (pos >= s.size() || s[pos] != '"') {break;}pos++; // 找到下一个双引号的位置,提取其中的子字符串作为值。size_t value_start = pos;size_t value_end = s.find('"', pos);if (value_end == string::npos) {break;}string attr_value = s.substr(value_start, value_end - value_start);pos = value_end + 1; // 更新位置指针到双引号后的下一个字符。// 将解析出的键值对添加到向量中。attrs.emplace_back(attr_name, attr_value);}return attrs;
}
  • emplace_back: 这是 vector 类的一个成员函数,用于在容器的末尾直接构造元素。

main函数

int main() {// 读取两个整数N和Q,分别表示标签行数和查询次数。int N, Q;cin >> N >> Q;cin.ignore();// tag_stack用于存储当前打开的标签。vector<string> tag_stack;// attributes用于存储每个标签路径下的属性。unordered_map<string, unordered_map<string, string>> attributes;for (int i = 0; i < N; ++i) {string line;getline(cin, line);if (line.empty()) continue;// 如果遇到关闭标签(以</开头),则从tag_stack中弹出最后一个标签。if (line[1] == '/') {if (!tag_stack.empty()) {tag_stack.pop_back();}} else {line = line.substr(1, line.size() - 2); // 去掉字符串 line 的第一个字符和最后一个字符istringstream iss(line); // 创建了一个输入字符串流// 从字符串流 iss 中读取第一个单词(即标签名),并将其存储在 tag_name 变量中string tag_name;iss >> tag_name;// 从字符串流 iss 中读取剩余的内容(即标签的属性部分)string attr_str;getline(iss >> ws, attr_str); // 跳过任何前导空白字符(由 ws 表示)并读取直到行尾的所有内容// 从格式化的属性字符串中提取键值对,并将其存储在一个向量中vector<pair<string, string>> attrs = parse_attrs(attr_str);// 将当前的 tag_name 添加到 tag_stack 的末尾tag_stack.push_back(tag_name);// 构建一个表示当前标签路径的字符串string current_path;for (const string& tag : tag_stack) {if (!current_path.empty()) {current_path += ".";}current_path += tag;}for (const auto& attr : attrs) {attributes[current_path][attr.first] = attr.second;}}}for (int i = 0; i < Q; ++i) {string query;getline(cin, query);size_t tilde_pos = query.find('~');if (tilde_pos == string::npos) {cout << "Not Found!" << endl;continue;}string path = query.substr(0, tilde_pos);string attr = query.substr(tilde_pos + 1);// 确保在 attributes 中存在指定的路径 path,并且在这个路径下存在指定的属性 attr。if (attributes.find(path) != attributes.end() && attributes[path].find(attr) != attributes[path].end()) {cout << attributes[path][attr] << endl;} else {cout << "Not Found!" << endl;}}return 0;
}
  • unordered_map<string, unordered_map<string, string>> attributes; 是一个嵌套的哈希表(也称为字典或映射),用于存储HTML标签的属性。
  • getline 函数从输入流 cin 中读取字符,直到遇到换行符(‘\n’),但不包括换行符。读取的字符被存储到字符串 line 中。
  • attributes.find(path) 尝试在 attributes 中找到键为 path 的元素。
    如果找到了这个路径,find 方法返回一个迭代器,指向找到的元素;否则,返回 attributes.end()。
  • 然后,attributes[path].find(attr) 尝试在这个内部的 unordered_map 中找到键为 attr 的元素。
  • 同样地,如果找到了这个属性,find 方法返回一个迭代器,指向找到的元素;否则,返回 attributes[path].end()。

http://www.ppmy.cn/server/167440.html

相关文章

机器学习算法 - 随机森林之决策树初探(1)

随机森林是基于集体智慧的一个机器学习算法&#xff0c;也是目前最好的机器学习算法之一。 随机森林实际是一堆决策树的组合&#xff08;正如其名&#xff0c;树多了就是森林了&#xff09;。在用于分类一个新变量时&#xff0c;相关的检测数据提交给构建好的每个分类树。每个…

【Linux】nmcli命令详解

目录 一、概述 二、常用参数使用 2.1 nmcli networking 1.显示NM是否接管网络 2.查看网络连接状态 3.开/关网络连接 2.2 general ?编辑 1.显示系统网络状态 2.显示主机名 3.更改主机名 2.3 nmcli connection ?编辑1.显示所有网络连接 2.显示某个网卡的详细信息…

【工业场景】用YOLOv8实现火灾识别

火灾识别任务是工业领域急需关注的重点安全事项,其应用场景和背景意义主要体现在以下几个方面: 应用场景:工业场所:在工厂、仓库等工业场所中,火灾是造成重大财产损失和人员伤亡的主要原因之一。利用火灾识别技术可以及时发现火灾迹象,采取相应的应急措施,保障人员安全和…

使用Python爬虫获取1688 App原数据API接口

一、引言 在电商领域&#xff0c;数据是企业决策、市场分析和产品优化的关键要素。1688作为国内领先的B2B电商平台&#xff0c;汇聚了海量的商品信息和交易数据。通过获取1688 App的原数据API接口&#xff0c;企业可以精准把握市场动态&#xff0c;了解竞争对手的策略&#xf…

DeepSeek与ChatGPT正在改写学历规则?2025教育革命深度解析

一、颠覆性现状&#xff1a;AI如何解构学历价值 1. 知识获取民主化 随着AI技术的不断进步&#xff0c;知识获取的方式正在发生翻天覆地的变化&#xff1a; DeepSeek-R1通过仅10%的训练成本&#xff0c;实现了与GPT-4o相当的性能&#xff0c;技术文档的生成效率提升了70%。这…

深入探究 Rust 测试:灵活控制测试的执行方式

一、并行测试与串行测试 Rust 的测试默认会并行执行&#xff0c;这样能显著减少运行整套测试的时间。不过&#xff0c;如果测试之间存在共享状态&#xff08;例如同一文件名、环境变量或工作目录&#xff09;就可能发生相互干扰&#xff0c;导致结果不可预期。因此&#xff0c…

数据结构-栈和队列的应用

目录 前言一、栈的应用&#xff08;迷宫问题&#xff09;1.1 问题描述1.2 算法选择1.3 算法精化1.4 算法实现1.5 问题结果 二、队列的应用&#xff08;农夫过河问题&#xff09;2.1 问题描述2.2 算法选择2.3 算法精化2.4 算法实现2.5 问题结果 总结 前言 本篇文章使用两个例子…

C++ 常用的设计模式

1&#xff1a;单例模式&#xff1a;首先能想到的&#xff0c;最为重要的一个设计模式。确保一个类仅有一个实例&#xff0c;提供一个 全局访问点&#xff0c;惯用做法是屏蔽构造数访问&#xff08;设为private&#xff09;&#xff0c;通过static 权限达到间接访问调用的目的…