大模型应用与实战:专栏概要与内容目录

embedded/2025/2/10 8:56:40/

文章目录

    • 大模型应用与实战
    • 📚 核心内容模块
      • 一、大模型推理与部署
        • 1.1 推理框架应用实践
        • 1.2 框架源码深度解析
        • 1.3 高并发部署优化
        • 1.4 国产化平台适配
      • 二、Agent框架专题
        • 2.1 Langchain系列
        • 2.2 Qwen-Agent系列
        • 2.3 Dify应用实践
        • 2.4 框架对比与迁移
      • 三、微调技术研究
        • 3.1 微调方法综述
        • 3.2 LLaMA-Factory专题
      • 四、RAG技术应用

在这里插入图片描述

大模型应用与实战

🔥 专栏简介 | 大模型技术深度实践指南

掌握大模型前沿技术,探索实战应用的无限可能

🌟 为什么订阅本专栏?

  • 从理论到落地:拒绝纸上谈兵!专栏聚焦工业级场景,覆盖模型推理优化、Agent智能体开发、低成本微调、RAG增强等核心领域,提供可直接复现的代码方案。
  • 源码级深度剖析:不止于API调用,更深入Langchain、Qwen-Agent、Dify等热门框架源码,揭示设计思想与性能优化秘诀。
  • 避坑全攻略:汇总华为昇腾适配、高并发部署、长上下文优化等实战难题的解决方案,节省开发者80%的试错时间。
  • 技术生态全景图:对比分析主流框架(Langchain/Dify/Qwen/LLaMA-Factory等)的优劣与适用场景,帮你快速构建技术选型能力。

🎯 适合读者

✓ 希望将大模型应用于实际业务的开发者
✓ 追求技术深度的框架研究者
✓ 需要解决企业级部署难题的工程师
✓ 渴望构建完整知识体系的技术管理者

🚀 你将获得

工程化能力:掌握大模型从本地部署到云端适配的全链路实战经验
源码思维:通过框架核心模块解析,培养二次开发与定制化能力
方法论体系:构建涵盖模型优化、Agent编排、知识增强的技术矩阵
持续进化:专栏随技术演进动态更新,订阅即锁定大模型技术前沿


📚 核心内容模块

(以下为完整文章目录,点击标题直达深度解析)

一、大模型推理与部署

聚焦大模型生产环境落地的关键技术,覆盖推理框架实践、源码级原理剖析、高并发优化及国产硬件适配。从API启动、上下文修改到昇腾平台迁移,提供端到端的部署指南与性能调优方案。

1.1 推理框架应用实践

《汇总开源大模型的本地API启动方式》
《ollama修改模型问答的上下文长度(num_ctx)》

1.2 框架源码深度解析

《langchain-ChatGLM源码阅读:前端样式》
《langchain-ChatGLM源码阅读:参数设置》
《langchain-ChatGLM源码阅读:模型加载》

1.3 高并发部署优化

《使用fastchat实现大模型高并发对话》

1.4 国产化平台适配

《华为昇腾云平台适配Baichuan2大模型记录》

二、Agent框架专题

深入解析主流Agent框架的工程实现与应用迁移。涵盖Langchain源码解读、Qwen-Agent工具调用机制、Dify全流程实践,并通过多框架对比提供技术选型依据,助力开发者实现Agent能力无缝切换。

2.1 Langchain系列

《一文读懂Langchain:ChatGLM3和ChatGPT的Agent调用分析》

2.2 Qwen-Agent系列

《针对Qwen-Agent框架的Function Call及ReAct的源码阅读与解析:Agent基类篇》
《基于Qwen-Agent框架的Function Call及ReAct方式调用自定义工具》

2.3 Dify应用实践

《Dify部署及初步测试》
《基于Dify的Agent全流程测试》
《基于Dify的工作流全流程测试》

2.4 框架对比与迁移

《代码实现从Langchain到Dify的Agent切换》
《基于Qwen2.5在多框架下的Function Call尝试及总结》

三、微调技术研究

系统梳理大模型微调方法论与实践陷阱。以LLaMA-Factory为核心载体,详解数据集构建、参数调优及典型错误排查,提供从理论到落地的全链路指导,降低领域适配门槛。

3.1 微调方法综述

《主流开源大语言模型的微调方法》

3.2 LLaMA-Factory专题

《LLaMA-Factory如何解决数据集加载时json.decoder.JSONDecodeError: Extra data: line 2 column 1 (char 214)的错误》
《使用LLaMA-Factory微调时的数据集选择》
《使用LLaMA-Factory微调时的问题与解决方案记录》
《基于LLaMA-Factory的微调记录》

四、RAG技术应用

《基于Langchain的txt文本向量库搭建与检索》



http://www.ppmy.cn/embedded/161043.html

相关文章

DeepSeek vs. ChatGPT:不同的诞生时间,对人工智能发展的不同影响

DeepSeek vs. ChatGPT:不同的诞生时间,对人工智能发展的不同影响 ChatGPT 和 DeepSeek 诞生于不同的时间节点,代表了人工智能不同阶段的发展方向。它们在技术、应用以及对AI发展趋势的影响方面各有侧重。 1. 诞生时间与背景 ChatGPT&#x…

1.1 画质算法的主要任务

文章目录 画质算法及分类画质问题的核心:退化 画质算法及分类 图像画质算法是指,处理图像或视频数字信号,以提高其视觉质量、人眼感官的算法。图像画质算法可分为:去噪(Denoising), 超分辨率(Super-Resolut…

SAP ABAP调用DeepSeek API大模型接口

搜索了一下DeepSeek,发现有人已经实现了SAP的对接, 不登录网页,SAP如何使用DeepSeek快速编程,ABAP起飞啦~ 按照对应的注册流程和方法。总算做出了第一个能够直连DeepSeek的API abap程序。 效果不错。 report ZTOOL_ABAP_CALL_D…

BUU27 [SUCTF 2019]CheckIn1

题目是上传文件 直接上传muma.jpg还不成功: 好吧,那做一个图片马上去,换马以后发现还是不行,呃啊啊啊啊 干啥啥不行,搜wp第一名,哎 新面孔:exif_imagetype 函数在 PHP 中用于检测一个文件是否为…

深入理解Node.js_架构与最佳实践

1. 引言 1.1 什么是Node.js Node.js简介:Node.js是一个基于Chrome V8引擎的JavaScript运行时,用于构建快速、可扩展的网络应用。Node.js的历史背景和发展:Node.js最初由Ryan Dahl在2009年发布,旨在解决I/O密集型应用的性能问题。随着时间的推移,Node.js社区不断壮大,提供…

镜头放大倍率和像素之间的关系

相互独立的特性 镜头放大倍率:主要取决于镜头的光学设计和结构,决定了镜头对物体成像时的缩放程度,与镜头的焦距等因素密切相关。比如,微距镜头具有较高的放大倍率,能将微小物体如昆虫、花朵细节等放大成像&#xff0…

用 Python 给 Excel 表格截图(20250207)

我搜索了网络上的方案,感觉把 Excel 表格转换为 HTML 再用 platwright 截图是比较顺畅的路径,因为有顺畅的工具链。如果使用的是 Windows 系统则不需要阅读此文,因为 win32com 库更方便。这篇文章中 Excel 转 HTML 的方案,主要弥补…

重庆市大数据局:基于可信数据空间的公共数据流通利用(附下载)

在2024年可信数据空间论坛上,重庆市大数据局相关领导发表了题为:基于可信数据空间的公共数据流通利用的演讲,系统介绍了重庆公共数据流通方面的实践经验和案例。 关注WeChat Subscription Account【智慧城市指北】,回复关键字“2…