大模型应用与实战:专栏概要与内容目录

news/2025/2/10 15:19:19/

文章目录

    • 大模型应用与实战
    • 📚 核心内容模块
      • 一、大模型推理与部署
        • 1.1 推理框架应用实践
        • 1.2 框架源码深度解析
        • 1.3 高并发部署优化
        • 1.4 国产化平台适配
      • 二、Agent框架专题
        • 2.1 Langchain系列
        • 2.2 Qwen-Agent系列
        • 2.3 Dify应用实践
        • 2.4 框架对比与迁移
      • 三、微调技术研究
        • 3.1 微调方法综述
        • 3.2 LLaMA-Factory专题
      • 四、RAG技术应用

在这里插入图片描述

大模型应用与实战

🔥 专栏简介 | 大模型技术深度实践指南

掌握大模型前沿技术,探索实战应用的无限可能

🌟 为什么订阅本专栏?

  • 从理论到落地:拒绝纸上谈兵!专栏聚焦工业级场景,覆盖模型推理优化、Agent智能体开发、低成本微调、RAG增强等核心领域,提供可直接复现的代码方案。
  • 源码级深度剖析:不止于API调用,更深入Langchain、Qwen-Agent、Dify等热门框架源码,揭示设计思想与性能优化秘诀。
  • 避坑全攻略:汇总华为昇腾适配、高并发部署、长上下文优化等实战难题的解决方案,节省开发者80%的试错时间。
  • 技术生态全景图:对比分析主流框架(Langchain/Dify/Qwen/LLaMA-Factory等)的优劣与适用场景,帮你快速构建技术选型能力。

🎯 适合读者

✓ 希望将大模型应用于实际业务的开发者
✓ 追求技术深度的框架研究者
✓ 需要解决企业级部署难题的工程师
✓ 渴望构建完整知识体系的技术管理者

🚀 你将获得

工程化能力:掌握大模型从本地部署到云端适配的全链路实战经验
源码思维:通过框架核心模块解析,培养二次开发与定制化能力
方法论体系:构建涵盖模型优化、Agent编排、知识增强的技术矩阵
持续进化:专栏随技术演进动态更新,订阅即锁定大模型技术前沿


📚 核心内容模块

(以下为完整文章目录,点击标题直达深度解析)

一、大模型推理与部署

聚焦大模型生产环境落地的关键技术,覆盖推理框架实践、源码级原理剖析、高并发优化及国产硬件适配。从API启动、上下文修改到昇腾平台迁移,提供端到端的部署指南与性能调优方案。

1.1 推理框架应用实践

《汇总开源大模型的本地API启动方式》
《ollama修改模型问答的上下文长度(num_ctx)》

1.2 框架源码深度解析

《langchain-ChatGLM源码阅读:前端样式》
《langchain-ChatGLM源码阅读:参数设置》
《langchain-ChatGLM源码阅读:模型加载》

1.3 高并发部署优化

《使用fastchat实现大模型高并发对话》

1.4 国产化平台适配

《华为昇腾云平台适配Baichuan2大模型记录》

二、Agent框架专题

深入解析主流Agent框架的工程实现与应用迁移。涵盖Langchain源码解读、Qwen-Agent工具调用机制、Dify全流程实践,并通过多框架对比提供技术选型依据,助力开发者实现Agent能力无缝切换。

2.1 Langchain系列

《一文读懂Langchain:ChatGLM3和ChatGPT的Agent调用分析》

2.2 Qwen-Agent系列

《针对Qwen-Agent框架的Function Call及ReAct的源码阅读与解析:Agent基类篇》
《基于Qwen-Agent框架的Function Call及ReAct方式调用自定义工具》

2.3 Dify应用实践

《Dify部署及初步测试》
《基于Dify的Agent全流程测试》
《基于Dify的工作流全流程测试》

2.4 框架对比与迁移

《代码实现从Langchain到Dify的Agent切换》
《基于Qwen2.5在多框架下的Function Call尝试及总结》

三、微调技术研究

系统梳理大模型微调方法论与实践陷阱。以LLaMA-Factory为核心载体,详解数据集构建、参数调优及典型错误排查,提供从理论到落地的全链路指导,降低领域适配门槛。

3.1 微调方法综述

《主流开源大语言模型的微调方法》

3.2 LLaMA-Factory专题

《LLaMA-Factory如何解决数据集加载时json.decoder.JSONDecodeError: Extra data: line 2 column 1 (char 214)的错误》
《使用LLaMA-Factory微调时的数据集选择》
《使用LLaMA-Factory微调时的问题与解决方案记录》
《基于LLaMA-Factory的微调记录》

四、RAG技术应用

《基于Langchain的txt文本向量库搭建与检索》



http://www.ppmy.cn/news/1570891.html

相关文章

Javascript包管理工具——NPM常见内容

常见的npm相关知识点,比如包管理、版本控制、命令使用、依赖管理等等。 首先,我得回忆自己面试时遇到的npm问题,或者网上常见的考点。比如npm是什么,package.json的作用,依赖类型,版本控制符号,…

面试准备——Java理论高级【笔试,面试的核心重点】

集合框架 Java集合框架是面试中的重中之重,尤其是对List、Set、Map的实现类及其底层原理的考察。 1. List ArrayList: 底层是动态数组,支持随机访问(通过索引),时间复杂度为O(1)。插入和删除元素时&#…

排序合集(一)

以下是更完善和人性化的版本,增加了一些细节和解释,同时让内容更易读: 一、直接插入排序 (Insertion Sort) 基本思想 直接插入排序是一种简单直观的排序算法,就像我们打扑克牌时的操作:每次摸到一张牌,都…

ollama linux下载

实验室服务器(A6000)执行curl -fsSL https://ollama.com/install.sh | sh太慢了。 而sudo snap install ollama,容易爆cudalibrt.so12无法正常使用的bug。 发现 https://www.modelscope.cn/models/modelscope/ollama-linux 使用modelscope进…

Apache Kafka:高吞吐分布式流平台的深度解析

引言:流数据时代的挑战 在实时推荐、物联网数据处理、金融交易监控等场景中,传统消息队列面临三大核心挑战: 海量数据吞吐:日均千亿级消息处理需求 超低延迟要求:毫秒级端到端传递延迟 数据持久保障:故障…

Spring Boot常见面试题总结

1. Spring Boot基础 Q1: Spring Boot是什么?它的优点有哪些? Spring Boot是简化Spring应用开发的框架,提供自动配置、内嵌服务器、starter依赖等。优点包括快速搭建、约定优于配置、减少XML配置、集成生态丰富。 Q2: SpringBootApplication注…

kafka服务端之分区管理

文章目录 概述优先副本选举为何要有优先副本优先副本选举弊端如何开启优先副本选举如何开启部分优先副本选举如何正确使用优先副本选举 分区重分配为何需要分区重分配分区重分配工作原理分区重分配弊端及其如何正确使用 复制限流为何需要复制限流如何进行复制限流 修改副本因子…

高并发读多写少场景下的高效键查询与顺序统计的方案思路

之前在某平台看到一篇有意思的场景——对于高并发读多写少场景下,如何进行高效键查询与统计早于其创建时间且没有被删除的数量(只需要先入先出,不需要从中间删元素) 在高并发、读多写少的场景下,业务需求通常聚焦在以…