目录
前言
知识储备
10大开源大模型
LLaMA 3
Phi-3
BLOOM
BERT
Falcon 180B
XGen-7B
GPT-NeoX 和 GPT-J
Vicuna13-B
如何选择适合的开源LLM
算法原理
性能
大模型如何量化
什么是量化,为什么需要它?
量化是如何工作的?简单的数学推导
LLM权重参数进行量化和反量化
大模型算法二次开发思路解析
开发阶段分类
各个阶段功能介绍
技术创新与发展
增量预训练(Continue Pretraining)
1、Prompt-based 方法
2. Representation-based 方法
3. Model Mixture-based 方法
前言
目标检测是识别图片中有哪些物体以及物体的位置(坐标位置)的技术,是计算机视觉应用的基础,比如实例分割、人体关键点提取、人脸识别等。在互联网、大数据、人工智能等技术的发展浪潮下,目标检测展现出巨大的应用价值,受到工业界、学术界的密切关注。各类研究机构争相构建并对外公开 COCO、OpenImage 等大规模数据集用于目标检测模型训练。数据集的日益丰富极大促进了技术的更新迭代,不断涌现出以 Faster R-CNN 为脉络发展的 Two-stage 和以 YOLO、SSD 为基础的 One-stage 目标检测新范式。
目标检测技术在产业应用中的需求越来越广泛和深入,学术界已经训练好的模型评估都是基于标准 benchmark,在产业化应用落地中通常表现出严重的 “水土不服”,需要重新定制化开发。快速设计出最适合工业界不同业务场景的目标检测模型是一项很有挑战的工作,需要决定制化需求开发中的核心痛点问题:
一、数据整合难。数据治理是建模的基本要素,在 AI 应用开发过程中,从数据的采集、清洗和转换到最终生成算法所需的数据集需要经历繁琐的流程和花费高昂的成本,而且很有可能因为数据的准确性、完整