在亚马逊云科技上一键自动部署Falcon3大语言模型

devtools/2025/2/18 17:29:50/
aidu_pl">

由TII(阿布扎比技术创新研究所)开发的全新的Falcon 3系列模型,已经在亚马逊云科技的模型自动化快速部署功能 - Amazon SageMaker JumpStart上可以使用了。在本文中小李哥就将带大家探训如何在Amazon SageMaker AI上高效部署Falcon3模型。

Falcon 3 系列模型概述

Falcon 3系列由阿布扎比技术创新研究所(TII)研发,它的出现标志着开源语言模型的重大进步。Falcon系列包含五种基础模型,参数规模从1B(10 亿)到10B(100 亿)不等,该模型专门提升了科学、数学和编程能力,帮助开发者满足日常场景的需求。目前该系列包括的类型有Falcon3-1B-Base、Falcon3-3B-Base、Falcon3-Mamba-7B-Base、Falcon3-7B-Base和Falcon3-10B-Base 以及他们Instruct指令微调优化输出的版本。

该系列模型在多个技术方向进行了创新性,例如高效的预训练技术、经过优化的推理能力,以及 知识蒸馏,使较小的模型具备更优性能。值得注意的是Falcon3-10B-Base模型在零样本(zero-shot)和少样本(few-shot)任务中,,目前拥有13B以下小模型最先进的性能。此外Falcon 3系列还提供了多种指令微调版本,如Instruct模型,并支持多种量化格式,使其能够有更加广泛的应用场景。像我们之前介绍的,目前SageMaker JumpStart提供以下基础版本和Instruct版本:

  • Falcon3-3B
  • Falcon3-7B
  • Falcon3-10B
  • Falcon3-1B-Instruct

使用 SageMaker JumpStart 开始部署

SageMaker JumpStart是亚马逊云科技平台上的机器学习训练、部署中心,可帮助加速各位开发者的开发效率。借助SageMaker JumpStart,开发者们可以评估、比较和选择最合适自己要求的预训练的基础模型,包括Falcon 3系列模型。这些模型可根据大家的需求和私有数据进行定制。在 SageMaker JumpStart中部署Falcon 3模型有两种方法,分别是:使用SageMaker JumpStart UI(可视化界面)和使用SageMaker Python SDK进行编程部署。接下来,我们将分别介绍这两种方法,帮助大家选择最适合的方式。

通过 SageMaker JumpStart UI 部署 Falcon 3

1. 我们可以按照以下步骤,通过JumpStart UI部署Falcon 3:

进入SageMaker JumpStart:在Amazon SageMaker统一控制台(Unified Studio)中,拉取Build菜单,选择JumpStart models。

或者在Amazon SageMaker Studio的导航栏中选择JumpStart。

2. 在模型主页中搜索Falcon3-10B-Base

3. 选择模型Falcon3-10B-Base,然后点击Deploy(部署)。

4. 选择合适的实例类型(Instance type):使用默认实例或选择适合我们的需求的其他实例类型。

5. 点击Deploy开始部署。

6. 部署完成后点击进入端点(endpoint) 页面,可以看到端点状态将显示为InService,此时即可调用模型进行推理。

通过SageMaker Python SDK 编程部署 Falcon 3

对于像自动化部署或集成至现有MLOps Pipeline的开发者,我们可使用SageMaker Python SDK - Boto3进行部署,我们运行以下代码部署模型:

from sagemaker.serve.builder.model_builder import ModelBuilder
from sagemaker.serve.builder.schema_builder import SchemaBuilder
from sagemaker.jumpstart.model import ModelAccessConfig
from sagemaker.session import Session
import loggingsagemaker_session = Session()artifacts_bucket_name = sagemaker_session.default_bucket()
execution_role_arn = sagemaker_session.get_caller_identity_arn()js_model_id = "huggingface-llm-falcon-3-10B-base"gpu_instance_type = "ml.g5.12xlarge"  response = "Hello, I'm a language model, and I'm here to help you with your English."sample_input = {"inputs": "Hello, I'm a language model,","parameters": {"max_new_tokens": 128, "top_p": 0.9, "temperature": 0.6},
}sample_output = [{"generated_text": response}]schema_builder = SchemaBuilder(sample_input, sample_output)model_builder = ModelBuilder(model=js_model_id,schema_builder=schema_builder,sagemaker_session=sagemaker_session,role_arn=execution_role_arn,log_level=logging.ERROR
)model= model_builder.build()predictor = model.deploy(model_access_configs={js_model_id:ModelAccessConfig(accept_eula=True)}, accept_eula=True)

注意:如需设置部署后无调用状态下,让模型实例计算资源自动缩容至零以降低成本,我们需要使用serverless无服务器节点类型。

调用模型API进行推理生成响应,请使用以下的代码

predictor.predict(sample_input)

清理资源

部署完成后,为避免产生额外费用给大家造成无意义的花销,可使用以下代码清理模型及端点:

predictor.delete_model()
predictor.delete_endpoint()


http://www.ppmy.cn/devtools/158692.html

相关文章

讲解一下SpringBoot的RPC连接

Spring Boot 本身并不直接提供 RPC(Remote Procedure Call,远程过程调用)功能,但可以通过集成其他框架或库来实现 RPC 通信。常见的 RPC 框架包括 Dubbo、gRPC、Thrift、Spring Cloud 等。下面我将讲解如何在 Spring Boot 中集成和…

ChartDB:一个基于Web的可视化数据库设计工具

这次给大家介绍一个可视化的数据库设计工具:ChartDB。 ChartDB 是一个免费开源的数据库可视化设计工具,支持的数据库包括 MySQL、MariaDB、PostgreSQL、Microsoft SQL Server、SQLite、ClickHouse 等。 对于已有的数据库,ChartDB 提供了一键…

【生产变更】- 19c ADG failover

【生产变更】- 19c ADG failover 一、概述二、操作步骤2.1 备库停止mrp2.2 备库进行failover2.3 新主库置为open状态2.4 确认新主库数据库角色 一、概述 Failover场景通常在主库突发故障(如硬件故障、数据库故障、操作系统故障等),短时间无法…

爬虫JS逆向 - 从入门到实战

第一章:JS逆向的基础知识 1.1 什么是JS逆向 JS逆向(JavaScript Reverse Engineering)是指通过分析前端JavaScript代码,提取其中的数据逻辑、API请求、加密方式等信息的过程。其目的是绕过前端的动态加载机制,直接获取我们需要的数据。 1.2 动态网页的工作原理 传统的静…

嵌入式linux下如何通过IIS接口驱动实现录制pcm音频

在嵌入式 Linux 下,通常使用 ALSA(Advanced Linux Sound Architecture)而不是 IIS(Internet Information Services,它主要用于 Windows 上的 Web 服务,这里你可能想说的是 I2S,Inter - Integrat…

Day1:强化学习基本概念

一、基本概念 1. Agent 智能体:执行动作的对象 2. State 状态:对当前环境的概括 3. Action 动作:智能体基于当前状态做出的决策 4. Reward 奖励:智能体执行完一个动作后,环境反馈给智能体的一个数值。(…

CentOS 7操作系统部署KVM软件和创建虚拟机

CentOS 7.9操作系统部署KVM软件和配置指南,包括如何创建一个虚拟机。 步骤 1: 检查硬件支持 首先,确认您的CPU支持虚拟化技术,并且已在BIOS中启用: egrep -c (vmx|svm) /proc/cpuinfo 如果输出大于0,则表示支持虚拟…

设置ollama接口能外部访问

为了配置Ollama以允许外网访问,你可以按照以下步骤进行操作: ‌确认Ollama服务已正确安装并运行‌: 使用以下命令检查Ollama服务的状态: bash Copy Code systemctl status ollama如果服务未运行,使用以下命令启动它&…