鸿蒙(API 12 Beta3版)【音频编码】

devtools/2024/9/24 17:02:28/

开发者可以调用本模块的Native API接口,完成音频编码,即将音频PCM编码压缩成不同的格式。

接口不限制PCM数据的来源,开发者可以调用麦克风录制获取、也可以导入编辑后的PCM数据,通过音频编码,输出对应格式的码流,最后封装为目标格式文件。

当前支持的编码能力如下:

容器规格音频编码类型
mp4AAC、Flac
m4aAAC
flacFlac
aacAAC
mp3MP3
rawG711mu
amrAMR
oggopus

适用场景

  • 音频录制

    通过录制传入PCM,然后编码出对应格式的码流,最后封装成想要的格式

  • 音频编辑

    编辑PCM后导出音频文件的场景,需要编码成对应音频格式后再封装成文件

开发指导

参考以下示例代码,完成音频编码的全流程,包括:创建编码器、设置编码参数(采样率/码率/声道数等)、开始、刷新、重置、销毁资源。

在应用开发过程中,开发者应按一定顺序调用方法,执行对应操作,否则系统可能会抛出异常或生成其他未定义的行为。具体顺序可参考下列开发步骤及对应说明。

如下为音频编码调用关系图:

1

在 CMake 脚本中链接动态库

target_link_libraries(sample PUBLIC libnative_media_codecbase.so)
target_link_libraries(sample PUBLIC libnative_media_core.so)
target_link_libraries(sample PUBLIC libnative_media_acodec.so)

开发步骤

  1. 添加头文件。
#include <multimedia/player_framework/native_avcodec_audiocodec.h>
#include <multimedia/native_audio_channel_layout.h>
#include <multimedia/player_framework/native_avcapability.h>
#include <multimedia/player_framework/native_avcodec_base.h>
#include <multimedia/player_framework/native_avformat.h>
#include <multimedia/player_framework/native_avbuffer.h>
  1. 创建编码器实例对象,OH_AVCodec *为编码器实例指针。

    应用可以通过名称或媒体类型创建编码器。

// c++标准库命名空间
using namespace std;
// 通过 codecname 创建编码器
OH_AVCapability *capability = OH_AVCodec_GetCapability(OH_AVCODEC_MIMETYPE_AUDIO_AAC, true);
const char *name = OH_AVCapability_GetName(capability);
OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByName(name);
// 设置判定是否为编码;设置true表示当前是编码。
bool isEncoder = true;
// 通过媒体类型创建编码器
OH_AVCodec *audioEnc_ = OH_AudioCodec_CreateByMime(OH_AVCODEC_MIMETYPE_AUDIO_AAC, isEncoder);
// 初始化队列
class AEncBufferSignal {
public:std::mutex inMutex_;std::mutex outMutex_;std::mutex startMutex_;std::condition_variable inCond_;std::condition_variable outCond_;std::condition_variable startCond_;std::queue<uint32_t> inQueue_;std::queue<uint32_t> outQueue_;std::queue<OH_AVBuffer *> inBufferQueue_;std::queue<OH_AVBuffer *> outBufferQueue_;
};
AEncBufferSignal *signal_;
  1. 调用OH_AudioCodec_RegisterCallback()注册回调函数。

    注册回调函数指针集合OH_AVCodecCallback,包括:

    • OH_AVCodecOnError:编码器运行错误。
    • OH_AVCodecOnStreamChanged:码流信息变化,如声道变化等。
    • OH_AVCodecOnNeedInputBuffer:运行过程中需要新的输入数据,即编码器已准备好,可以输入PCM数据。
    • OH_AVCodecOnNewOutputBuffer:运行过程中产生了新的输出数据,即编码完成。

    开发者可以通过处理该回调报告的信息,确保编码器正常运转。

// OH_AVCodecOnError回调函数的实现
static void OnError(OH_AVCodec *codec, int32_t errorCode, void *userData)
{(void)codec;(void)errorCode;(void)userData;
}
// OH_AVCodecOnStreamChanged回调函数的实现
static void OnOutputFormatChanged(OH_AVCodec *codec, OH_AVFormat *format, void *userData)
{(void)codec;(void)format;(void)userData;
}
// OH_AVCodecOnNeedInputBuffer回调函数的实现
static void OnInputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData)
{(void)codec;// 编码输入码流送入InputBuffer队列AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData);unique_lock<mutex> lock(signal->inMutex_);signal->inQueue_.push(index);signal->inBufferQueue_.push(data);signal->inCond_.notify_all();
}
// OH_AVCodecOnNewOutputBuffer回调函数的实现
static void OnOutputBufferAvailable(OH_AVCodec *codec, uint32_t index, OH_AVBuffer *data, void *userData)
{(void)codec;// 将对应输出buffer的index送入OutputQueue_队列// 将对应编码完成的数据data送入outBuffer队列AEncBufferSignal *signal = static_cast<AEncBufferSignal *>(userData);unique_lock<mutex> lock(signal->outMutex_);signal->outQueue_.push(index);signal->outBufferQueue_.push(data);
}
signal_ = new AEncBufferSignal();
OH_AVCodecCallback cb_ = {&OnError, &OnOutputFormatChanged, &OnInputBufferAvailable, &OnOutputBufferAvailable};
// 配置异步回调
int32_t ret = OH_AudioCodec_RegisterCallback(audioEnc_, cb_, signal_);
if (ret != AV_ERR_OK) {// 异常处理
}
  1. 调用OH_AudioCodec_Configure设置编码器。

    设置必选项:采样率,码率,以及声道数,声道类型、位深。

    可选项:最大输入长度。

    flac编码: 需要额外标识兼容性级别(Compliance Level)和采样精度。

    对于44100Hz采样率、2声道立体声、SAMPLE_S16LE采样格式的PCM音频,以32000bps的码率进行AAC编码的调用流程如下:

int32_t ret;
// 配置音频采样率(必须)
constexpr uint32_t DEFAULT_SAMPLERATE = 44100;
// 配置音频码率(必须)
constexpr uint64_t DEFAULT_BITRATE = 32000;
// 配置音频声道数(必须)
constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2;
// 配置音频声道类型(必须)
constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO;
// 配置音频位深(必须)
constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S16LE;
// 配置音频compliance level (默认值0,取值范围-2~2)
constexpr int32_t COMPLIANCE_LEVEL = 0;
// 配置音频精度(必须) SAMPLE_S16LE
constexpr OH_BitsPerSample BITS_PER_CODED_SAMPLE = OH_BitsPerSample::SAMPLE_S16LE;
// 每20ms一帧音频数据
constexpr float TIME_PER_FRAME = 0.02;
// 配置最大输入长度, 每帧音频数据的大小(可选)
constexpr uint32_t DEFAULT_MAX_INPUT_SIZE = DEFAULT_SAMPLERATE * TIME_PER_FRAME * DEFAULT_CHANNEL_COUNT * sizeof(short); // aac
OH_AVFormat *format = OH_AVFormat_Create();
// 写入format
OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT);
OH_AVFormat_SetIntValue(format,OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE);
OH_AVFormat_SetLongValue(format,OH_MD_KEY_BITRATE, DEFAULT_BITRATE);
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT);
OH_AVFormat_SetLongValue(format,OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT);
OH_AVFormat_SetIntValue(format,OH_MD_KEY_MAX_INPUT_SIZE, DEFAULT_MAX_INPUT_SIZE);
// 配置编码器
ret = OH_AudioCodec_Configure(audioEnc_, format);
if (ret != AV_ERR_OK) {// 异常处理
}

例FLAC调用流程:

int32_t ret;
// 配置音频采样率(必须)
constexpr uint32_t DEFAULT_SAMPLERATE = 44100;
// 配置音频码率(必须)
constexpr uint64_t DEFAULT_BITRATE = 261000;
// 配置音频声道数(必须)
constexpr uint32_t DEFAULT_CHANNEL_COUNT = 2;
// 配置音频声道类型(必须)
constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_STEREO;
// 配置音频位深(必须) flac 只有SAMPLE_S16LE和SAMPLE_S32LE
constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S32LE;
// 配置音频compliance level (默认值0,取值范围-2~2)
constexpr int32_t COMPLIANCE_LEVEL = 0;
// 配置音频精度(必须) SAMPLE_S16LE和SAMPLE_S24LE和SAMPLE_S32LE
constexpr OH_BitsPerSample BITS_PER_CODED_SAMPLE = OH_BitsPerSample::SAMPLE_S24LE;
OH_AVFormat *format = OH_AVFormat_Create();
// 写入format
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT);
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE);
OH_AVFormat_SetLongValue(format, OH_MD_KEY_BITRATE, DEFAULT_BITRATE);
OH_AVFormat_SetIntValue(format, OH_MD_KEY_BITS_PER_CODED_SAMPLE, BITS_PER_CODED_SAMPLE); 
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT); 
OH_AVFormat_SetLongValue(format, OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT);
OH_AVFormat_SetLongValue(format, OH_MD_KEY_COMPLIANCE_LEVEL, COMPLIANCE_LEVEL); 
// 配置编码器
ret = OH_AudioCodec_Configure(audioEnc_, format);
if (ret != AV_ERR_OK) {// 异常处理
}

例AMR编码调用流程:

int32_t ret;
// 配置音频采样率(必须),amr-nb输入采样率为8000hz的PCM,amr-wb输入采样率为16000hz的PCM
constexpr uint32_t DEFAULT_SAMPLERATE = 8000;
// 配置音频码率(必须)
// amr-nb支持码率4750、5150、5900、6700、7400、7950、10200、12200
// amr-wb支持码率6600、8850、12650、14250、15850、18250、19850、23050、23850
constexpr uint64_t DEFAULT_BITRATE = 10200;
// 配置音频声道数(必须)
constexpr uint32_t DEFAULT_CHANNEL_COUNT = 1;
// 配置音频声道类型(必须)
constexpr OH_AudioChannelLayout CHANNEL_LAYOUT = OH_AudioChannelLayout::CH_LAYOUT_MONO;
// 配置音频位深(必须)
constexpr OH_BitsPerSample SAMPLE_FORMAT = OH_BitsPerSample::SAMPLE_S16LE;
OH_AVFormat *format = OH_AVFormat_Create();
// 写入format
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_CHANNEL_COUNT, DEFAULT_CHANNEL_COUNT);
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUD_SAMPLE_RATE, DEFAULT_SAMPLERATE);
OH_AVFormat_SetLongValue(format, OH_MD_KEY_BITRATE, DEFAULT_BITRATE);
OH_AVFormat_SetIntValue(format, OH_MD_KEY_AUDIO_SAMPLE_FORMAT, SAMPLE_FORMAT);
OH_AVFormat_SetLongValue(format, OH_MD_KEY_CHANNEL_LAYOUT, CHANNEL_LAYOUT);
// 配置编码器
ret = OH_AudioCodec_Configure(audioEnc_, format);
if (ret != AV_ERR_OK) {// 异常处理
}
  1. 调用OH_AudioCodec_Prepare(),编码器就绪。
ret = OH_AudioCodec_Prepare(audioEnc_);
if (ret != AV_ERR_OK) {// 异常处理
}
  1. 调用OH_AudioCodec_Start()启动编码器,进入运行态。
unique_ptr<ifstream> inputFile_ = make_unique<ifstream>();
unique_ptr<ofstream> outFile_ = make_unique<ofstream>();
// 打开待编码二进制文件路径(此处以输入为PCM文件为例)
inputFile_->open(inputFilePath.data(), ios::in | ios::binary); 
// 配置编码文件输出路径(此处以输出为编码码流文件为例)
outFile_->open(outputFilePath.data(), ios::out | ios::binary);
// 开始编码
ret = OH_AudioCodec_Start(audioEnc_);
if (ret != AV_ERR_OK) {// 异常处理
}
  1. 调用OH_AudioCodec_PushInputBuffer(),写入待编码器的数据。

    如果是结束,需要对flag标识成AVCODEC_BUFFER_FLAGS_EOS

    aac: 每帧样点数(SAMPLES_PER_FRAME)建议使用20ms的PCM样点数,即采样率*0.02

    flac: 每帧样点数(SAMPLES_PER_FRAME)比较特殊需要,根据如下表格进行设置

    采样率样点数
    8000576
    160001152
    220502304
    240002304
    320002304
    441004608
    480004608
    882008192
    960008192

说明

aac编码的每帧样点数建议使用20ms的PCM样点数,即采样率*0.02。flac编码的样点数建议根据采样率按照表格传入,大于这个值也会返回错误码,如果小于有可能出现编码文件损坏问题。

 // 每帧样点数constexpr int32_t SAMPLES_PER_FRAME = DEFAULT_SAMPLERATE * TIME_PER_FRAME;// 声道数,对于amr编码声道数只支持单声道的音频输入constexpr int32_t DEFAULT_CHANNEL_COUNT = 2;// 每帧输入数据的长度,声道数 * 每帧样点数 * 每个样点的字节数(以采样格式SAMPLE_S16LE为例)constexpr int32_t INPUT_FRAME_BYTES = DEFAULT_CHANNEL_COUNT * SAMPLES_PER_FRAME * sizeof(short);uint32_t index = signal_->inQueue_.front();auto buffer = signal_->inBufferQueue_.front();OH_AVCodecBufferAttr attr = {0};if (!inputFile_->eof()) {inputFile_->read((char *)OH_AVBuffer_GetAddr(buffer), INPUT_FRAME_BYTES);attr.size = INPUT_FRAME_BYTES;attr.flags = AVCODEC_BUFFER_FLAGS_NONE;} else {attr.size = 0;attr.flags = AVCODEC_BUFFER_FLAGS_EOS;}OH_AVBuffer_SetBufferAttr(buffer, &attr);// 送入编码输入队列进行编码, index为对应队列下标ret = OH_AudioCodec_PushInputBuffer(audioEnc_, index);if (ret != AV_ERR_OK) {// 异常处理}
  1. 调用OH_AudioCodec_FreeOutputBuffer(),输出编码格式码流
uint32_t index = signal_->outQueue_.front();
OH_AVBuffer *avBuffer = signal_->outBufferQueue_.front();
// 获取buffer attributes
OH_AVCodecBufferAttr attr = {0};
ret = OH_AVBuffer_GetBufferAttr(avBuffer, &attr);
if (ret != AV_ERR_OK) {// 异常处理
}
// 将编码完成数据data写入到对应输出文件中
outputFile_->write(reinterpret_cast<char *>(OH_AVBuffer_GetAddr(avBuffer)), attr.size);
// 释放已完成写入的数据
ret = OH_AudioCodec_FreeOutputBuffer(audioEnc_, index);
if (ret != AV_ERR_OK) {// 异常处理
}
if (attr.flags == AVCODEC_BUFFER_FLAGS_EOS) {// 结束
}
  1. (可选)调用OH_AudioCodec_Flush()刷新编码器。

    调用OH_AudioCodec_Flush()后,编码器处于Flush状态,会将当前编码队列清空。

    此时需要调用OH_AudioCodec_Start()重新开始编码。

    使用情况:

  • 在文件EOS之后,需要调用刷新
  • 在执行过程中遇到可继续执行的错误时(即OH_AudioCodec_IsValid 为true)可以调用,然后重新调用OH_AudioCodec_Start
// 刷新编码器 audioEnc_
ret = OH_AudioCodec_Flush(audioEnc_);
if (ret != AV_ERR_OK) {// 异常处理
}
// 重新开始编码
ret = OH_AudioCodec_Start(audioEnc_);
if (ret != AV_ERR_OK) {// 异常处理
}
  1. (可选)调用OH_AudioCodec_Reset()重置编码器。

    调用OH_AudioCodec_Reset()后,编码器回到初始化的状态,需要调用OH_AudioCodec_Configure()重新配置,然后调用OH_AudioCodec_Start()重新开始编码。

// 重置编码器 audioEnc_
ret = OH_AudioCodec_Reset(audioEnc_);
if (ret != AV_ERR_OK) {// 异常处理
}
// 重新配置编码器参数
ret = OH_AudioCodec_Configure(audioEnc_, format);
if (ret != AV_ERR_OK) {// 异常处理
}
  1. 调用OH_AudioCodec_Stop()停止编码器。
// 终止编码器 audioEnc_
ret = OH_AudioCodec_Stop(audioEnc_);
if (ret != AV_ERR_OK) {// 异常处理
}
  1. 调用OH_AudioCodec_Destroy()销毁编码器实例,释放资源。

说明

资源不能重复销毁

// 调用OH_AudioCodec_Destroy, 注销编码器
ret = OH_AudioCodec_Destroy(audioEnc_);
if (ret != AV_ERR_OK) {// 异常处理
} else {audioEnc_ = NULL; // 不可重复destroy
}

最后呢

很多开发朋友不知道需要学习那些鸿蒙技术?鸿蒙开发岗位需要掌握那些核心技术点?为此鸿蒙的开发学习必须要系统性的进行。

而网上有关鸿蒙的开发资料非常的少,假如你想学好鸿蒙的应用开发与系统底层开发。你可以参考这份资料,少走很多弯路,节省没必要的麻烦。由两位前阿里高级研发工程师联合打造的《鸿蒙NEXT星河版OpenHarmony开发文档》里面内容包含了(ArkTS、ArkUI开发组件、Stage模型、多端部署、分布式应用开发、音频、视频、WebGL、OpenHarmony多媒体技术、Napi组件、OpenHarmony内核、Harmony南向开发、鸿蒙项目实战等等鸿蒙(Harmony NEXT)技术知识点

如果你是一名Android、Java、前端等等开发人员,想要转入鸿蒙方向发展。可以直接领取这份资料辅助你的学习。下面是鸿蒙开发的学习路线图。

在这里插入图片描述

针对鸿蒙成长路线打造的鸿蒙学习文档。话不多说,我们直接看详细鸿蒙(OpenHarmony )手册(共计1236页)与鸿蒙(OpenHarmony )开发入门视频,帮助大家在技术的道路上更进一步。

  • 鸿蒙 (OpenHarmony)开发学习视频》
  • 鸿蒙生态应用开发V2.0白皮书》
  • 鸿蒙 (OpenHarmony)开发基础到实战手册》
  • OpenHarmony北向、南向开发环境搭建
  • 鸿蒙开发基础》
  • 鸿蒙开发进阶》
  • 鸿蒙开发实战》

在这里插入图片描述

总结

鸿蒙—作为国家主力推送的国产操作系统。部分的高校已经取消了安卓课程,从而开设鸿蒙课程;企业纷纷跟进启动了鸿蒙研发。

并且鸿蒙是完全具备无与伦比的机遇和潜力的;预计到年底将有 5,000 款的应用完成原生鸿蒙开发,未来将会支持 50 万款的应用。那么这么多的应用需要开发,也就意味着需要有更多的鸿蒙人才。鸿蒙开发工程师也将会迎来爆发式的增长,学习鸿蒙势在必行! 自↓↓↓拿


http://www.ppmy.cn/devtools/94551.html

相关文章

10 - Linux系统安全及应用

目录 一、账号安全控制 1.系统账号清理 2.密码安全控制 3.命令历史限制 4.终端自动注销 二、用户切换和用户提权 1. su 命令 - 切换用户 1.1 su 命令的用途及用法 1.2 限制使用su 命令的用户 1.3 查看su操作记录 2. sudo 命令 - 用户提权 2.1 sudo 命令的用途及用法…

【Linux修行路】进程控制——程序替换

目录 ⛳️推荐 一、单进程版程序替换看现象 二、程序替换的基本原理 三、程序替换接口学习 3.1 替换自己写的可执行程序 3.2 第三个参数 envp 验证 ⛳️推荐 前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下…

八股总结----计算机网络

0.OSI七层模型 自己的理解&#xff1a;应用层&#xff1a;生成HTTP请求报文-----表示层&#xff1a;将请求报文转换成适合网络传输的数据格式&#xff0c;加密压缩编码等-----会话层&#xff1a;管理两个应用程序之间的会话&#xff0c;包括连接中断等------传输层&#xff1a…

uni-app发布安卓app打包时必须在APP模块配置中选中需要的模块

最近尝试开发一个语音对话的app&#xff0c;在调试阶段没有选中“record录音”模块&#xff0c;安卓基座运行在雷电模拟器上是没有问题的&#xff0c;但是直接云打包在手机上运行就不行了&#xff0c;语音输入没有反应。 经过试验发现是manifest.json没有勾选APP模块配置中的“…

HarmonyOS.FA开发流程

开发环境配置 1、DevEco Studio的安装 2、DevEcoStudio模拟运行工程&#xff1a;运行Tools->Device Manager&#xff0c;使用已认证的HW开发者联盟帐号Login&#xff08;在DP平台申请测试者权限&#xff09;&#xff0c;点击"允许"授权&#xff0c;选择一个设备运…

【深度学习】【语音】TTS,MeloTTS代码讲解

文章目录 推理split_sentences_zh 函数短句子转为音素和bert特征get_text_for_tts_infer 函数text_normalize函数_g2p_v2函数def _g2p(segments)cleaned_text_to_sequencehps.data什么是滤波长度短时傅里叶变换(STFT)滤波长度(filter_length)影响分析get_bert_featureinfer…

java快速导出word文档

点关注不迷路&#xff0c;欢迎再访&#xff01; 精简博客内容&#xff0c;尽量已行业术语来分享。 努力做到对每一位认可自己的读者负责。 帮助别人的同时更是丰富自己的良机。 文章目录 前言一.添加 Apache POI 依赖二.填充文档内容三.导出文档效果测试 前言 在 Java 应用程序…

uniapp接口请求this.$request

代码示例&#xff1a; createPhoto(url) {this.$request({url: /emp/gallery-photo/create,method: post,header: {tenant-id: 1,},data: {galleryId: this.albumId,empUserId: this.empUserId,"url": url,}}).then((res) > {console.log(res,"返回值"…