OpenBayes 一周速览|Apple 开源大模型 OpenELM 上线;字节发布 COCONut 首个全景图像分割数据集,入选 CVPR2024

news/2025/1/26 7:44:33/

公共资源速递

This Weekly Snapshots !

5 个数据集

* COCONut 大规模图像分割数据集

* THUCNews 新闻数据集

* DuConv 对话数据集

* 安徽电信知道问答数据集

* Sentiment Analysis 中文情感分析数据集

2 个模型:

* OpenELM-3B-Instruct

* OpenWebUI 代码库

3 个教程

* GeneFace++ 数字人 Demo

* 农作物病害图像分类教程

* 使用 PyTorch 逐步开发神经网络

访问官网立即使用:openbayes.com

公共数据集

1. COCONut 大规模全景图像分割数据集

COCONut 是由字节跳动发布的首个大规模人工标注的全景图像分割数据集,包含约 383K 个图像和 518 万个经过人工标注的全景分割掩码。该成果已入选 CVPR 2024 。

直接使用:

https://go.openbayes.com/F6w8w

2. THUCNews 新闻数据集

THUCNews 是根据新浪新闻 RSS 订阅频道在 2005~2011 年间的历史数据筛选过滤生成的,包含 74 万篇新闻文档,均为 UTF-8 纯文本格式。研究团队在原始新浪新闻分类体系的基础上,重新整合划分出了 14 个候选类别:财经、彩票、房产、股票、家居等。

直接使用:

https://go.openbayes.com/QbwNT

3. DuConv 对话数据集

DuConv 是一个基于电影和明星领域的数据集,包括票房、导演、评论等信息。该数据集包括 30k 个对话,大约 120k 个对话回合。

直接使用:

https://go.openbayes.com/ebHmd

4. 安徽电信知道问答数据集

数据集包含 15.6 万条安徽电信问答数据,包括用户提问、网友回答、最佳回答,数据集来源为百度知道,适用于 FAQ 问答系统。

直接使用:

https://go.openbayes.com/htHuT

5. Sentiment Analysis 中文情感分析数据集

数据集包括了四个领域的中文评论:笔记本电脑、汽车、相机和手机,可被用作于自然语言处理中情感分类任务。

直接使用:

https://go.openbayes.com/cQsMP

公共模型

1. OpenELM-3B-Instruct

OpenELM 是苹果研究团队推出的一种先进的开源语言模型。该模型为 OpenELM 3B 规模大小的指令调整模型。

直接使用:

https://go.openbayes.com/FCtPq

2. OpenWebUI 代码库

Open WebUI 是一个仿照 ChatGPT 界面的开源项目,它满足了模型 Web 服务部署的多样化需求,尤其为与 LLM 交互任务提供了解决方案。

直接使用:

https://go.openbayes.com/IWrtT

公共教程

1. 教程上新|特朗普与霉霉联动,GeneFace++ 用 3 分钟视频快速训练数字人

GeneFace++ 是一个只需训练一段人物视频,再导入喜欢的音频,就能轻松制作出唇形同步的全新人物视频的项目。「GeneFace++ 数字人 Demo」教程现已在 OpenBayes 平台上线教程为大家搭建好了环境,无需任何复杂的前期准备,点击克隆即可一键启动,快来利用「科技魔法」创造你专属的 AI 数字人分身吧~

在线运行:

https://go.openbayes.com/kn3Rr

2. 农作物病害图像分类教程

教程为使用 PyTorch 进行农作物病害图像分类,有助于训练机器学习模型来检测植物疾病、或开发自动植物诊断算法学习。

在线运行:

https://go.openbayes.com/iPnDS

3. 使用 PyTorch 逐步开发神经网络

PyTorch 可以用于构建深度学习模型,简化了定义、训练和推理神经网络的过程。本教程将介绍如何加载 CSV 数据集,定义多层感知器模型,并在 PyTorch 中进行训练和评估,为创建深度学习神经网络模型提供指导。

在线运行:

https://go.openbayes.com/hpKjW

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

更多详细教程,请观看:

https://www.bilibili.com/video/BV13G411R7ya/?spm_id_from=333.337.search-card.all.clickicon-default.png?t=N7T8https://www.bilibili.com/video/BV13G411R7ya/?spm_id_from=333.337.search-card.all.click

文章来源:https://blog.csdn.net/OpenBayes/article/details/138620322
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ppmy.cn/news/1458917.html

相关文章

5G Advanced and Release18简述

5G Advanced 5G-Advanced, formally defined in 3GPP Release 18, represents an upgrade to existing 5G networks. 先睹robot总结的5G Advanced的advancements: Enhanced Mobility and Reliability: 5G-Advanced will support advanced applications with improved mobility…

大数据技术概述_1.大数据的定义

1.维基百科的定义 大数据是指其大小或复杂性无法通过现有常用的软件工具,以合理的成本并在可接受的时限内对其进行捕获、管理和处理的数据集。这些困难包括数据的收入、存储、搜索、共享、分析和可视化。 2.Granter的定义 Granter公司关注大数据的三个量化指标&…

十二届蓝桥杯Python组3月中/高级试题 第四题

** 十二届蓝桥杯Python组3月中/高级试题 第四题 ** 第四题(难度系数 4,30 个计分点) 编程实现: 给定一组包含n个(n>3) 正整数数据,和一个正整数M,从这n个正整数中任意拿出两个数相 加&…

AR人脸道具SDK解决方案,实现道具与人脸的自然融合

AR人脸道具SDK解决方案,实现道具与人脸的自然融合美摄科技以其卓越的技术实力和创新能力,为企业带来了全新的AR人脸道具SDK解决方案。这一解决方案将为企业打开全新的市场机会,为用户带来前所未有的互动体验。 颠覆传统,开启AR人…

Python专题:五、条件语句

流程控制语句 count()字符串计数 句尾\分行写码 运行输入cmd 输入Python 回车进入shell python 解释器 shell模式 再给x1,没有结果出来 if条件语句关键词,x>5条件表达式,:条件结束,四个空格&#x…

计算机视觉与深度学习实战之以Python为工具:基于主成分分析的人脸二维码识别

注意:本文的下载教程,与以下文章的思路有相同点,也有不同点,最终目标只是让读者从多维度去熟练掌握本知识点。 下载教程:计算机视觉与深度学习实战-以MATLAB和Python为工具_基于主成分分析的人脸二维码识别_项目开发案例教程.pdf 一、引言 随着科技的快速发展,计算机视觉…

Liunx_DNS域名解析服务

目录 DNS术语 域名分层 顶级域名(Top-Level Domain, TLD) 二级域名(Second-Level Domain, SLD) 子域名(Subdomain) FQDN(Fully Qualified Domain Name) 域名分层的意义 域名…

Qt——HighLight篇

用HighLight绘制高亮按钮,之前有一篇讲述绘制pushButton按钮颜色的QpushButton绘制圆角矩形并绘制背景颜色-CSDN博客,这个是扩展,另一种实现方案。 想要将按钮的背景颜色设置为 Qt 的高亮显示颜色。可以使用 QPalette::Highlight 来获取 Qt 的…