一些GPU云平台使用体验

news/2024/11/28 22:37:06/

20221114更新

之前提到会试试AutoDL,发现AutoDL的实例数据能保存30天,之前说过恒源云只会保存24小时,否则就直接清空了,这是比较麻烦的一点,有时用完就需要自己保存下来,或者在24小时之内再租用,以重置24h,所以我准备用一段时间AutoDL看看情况~

以下为之前的内容


开门见山的说,我推荐恒源云这个平台,由于平台邀请新人会有奖励,我就先把我的注册链接放这吧(恒源云注册),不过你自己官网注册也可以,不强求hh。

以下均是个人的一些体验,不免会有些错误认知~

Google Colab

写这篇文章的原因主要是被某些平台的惊讶到了,在去年开始入门深度学习时,作为一个悲催的自学转行者,组里也没有个GPU,当时先知道的google colab,主要因为免费,那时候貌似是Tesla P100(FP16: 19.05 TFLOPS / FP32: 9.526 TFLOPS),还够用。但是用下来最蛋疼的是 ① 过一段时间就得动一下,不然就说长时间没有操作,给你断了。就白跑了(ˉ▽ˉ;)…(也有解决方法是弄个脚本吧,可以搜一下)② 用多了还不给你用了,说达到GPU使用量限额,无语了。其它的还有在线写代码以及看源码都不太方便,比较习惯用vscode。就很少用了,刚看了一下现在分配到的GPU是Tesla T4(FP16: 65.13 TFLOPS / FP32: 8.141 TFLOPS)(注:这里T4的FP16应该是16 TFLOPS左右–参考第二个回答)

colab

Kaggle

然后就是kaggle,一个星期免费40h的GPU使用时间,同样的问题就是很难长时间运行,说在 Commit 模式下,使用GPU 的代码最多只能连续运行9个小时,超过9个小时强行终止。网上也有一些解决办法,反正我是不想折腾了,现在提供的GPU为Tesla P100 PCIe 16GB:

在这里插入图片描述

注:上面这两提供的CPU都是单核的,os.cpu_count() = 2,就是说DataLoader的num_workers最多写2。另外都是需要翻墙的,下载上传本地数据体验下来都挺慢的。不过值得说的优点就是下载网络上的资源比如国外网站上的数据集和文件,或者pip安装包啥的还真的是很快的。

再之后接触到了GPU租用的一些平台

矩池云

第一个使用的是叫矩池云(价格)的,也是在哪看到别人推荐来着,一开始也不太懂,用着也还行吧,会有一个5G的免费网盘,租用的任一机器里访问和修改网盘里的数据,这点其实挺好的,不用数据传来传去的。但是我最近再看这网站,发现当时年少无知没经过对比,贵的离谱啊,无语了,种类也偏少,Tesla V100-16GB(FP16: 28.26 TFLOPS / FP32: 14.13 TFLOPS )6元/h,RTX 3090 24GB(FP16: 35.58 TFLOPS / FP32: 35.58 TFLOPS )5元/h,意思就是我如果用一天16GB的V100,就要上百了?!

恒源云

第二个使用的直接就是恒源云(价格)了,当时也是在哪里看到了推荐,说新用户注册送100元的代金券,就试了一下(其实其中有一个满200可用的40元券,以及当时能用代金券的机子普遍会贵点,现在感觉是一个价)。可以对比一下,它的Tesla V100-PCIE-16GB只要1.5元/h,RTX 3090 1.99元/h,2块钱在矩池云只能租到NVIDIA RTX A2000 12GB(FP16: 7.987 TFLOPS / FP32: 7.987 TFLOPS),而恒源云的NVIDIA RTX A4000 16GB(FP16: 19.17 TFLOPS / FP32: 19.17 TFLOPS)也才1.2元/h。平台内置提供了很多公共数据集(每个平台应该都有),直接cp到自己位置就行,避免国内服务器下载慢的问题,用下来各方面都还可以,主要关心的还是价格方面,连接的步骤也很简单,我一般都是vscode的Remote-SSH直接连接到主机就行,安装过的库和一些设置在你主动释放前会一直保存在控制台(但10天未启动会自动释放),还行。唯一不太方便的地方感觉就是数据传来传去真不方便,如果训练完不传出来保存的话,停止使用24h后数据就会被清空。

在这里插入图片描述

hh主要恒源云比较好用,就没怎么尝试其它平台了

九天 • 毕昇

九天 • 毕昇刚看了下,新用户注册给500算力豆,在线的vscode/jupyter
在这里插入图片描述

创建了一个实例,8核32G那个(如果要用的话肯定得8核,核数太小会拖累速度)

在这里插入图片描述

Tesla V100S-PCIe 32GB(FP16: 32.71 TFLOPS,FP32: 16.35 TFLOPS),挺不错的啊,显存也挺大的,不知道数据传输方不方便,后续可能用用试试。但是只有500算力豆,一小时20算力豆只能25个小时,看到说每成功邀请一位新用户注册,将赢取500个算力豆,对方将赢取1000个算力豆,算力豆有效期均为180天,原来被邀请竟然也会多500算力豆,谁给我一个邀请码,我的邀请码是这个(●ˇ∀ˇ●)。

极链AI云

之后还了解到了几个平台,比如极链AI云

在这里插入图片描述

3090为4.1元/h

MistGPU

在这里插入图片描述
3090 4.5元/h

AutoDL

在这里插入图片描述

这个价格看着也还挺合理的,可以考虑

Featurize

在这里插入图片描述

长租最低指的是按月来,一个月一千多。。。按天租便宜不了多少,这个不考虑了

智星云

在这里插入图片描述

算了吧,这个也不考虑了

总结

1、感觉还是比较幸运的,不然一直用矩池云的话早亏到家了,恒源云用下来确实还可以,花了也快有300块钱了,如果是学生认证的话会更优惠一点,90天内累计充值的金额大于50 / 300 / 600分别会给青铜(93折) / 白银(9折) / 黄金会员(85折)
在这里插入图片描述

但是我本人还没有去认证,需要填的比较详细,还得学生证,不知道安不安全。

2、后续可能用用九天 • 毕昇和AutoDL,前者看看有没有搞到豆的省钱方法。毕竟白嫖才是真香!

3、文中显卡的算力数据均来自芯参数评测,半精度不知道准不准。

4、要是大家有更加合适的平台可以分享一下呀o( ̄▽ ̄)ブ


http://www.ppmy.cn/news/380343.html

相关文章

MySQL启停要十分钟?

一、问题背景 基础环境: 主机类型:x3850 X6 操作系统:DB:Red Hat Enterprise Linux 9.1 7.8 存储:IBM存储,500GB 内存:64 G CPU型号:E7-4830 v3 2.10GHz CPU核数:32CORE 数据…

Python神经网络编程学习笔记

文章目录 神经网络基本原理线性分类器学习率一个线性分类器的局限性逻辑AND、逻辑OR逻辑XOR 神经元sigmoid function的logistic function(逻辑函数) 多层神经元演示只有两层,每层两个神经元的神经网络的工作矩阵大法(点乘)使用矩阵乘法的三层神经网络示例反向传播误…

总结一下一路开发邮件服务器遇到的事

这里写自定义目录标题 集成第三方做个邮件收发一直在正常发件一段时间后 集成第三方做个邮件收发 需求是很简单的,刚开始什么都很顺一下就开发完了,邮件收发很顺。 几个月后,遇到的第一个问题,邮件发不了错误号 526 Authenticati…

为什么年龄越大工作失误越多水平越低能力越差-个人案例

此为内容创作模板,在发布之前请将不必要的内容删除 在日复一日的工作中,我们免不了会产生一些失误,会因此感到沮丧和失望。但如何正确地对待和处理这些失误才是最重要的,它直接影响到我们的工作表现和个人成长。一起来谈谈作为职…

不愧是阿里大牛珍藏的“redis深度笔记(全彩版)”这细节讲解,神了

前言 说到 Redis 相信对于我们这些程序员来说太熟悉了,Redis 凭借着自己超高的超高的性能、完美的文档、简洁易懂的源码和丰富的客户端库支持,很快就在国内的互联网市场占据了一席之地,得到了广大用户的一致好评,随着国内外使用 …

昨天新买了一个耳麦,...

昨天新买了一个耳麦,罗技的,虽然罗技一向以鼠标著称,但这款耳机性能还不错,虽然线比较长,但背景噪声很小,音质也可以,我比较喜欢:),平时听音乐的时候我就戴上…

win10系统,主机箱的前置耳麦插孔用不了,“设置——声音”麦克风或者耳机已拔出未修复,“输入设备”无插座信息,更新驱动也无效,控制面板——小图标里查不到realtek高清晰音频管理器——一招解决

win10系统,有一天忽然固态硬盘坏了,拆了重装系统之后主机箱的前置耳麦插孔里,插了耳机只能听到声音,麦克风无效,微信语音电话打不出去了。 查了一圈,“设置——声音”显示:麦克风或者耳机已拔出…

w7运行里的计算机怎么设置,w7怎么设置耳麦_win7耳麦在电脑上怎么设置

相信现在还有许多用户在使用win7系统,尽管win7系统已经出了很长一段时间,还是有些用户不太清晰win7一些功能设置在哪。大家应该都有使用过耳机吧,那么w7怎么设置耳麦?有时候我们的讲话对方听到的声音很小,那可能是耳麦…