20241217使用M6000显卡在WIN10下跑whisper来识别中英文字幕

server/2024/12/18 13:11:22/

20241217使用M6000显卡在WIN10下跑whisper来识别中英文字幕
2024/12/17 17:21


缘起,最近需要识别法国电影《地下铁》的法语字幕,使用 字幕小工具V1.2【whisper套壳/GUI封装了】 无效。
那就是直接使用最原始的whisper来干了。
当你重装WIN10的时候,你就会发现有些东西需要是必须安装的了!


步骤:
1、在NVIDIA的官网下载并安装M6000显卡在WIN10下的最新驱动程序。
2、安装ffmpeg预编译版本。
3、安装python3.8,一定不要去Microsoft的软件商城里安装最新的python3.13等。最新的python不好安装Torch。
4、安装torch
5、安装whisper
6、开始识别。需要使用large模式


20240131在WIN10下配置whisper
2024/1/31 18:25


首先你要有一张NVIDIA的显卡,比如我用的PDD拼多多的二手GTX1080显卡。【并且极其可能是矿卡!】800¥
2、请正确安装好NVIDIA最新的545版本的驱动程序和CUDA。
2、安装Torch
3、配置whisper


【详细步骤】
1、在NVIDIA的官网下载并安装M6000显卡在WIN10下的最新驱动程序。
https://www.nvidia.cn/
https://www.nvidia.cn/drivers/lookup/
NVIDIA RTX / Quadro
Quadro Series
Quadro M6000
Windows 10 64-bit
Chinese (Simplified)


2、ffmpeg下载以及安装:【必须安装,否则运行时报错的!】
http://www.ffmpeg.org/download.html
Windows EXE Files

Windows builds by BtbN

Windows builds from gyan.dev
git
Links
https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z
https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-essentials.7z
参考名称:ffmpeg-2020-11-04-git-cfdddec0c8-essentials_build.7z
其它的预编译的ffmpeg也可以,但是没有测试!

解压缩之后得到三个exe文件,直接放到:
C:\Windows
ffmpeg.exe
ffplay.exe
ffprobe.exe


3、安装python3.8.10,一定不要去Microsoft的软件商城里安装最新的python3.13等。最新的python不好安装Torch。
https://www.python.org/downloads/
https://www.python.org/downloads/release/python-3810/
https://www.python.org/ftp/python/3.8.10/python-3.8.10-amd64.exe


4、安装torch
https://blog.csdn.net/m0_52156129/article/details/129263703
如何在你的电脑上完成whisper的简单部署

【根据你的位置或者网速,你下载的速度可能会很慢或者中断,重来即可!^_】
https://pytorch.org/get-started/locally/
Stable (2.5.1)
Windows
Pip
Python
CUDA 12.4

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

第一个文件特别大,可能要下载很久很久的。2GB的文件,200KBps的网速,搞了5-6个小时。下载的人崩溃!
通过技术手段上网用处不明显!


5、安装whisper
C:\Users\wb491>pip install -U openai-whisper
C:\Users\wb491>whisper -h


6、开始识别。需要使用large模式


参考资料:
https://blog.csdn.net/wb4916/article/details/135960188
20240131在WIN10下配置whisper


https://blog.csdn.net/wb4916/article/details/135757404
20240122在WIN10+GTX1080下使用字幕小工具V1.2的使用总结(whisper)


https://blog.csdn.net/m0_52156129/article/details/129263703
如何在你的电脑上完成whisper的简单部署

【根据你的位置或者网速,你下载的速度可能会很慢或者中断,重来即可!^_】
https://pytorch.org/get-started/locally/
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu118
pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu121


START LOCALLY
Select your preferences and run the install command. Stable represents the most currently tested and supported version of PyTorch. This should be suitable for many users. Preview is available if you want the latest, not fully tested and supported, builds that are generated nightly. Please ensure that you have met the prerequisites below (e.g., numpy), depending on your package manager. Anaconda is our recommended package manager since it installs all dependencies. You can also install previous versions of PyTorch. Note that LibTorch is only available for C++.

NOTE: Latest PyTorch requires Python 3.8 or later. For more details, see Python section below.


C:\2014[乌托邦(澳洲版) 第一季]Utopia.AU.S01.1080p.WEB-DL.AAC2.0.H.264-ABH[rartv]-7.83GB>nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Tue_Jun_13_19:42:34_Pacific_Daylight_Time_2023
Cuda compilation tools, release 12.2, V12.2.91
Build cuda_12.2.r12.2/compiler.32965470_0

C:\2014[乌托邦(澳洲版) 第一季]Utopia.AU.S01.1080p.WEB-DL.AAC2.0.H.264-ABH[rartv]-7.83GB>pip3 install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu121
C:\Users\wb491>pip install -U openai-whisper
C:\Users\wb491>whisper -h
C:\2014[乌托邦(澳洲版) 第一季]Utopia.AU.S01.1080p.WEB-DL.AAC2.0.H.264-ABH[rartv]-7.83GB>whisper Utopia.AU.S01E04.Onwards.and.Upwards.1080p.WEB-DL.AAC2.0.H.264-ABH.mkv --model small --language Chinese


http://www.ppmy.cn/server/151179.html

相关文章

前后端分离的项目使用nginx 解决 Invalid CORS request

我是这样打算的,前端用nginx代理,使用80 转443 端口走https 前端的地址就是http://yumbo.top 或https://yumbo.top 后端服务地址是:http://yumbo.top:8081 下面是我的完整配置,功能是正常的,加了注释 user nginx; …

蓝桥杯数列求值(2019试题C)

【问题描述】 给定数列1,1,1,3,5,7,17……从第4项开始,每项都是前3项的和。求第20190324项的最后4位数字。 【答案提交】 这是一道结果填空题,考生只需要计算出结果并提交即可。本题的结果为一个4位整数(提示:答案的千位不为0)&a…

华为ensp--BGP路径选择-Preferred Value

学习新思想,争做新青年。今天学习的是BGP路径选择-Preferred Value 实验目的 理解BGP路由信息首选值(Preferred Value)的作用 掌握修改Preferred Value属性的方法 掌握通过修改Preferred Value属性来实现流量分担的方法 实验拓扑 实验要求…

高效数据集成:钉钉与企业系统无缝对接

钉钉数据集成案例分享:鸿巢基础资料-供应商账号(删除操作) 在企业信息化管理中,数据的准确性和及时性至关重要。本文将聚焦于一个具体的系统对接集成案例——钉钉数据集成到钉钉,详细探讨如何通过轻易云数据集成平台实现“鸿巢基础资料-供应…

Linux应用开发————mysql数据库

数据库概述 什么是数据库(database)? 数据库是一种数据管理的管理软件,它的作用是为了有效管理数据,形成一个尽可能无几余的数据集合,并能提供接口,方便用户使用。 数据库能用来干什么? 顾名思义,仓库就是用来保存东…

JS设计模式之访问者模式

前言 访问者模式(Visitor Pattern)是一种 行为设计模式,它允许在不改变对象结构的情况下,定义新的操作。 这种模式通过将操作封装在访问者对象中,使得可以在不修改被访问对象的情况下,增加新的功能。 本…

AI、大数据、机器学习、深度学习、神经网络之间的关系

AI、大数据、机器学习、深度学习、神经网络之间的关系 一、人工智能(AI)的概念 人工智能是指通过计算机程序或机器来模拟、实现人类智能的技术和方法。它旨在使计算机具备感知、理解、判断、推理、学习、识别、生成、交互等类人智能的能力,…

React简单了解

原理简化了解 import React from "react" import { createRoot } form "react-dom/client"const element React.createElement(p,{id: hello},Hello World! )const container document.querySelector(#root) const root createRoot(container) root.r…