【声音转文字CapsWriter】声音随时转化为文字,CapsWriter提高工作效率

news/2025/2/10 14:05:16/

文章目录

    • 前言
    • 1. 软件与模型下载
    • 2. 本地使用测试
    • 3. 异地远程使用
      • 3.1 内网穿透工具下载安装
      • 3.2 配置公网地址
      • 3.3 修改config文件
      • 3.4 异地远程访问服务端
    • 4. 配置固定公网地址
      • 4.1 修改config文件
    • 5. 固定tcp公网地址远程访问服务端

前言

今天我要给大家安利一个神器——CapsWriter-Offline。这款工具可以用声音搞定所有文字输入的工作,绝对是一个不可错过的宝藏应用!它不仅能让你的语音瞬间变成文字,还能通过结合cpolar内网穿透技术实现远程访问和使用其强大的功能。

无论是整理会议录音、进行高效的聊天输入,还是处理其他复杂的文本转换任务,CapsWriter-Offline都能轻松应对。而且最重要的是,它的操作非常简单,上手几乎零门槛!

接下来的内容中,我会详细介绍如何在Windows系统中安装并使用这款工具,并且告诉你一些实用的小技巧和注意事项。相信我,掌握了这些方法后,你的工作效率将会有质的飞跃!

image-20240910164231263

1. 软件与模型下载

本例演示环境为Windows11,另外需要准备一个麦克风。

首先,我们需要下载CapsWriter-Offline的64位版本,可以使用服务端、客户端。然后需要下载models.zip模型文件。

下载地址:Releases · HaujetZhao/CapsWriter-Offline (github.com)

image-20240910164525004

将软件和模型下载好后进行解压,然后将解压好的模型文件夹models复制到解压好的CapsWriter-Offline的文件夹中并替换原有的同名文件夹。

image-20240910164649325

2. 本地使用测试

现在我们首先双击打开服务端(start_server),会弹出窗口对模型进行加载,加载完成后会提示开始服务:

image-20240910164924307

这时我们在双击打开客户端(start_client),会弹出窗口连接服务端并检测音频输入设备:

image-20240910165106716

显示连接成功即可开始使用了。

软件在Windows系统中默认使用大小写切换键caps lock进行语音输入(可以在配置文件中进行修改),一直按住说话,松手即可识别语音并在聊天软件对话窗口等界面进行输出:

image-20240910165630286

可以看到对语音的识别非常准确,连标点符号也是。

除了支持无限时长语音的转写,作者在更新后,软件现在还支持文件转录字幕。即在客户端可以转写音视频文件为 srt 字幕了,只需将音视频文件拖动到客户端 exe 上打开即可。大家感兴趣的话,可以自行尝试。

3. 异地远程使用

此时,我们已经可以在本地的Windows系统电脑中使用CapsWriter-Offline进行语音转文字了,但也仅能在本地局域网中的设备上使用,如果想在异地也能远程使用在本地部署的工具应该怎么办呢?

很简单,只要在本地电脑上安装一个cpolar内网穿透工具就能轻松实现公网环境远程访问内网部署的服务了,无需公网IP,也不用设置路由器那么麻烦,接下来就介绍一下如何安装cpolar内网穿透!

3.1 内网穿透工具下载安装

安装cpolar步骤:

Cpolar官网地址: https://www.cpolar.com

点击进入cpolar官网,点击免费使用注册一个账号,并下载最新版本的Cpolar

img

登录成功后,点击下载Cpolar到本地并安装(一路默认安装即可)本教程选择下载Windows版本。

image-20240319175308664

Cpolar安装成功后,在浏览器上访问http://localhost:9200,使用cpolar账号登录,登录后即可看到Cpolar web 配置界面,结下来在web 管理界面配置即可。

img

3.2 配置公网地址

接下来配置一下修改CapsWriter-Offline客户端文件需要用到的公网地址,

登录后,点击左侧仪表盘的隧道管理——创建隧道,

创建一个 CapsWriter-Offline 的公网TCP地址隧道

  • 隧道名称:可自定义命名,本例中使用123
  • 协议:选择tcp
  • 本地地址:6016
  • 端口类型:选择随机临时TCP端口
  • 地区:选择China VIP

点击创建

image-20240910170829126

隧道创建成功后,点击左侧的状态——在线隧道列表,查看所生成的公网访问地址,可以看到生成了tcp公网地址,复制即可。

image-20240910172519802

3.3 修改config文件

现在我们可以在异地使用另一台Windows系统电脑,下载好CapsWriter-Offline软件(无需下载模型文件)。

进入CapsWriter-Offline文件夹,使用vscode打开config文件对客户端配置进行修改:

image-20240910171815011

我们需要对客户端配置中的地址和端口进行修改,使用刚才cpolar生成的公网地址7.tcp.vip.cpolar.cn替换127.0.0.1,使用公网地址后的端口10906替换6016,保存文件即可。

image-20240910172026442

1725960417305

3.4 异地远程访问服务端

在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),可以看到通过使用cpolar生成的公网地址异地也能远程访问本地服务端,使用它进行语音转文字啦!

image-20240910173355703

小结

如果我们需要经常异地远程访问本地配置的服务,由于刚才创建的是随机的公网地址,24小时会发生变化。可以把地址设置成固定的TCP地址,不仅能够享受更多功能和更快的带宽,而且不用每次都重新创建隧道来访问,下面演示一下如何创建一个固定的tcp公网地址来解决这个问题。

4. 配置固定公网地址

我们接下来为CapsWriter-Offline配置固定的TCP公网地址,该地址不会变化,方便查看且无需每天重复修改访问地址。

登录cpolar官网,点击左侧的预留,选择保留的TCP地址,地区选择China VIP,填写一个备注(自己能记住就行)点击保留

image-20240910173831545

保留成功后复制这个tcp地址:

image-20240910173928682

返回登录Cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道:123,点击右侧的编辑:

image-20240910174033107

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 端口类型:选择固定TCP端口
  • 预留的TCP地址:填写刚才保留成功的tcp地址:3.tcp.vip.cpolar.cn:12635

点击更新(注意,点击一次更新即可,不需要重复提交)

image-20240910174221000

4.1 修改config文件

然后我们需要再次对客户端配置中的地址和端口进行修改,使用刚才配置的固定tcp公网地址3.tcp.vip.cpolar.cn替换7.tcp.vip.cpolar.cn,使用固定公网地址后的端口12635替换10906,保存文件即可。

image-20240910174459160

5. 固定tcp公网地址远程访问服务端

同样在本地电脑服务端(start_server)运行的前提下,现在使用这台异地电脑双击打开客户端(start_client),现在就可以通过使用cpolar配置的固定tcp公网地址远程访问本地服务端使用它进行语音转文字啦!不用每天修改公网地址,也能获得更快的访问速度。

891e7db64b7693d85f1ae5d0e056ef7

希望这篇文章能帮助你更好地了解CapsWriter-Offline的强大功能以及它与cpolar内网穿透技术结合后的无限可能。如果你对这款工具感兴趣或者有任何疑问,欢迎在评论区留言交流哦!别忘了分享给你的朋友们,让他们也一起来体验这种高效便捷的工作方式吧!


http://www.ppmy.cn/news/1570874.html

相关文章

Linux下安装SVN服务端小白教程

安装 使用yum安装非常简单: yum install subversion 配置 2.1. 创建仓库 我们这里在/home下建立一个名为svn的仓库(repository),以后所有代码都放在这个下面,创建成功后在svn下面多了几个文件夹。 [rootlocalhos…

了解大语言模型的基本原理(三)——如何正确使用ChatGPT

想要正确使用Chat GPT,就需要提高和AI沟通的质量和效率,这就需要提示工程(Prompt Engineering)。 ChatGPT的缺陷:由于LLM是根据预测下一个最大概率token来生成文本的,所以ChatGPT对于没有学习过的知识或者…

【5】阿里面试题整理

[1]. 介绍一下ZooKeeper ZooKeeper是一个开源的分布式协调服务,核心功能是通过树形数据模型(ZNode)和Watch机制,解决分布式系统的一致性问题。 它使用ZAB协议保障数据一致性,典型场景包括分布式锁、配置管理和服务注…

uniapp使用路由名称跳转

由于web端和app公用一套菜单,而两个项目的路径是不同的,为解决这个问题,封装了一套使用路由名称作为跳转路由的方法 1.在pages.json文件里pages对应的页面配置里添加 routeName 字段(自定义),我做的app里面…

基于lstm+gru+transformer的电池寿命预测健康状态预测-完整数据代码

项目视频讲解: 毕业设计:基于lstm+gru+transformer的电池寿命预测 健康状态预测_哔哩哔哩_bilibili 数据: 实验结果:

Unity3D实现UGUI拖拽移动

系列文章目录 unity工具 文章目录 系列文章目录👉前言👉一、实现原理👉二、方法一👉方法二👉壁纸分享👉总结👉前言 在 Unity UGUI 中实现拖拽移动的功能,主要基于事件系统、坐标转换和位置更新这几个关键步骤,下面详细介绍其原理 博客将会介绍如何实现UGUI拖…

如何将Excel的表格存为图片?

emmm,不知道题主具体的应用场景是什么,就分享几个我一般会用到的场景下奖excel表格保存为图片的技巧吧! 先来个总结: 方法 适用场景 画质 操作难度 截图(WinShiftS) 快速保存表格,方便粘贴…

使用WebUI访问本地Deepseek(Ollama集成Open WebUI)

在《deepseek本地部署和使用(Linux虚拟机)》中,我们使用Ollama部署了Deepseek-r1,但是只能通过命令行方式交互,默认Ollama启动后,会启动一个监听到127.0.0.1,用以接收POST 请求,服务…