亚洲精品欧美日韩-亚洲精品欧美一区二区三区-亚洲精品欧美综合-亚洲精品欧洲精品-亚洲精品欧洲一区二区三区

首頁
手機版
熱門搜索:
當前位置:電腦軟件多媒體類音頻處理CapsWriter

CapsWriter (離線識別語音輸入工具)綠色版v1.0

  • 大小:1GB
  • 語言:簡體中文
  • 類別:音頻處理
  • 類型:免費軟件
  • 授權:國產軟件
  • 時間:2023/05/30
  • 官網:http://www.taiyee.com.cn
  • 環境:Windows7/Windows10/Windows All

相關軟件

CapsWriter一款本地離線語音輸入識別工具,通過本軟件可幫助用戶快速高效的對輸入的語音進行識別并導出。在CapsWriter軟件中用戶只需按下caps鍵即可進行語音的輸入,軟件會自動的對內容進行識別,識別結果會以彩色顯示。

CapsWriter圖片

軟件介紹

這是 CapsWriter 簡陋的離線版,一個 PC 端的語音輸入工具。

運行后,只要按下鍵盤上的 大寫鎖定鍵,就會開始錄音,當你松開 大寫鎖定鍵 時,就會識別你的錄音,并將識別結果立刻輸入。

安裝方法

安裝 Python 后,在 cmd 窗口進入本文件夾,運行 pip install -r requirements.txt 安裝依賴

sherpa-onnx-bin 文件夾中已經放置了在 Win10-64 端預先編譯的 sherpa-onnx 二進制。

其它系統暫時需要按照 sherpa-onnx — sherpa 1.2 documentation 編譯后,放入 sherpa-onnx-bin 文件夾。

使用說明

運行 01sherpa-onnx-server.py 腳本,會載入 Paraformer 模型識別模型(這會占用1GB的內存,載入時長約十幾秒)

運行 02-CapsWriter-client.py 腳本,它會打開系統默認麥克風,開始監聽按鍵

按住 CapsLock 鍵,錄音開始,松開 CapsLock 鍵,錄音結束,識別結果立馬被輸入(錄音時長短于0.3秒不算)

注意事項

目前使用的模型是 Paraformer 非實時模型,即錄完再轉,因此錄音時間越長,上屏延遲越大。

主流性能的 Windows 筆記本,RTF 大約 0.06,即大約每 10s 錄音需 0.6s 轉錄時長。

本地模型對算力要求非常低,基本無需擔心性能問題

暫不支持標點符號,暫不支持逆標準化(如把中文數字轉阿拉伯數字)

為方便用戶檢查錄音質量、識別效果,腳本默認開啟了保存錄音,所有都被保存在了 audios 文件夾

標簽: 語音識別

下載地址

CapsWriter (離線識別語音輸入工具)綠色版v1.0

普通下載通道

網友評論

返回頂部