CapsWriter一款本地離線語音輸入識別工具,通過本軟件可幫助用戶快速高效的對輸入的語音進行識別并導出。在CapsWriter軟件中用戶只需按下caps鍵即可進行語音的輸入,軟件會自動的對內容進行識別,識別結果會以彩色顯示。
軟件介紹
這是 CapsWriter 簡陋的離線版,一個 PC 端的語音輸入工具。
運行后,只要按下鍵盤上的 大寫鎖定鍵,就會開始錄音,當你松開 大寫鎖定鍵 時,就會識別你的錄音,并將識別結果立刻輸入。
安裝方法
安裝 Python 后,在 cmd 窗口進入本文件夾,運行 pip install -r requirements.txt 安裝依賴
sherpa-onnx-bin 文件夾中已經放置了在 Win10-64 端預先編譯的 sherpa-onnx 二進制。
其它系統暫時需要按照 sherpa-onnx — sherpa 1.2 documentation 編譯后,放入 sherpa-onnx-bin 文件夾。
使用說明
運行 01sherpa-onnx-server.py 腳本,會載入 Paraformer 模型識別模型(這會占用1GB的內存,載入時長約十幾秒)
運行 02-CapsWriter-client.py 腳本,它會打開系統默認麥克風,開始監聽按鍵
按住 CapsLock 鍵,錄音開始,松開 CapsLock 鍵,錄音結束,識別結果立馬被輸入(錄音時長短于0.3秒不算)
注意事項
目前使用的模型是 Paraformer 非實時模型,即錄完再轉,因此錄音時間越長,上屏延遲越大。
主流性能的 Windows 筆記本,RTF 大約 0.06,即大約每 10s 錄音需 0.6s 轉錄時長。
本地模型對算力要求非常低,基本無需擔心性能問題
暫不支持標點符號,暫不支持逆標準化(如把中文數字轉阿拉伯數字)
為方便用戶檢查錄音質量、識別效果,腳本默認開啟了保存錄音,所有都被保存在了 audios 文件夾
標簽: 語音識別
-
8 GoldWave
裝機必備軟件
網友評論