本工具旨在实时识别语音,将其转换为文字,并自动将文字复制到系统剪贴板。该工具利用 API 服务进行语音识别,并使用 Python 库进行音频捕获和剪贴板管理。
在开始之前,请确保已准备好了以下内容:
您可以直接从 PyPI 使用 pip
或 pipx
安装 asr2clip
:
# 使用 pip 安装
pip install asr2clip
# 或者使用 pipx 安装(推荐用于隔离环境)
pipx install asr2clip
git clone https://github.com/Oaklight/asr2clip.git
cd asr2clip
pip install -r requirements.txt
如果您使用 Conda,可以使用提供的 environment.yaml
文件创建环境:
conda env create -f environment.yaml
conda activate asr
~/.config/
目录中创建一个 asr2clip.conf
文件,已提供了一个示例文件 asr2clip.conf.example
。asr2clip.conf
文件中(YAML 格式):api_key: your_api_key_here
api_base_url: https://api.openai.com/v1
model_name: whisper-1
pyperclip
,请确保安装了 xclip
或 xsel
。可以通过以下命令安装:sudo apt-get install xsel # 基础剪贴板功能,对asr2clip无差别
sudo apt-get install xclip # 功能更强,对asr2clip无差别
asr2clip
Ctrl+C
停止工具。pydub
支持的所有音频格式(如 MP3、WAV、FLAC、AAC 等):asr2clip --input /path/to/audio/file.mp3
cat /path/to/audio/file.wav | asr2clip --stdin
asr2clip --duration 10
-o
或 --output
选项:
asr2clip --output /path/to/output.txt
asr2clip --output -
asr2clip --generate_config
asr2clip --quiet
asr2clip --config /path/to/config.conf
$ ./asr2clip.py --duration 5
Recording for 5 seconds...
Recording complete.
Transcribing audio...
Transcribed Text:
-----------------
1233211234567,这是一个中文测试。
The transcribed text has been copied to the clipboard.
pyperclip
已正确安装并与您的操作系统兼容。Linux 用户需要安装 xclip
或 xsel
。如果您想为此项目做出贡献,请 fork 仓库并提交 pull request。欢迎任何改进或新功能!
本项目采用 GNU Affero 通用公共许可证 v3.0。详情请参阅 LICENSE 文件。