跳到内容
设备上·耳语

输入
多说。

人工智能一键通听写。它直接粘贴到光标所在的位置。无需云端上传,无需帐户。从发布到文本大约需要 120 毫秒。

在 Apple Silicon 上运行 · Whisper 基础 · 约 120 毫秒延迟

它是如何工作的

你所说的,由AI变成干净的文字

说“给我的教授发送一封电子邮件”,听写就会自动变成一封精美的电子邮件。从原始·本地·快速·思考模式中进行选择。

通过语音向AI发出指令

说出“总结一下”之类的话,人工智能就会当场运行它。超越听写——语音作为命令。

问题。

是否将音频发送到云端?

从来没有。 Whisper 完全使用神经引擎(或旧机器上的 CPU)在 Mac 上运行。您的音频自始至终都保留在设备上。没有服务器,没有帐户,也没有音频本身的遥测。

它的准确性如何?

Whisper Base 在安静环境下对英语和大多数主要语言具有很强的准确性。与任何本地模型一样,严重背景噪音或重口音的准确性会下降。如果您想要精确权衡,未来的版本将允许您更换小型或中型型号。

它可以在 Intel Mac 上运行吗?

是的,但需要注意的是:转录在 CPU 而不是神经引擎上运行,因此延迟较高 - 大约 400-800 毫秒,而不是 120 毫秒。完全可用,只是不那么敏捷。

不按住 fn 可以免提使用吗?

一键通是有意为之的——它让您可以控制麦克风何时打开并避免意外转录。路线图上有切换模式(单击启动,单击停止)。

支持哪些语言?

Whisper Base支持90多种语言,包括英语、韩语、日语、西班牙语、法语、德语、普通话、阿拉伯语等。 fns 不限制哪些语言到达模型 - 无论 Whisper 处理什么,语音到文本处理。

停止输入显而易见的内容。

加入候补名单,抢先在 Mac 上尝试设备上语音听写。