온디바이스 · Whisper

타이핑은 줄이고.
말은 더 많이.

AI 기반 Push-to-talk 받아쓰기. 커서가 있는 위치에 즉시 텍스트가 입력됩니다. 클라우드 전송도, 계정 가입도 필요 없습니다. 키를 뗀 후 입력까지 약 120ms밖에 걸리지 않습니다.

브라우저에서 체험하기 →

Apple Silicon 지원 · Whisper base 모델 · ~120 ms 지연 시간

이렇게 동작해요

말한 내용을 AI 가 바로 정돈된 글로

"교수님께 메일 보내줘" 라고 말하면 받아쓴 내용을 정중한 메일로 자동 작성. Raw · Local · Quick · Think 모드 중 선택.

음성으로 AI 에게 바로 지시

"이거 요약해줘" 처럼 말로 명령하면 AI 가 그 자리에서 실행. 받아쓰기를 넘어 음성 커맨드로.

자주 묻는 질문

오디오 데이터를 클라우드로 전송하나요?

절대 전송하지 않습니다. Whisper 모델은 뉴럴 엔진(구형 기기에서는 CPU)을 사용하여 맥북 내부에서 완전히 로컬로 실행됩니다. 오디오 데이터는 처음부터 끝까지 온디바이스로 머무릅니다. 서버 전송도, 회원 가입도 없고 오디오 자체에 대한 어떠한 분석 정보도 수집하지 않습니다.

인식 정확도는 어느 정도인가요?

Whisper base 모델은 조용한 환경에서 영어와 한국어를 비롯한 주요 언어들에 대해 매우 높은 정확도를 보여줍니다. 다른 로컬 모델과 마찬가지로 배경 소음이 심하거나 억양이 강하면 정확도가 떨어질 수 있습니다. 추후 업데이트를 통해 더 정밀한 인식을 원할 경우 small이나 medium 모델로 교체할 수 있는 옵션을 제공할 예정입니다.

인텔 맥에서도 작동하나요?

네, 작동합니다. 다만 뉴럴 엔진 대신 CPU에서 텍스트 변환을 처리하므로, 120ms 대신 약 400-800ms 수준의 지연 시간이 발생합니다. 사용은 가능하지만 실리콘 맥만큼 빠릿하지는 않습니다.

fn 키를 계속 누르고 있지 않고 핸즈프리로 쓸 수도 있나요?

Push-to-talk 방식은 마이크 활성화 시점을 정밀하게 제어해 원치 않는 텍스트 변환을 막도록 의도적으로 채택되었습니다. 토글 모드(클릭해서 시작, 다시 클릭해서 중단)는 향후 지원할 계획입니다.

어떤 언어가 지원되나요?

Whisper base 모델은 영어, 한국어, 일본어, 스페인어, 프랑스어, 독일어, 중국어, 아랍어 등 90개 이상의 언어를 지원합니다. fns는 모델이 처리할 수 있는 언어에 별도 제한을 두지 않으므로, Whisper가 처리할 수 있는 모든 언어가 받아쓰기에서도 지원됩니다.

뻔한 타이핑은 그만.

대기자 명단에 등록하고 Mac에서 온디바이스 음성 받아쓰기를 가장 먼저 사용해 보세요.