less टाइप करें।
और कहें।
एआई के साथ पुश-टू-टॉक डिक्टेशन। यह सीधे वहीं चिपक जाता है जहां आपका कर्सर है। कोई क्लाउड अपलोड नहीं, कोई खाता आवश्यक नहीं। रिलीज से लेकर टेक्स्ट तक लगभग 120 एमएस।
यह कैसे काम करता है
आप जो कहते हैं, उसे एआई द्वारा स्वच्छ लेखन में बदल दिया जाता है
'मेरे प्रोफेसर को एक ईमेल भेजें' कहें और श्रुतलेख स्वचालित रूप से एक परिष्कृत ईमेल बन जाता है। रॉ · लोकल · क्विक · थिंक मोड में से चुनें।
एआई को आवाज से निर्देश दें
'इसे संक्षेप में बताएं' जैसा कुछ कहें और एआई इसे मौके पर ही चला देता है। श्रुतलेख से परे - एक आदेश के रूप में आवाज।
प्रश्न.
क्या यह क्लाउड पर ऑडियो भेजता है?
कभी नहीं। व्हिस्पर पूरी तरह से आपके मैक पर न्यूरल इंजन (या पुरानी मशीनों पर सीपीयू) का उपयोग करके चलता है। आपका ऑडियो शुरू से अंत तक डिवाइस पर रहता है। ऑडियो पर कोई सर्वर, कोई अकाउंट, कोई टेलीमेट्री नहीं है।
यह कितना सही है?
व्हिस्पर बेस में शांत वातावरण में अंग्रेजी और अधिकांश प्रमुख भाषाओं के लिए मजबूत सटीकता है। भारी पृष्ठभूमि शोर या भारी उच्चारण के साथ सटीकता गिरती है, किसी भी स्थानीय मॉडल के समान। यदि आप एक सटीक ट्रेडऑफ़ चाहते हैं तो भावी रिलीज़ आपको छोटे या मध्यम मॉडल में स्वैप करने देगी।
क्या यह इंटेल मैक पर काम करता है?
हां, एक चेतावनी के साथ: ट्रांसक्रिप्शन न्यूरल इंजन के बजाय सीपीयू पर चलता है, इसलिए विलंबता अधिक है - 120 एमएस के बजाय लगभग 400-800 एमएस। बिल्कुल प्रयोग करने योग्य, उतना तेज़ नहीं।
क्या मैं एफएन को पकड़े बिना इसे हाथों से इस्तेमाल कर सकता हूं?
पुश-टू-टॉक जानबूझकर किया गया है - यह आपको माइक खुला होने पर नियंत्रण देता है और आकस्मिक ट्रांसक्रिप्शन से बचाता है। रोडमैप पर एक टॉगल मोड (शुरू करने के लिए क्लिक करें, रोकने के लिए क्लिक करें) है।
कौन सी भाषाएँ समर्थित हैं?
व्हिस्पर बेस अंग्रेजी, कोरियाई, जापानी, स्पेनिश, फ्रेंच, जर्मन, मंदारिन, अरबी और अन्य सहित 90+ भाषाओं का समर्थन करता है। एफएनएस यह प्रतिबंधित नहीं करता है कि कौन सी भाषाएं मॉडल तक पहुंचती हैं - व्हिस्पर जो भी संभालता है, आवाज से टेक्स्ट संभालता है।
स्पष्ट टाइप करना बंद करें।
प्रतीक्षा सूची में शामिल हों और अपने मैक पर डिवाइस पर वॉयस डिक्टेशन आज़माने वाले पहले व्यक्ति बनें।