آیا به دنبال نرم افزار مک برای رونویسی فایل های صوتی به فایل های متنی نوشته شده هستید؟ ابزارهای پولی زیادی مانند Otter.ai و Trint وجود دارند که با شروع استفاده بیش از حد از آنها می توانند هزینه واقعی داشته باشند. ولی مک ویسپر راه حل رایگانی است که اینترنت منتظر آن بوده است. یا حداقل همونی که منتظرش بودم
OpenAI یک برنامه رایگان فوقالعاده قدرتمند را در سپتامبر 2022 منتشر کرد که به افراد با دانش فنی اجازه میداد فایلهای صوتی و تصویری خود را به رونوشتهای فوقالعاده دقیق تبدیل کنند. مشکل این بود که برای کاربر معمولی چندان در دسترس نبود، زیرا باید با استفاده از دستورات در برنامه ترمینال آشنا باشید.
اما با MacWhisper که اولین بار توسط آن مشاهده شد 9to5Mac، بالاخره فردی یک رابط کاربری گرافیکی یا رابط کاربری گرافیکی ایجاد کرده است که بر روی OpenAI's Whisper ساخته می شود و همه چیزهای گیج کننده فناوری را زیر سرپوش می گذارد و به شما امکان می دهد فایل صوتی خود را بکشید و رها کنید و خیلی سریع رونویسی دریافت کنید. و MacWhisper بسیار دقیق است زیرا Whisper OpenAI روی آن آموزش دیده است ساعت 680,000 داده های صوتی در وب
یکی از چیزهای خوب در مورد MacWhisper این است که شما فایل صوتی یا تصویری را که می خواهید در اینترنت رونویسی کنید، آپلود نمی کنید. این برای روزنامهنگارانی که ممکن است روی یک داستان حساس کار کنند یا هر کسی که عموماً نگران آپلود فایلهای شخصی خود در فضای ابری است، مهم است. فایل روی دسکتاپ شما باقی می ماند، به این معنی که هیچ شانسی وجود ندارد که کسی بتواند صدای شما را رهگیری کند.
باز هم، MacWhisper فقط یک رابط کاربری جدید برای یک برنامه رایگان است که اواخر سال گذشته توسط OpenAI معرفی شد، اما واقعاً رونویسی صدا را تقریباً برای هر کسی آسان می کند. زیرا من از Whisper استفاده میکردم و از زمانی که منتشر شد آن را بسیار مفید یافتم. و حتی من اکنون از MacWhsiper استفاده خواهم کرد، زیرا مطمئناً گردش کار من را سرعت می بخشد.
به عنوان یک مثال، پس از خبر سقوط شرکت رمزنگاری FTX، من از Whisper برای رونویسی ده ها ساعت مصاحبه قدیمی یوتیوب با بنیانگذار شرکت سام بنکمن-فرید استفاده کردم. از آنجا، من توانستم رونوشت ها را جستجو کنم و ایده های عجیب و جالبی برای نوشتن مقالات پیدا کنم، مانند زمانی که SBF در ژوئن 2021 گفت که بلاک چین انرون را اصلاح می کرد. مقایسه SBF با Enron تصادفی عجیب بود، با توجه به همه چیزهایی که اکنون در مورد چگونگی سقوط FTX می دانیم. اما هرگز آن لحظه را در یک مصاحبه مبهم قدیمی بدون داشتن ده ها متنی که می توانستم جستجو کنم، پیدا نمی کردم. و این فرآیند، در حالی که آسان تر از گوش دادن به ساعت ها و ساعت ها نوار بود، هنوز هم سخت بود و خیلی خودکار نبود.
پس از نصب Whisper بر روی دستگاهم، هر زمان که میخواستم فایلی را رونویسی کنم، «whisper audiofilename.mp3 —model tiny.en» را در برنامه ترمینال مک تایپ میکردم. با WhisperMac، من فقط می توانم فایل صوتی خود را بکشم و رها کنم و بدون تایپ اضافی، جادوی خود را انجام می دهد.
من MacWhisper را با یک قسمت از NBC Nightly News که از YouTube دانلود کردم آزمایش کردم. و جدای از چند اشتباه، مانند تفسیر کلمه "ویندلز" به "ویندشیل" و شنیدن لستر هولت به عنوان "لستر هولد"، متن بسیار دقیق بود. MacWhisper رایگان است، اما یک سطح پولی از نرمافزار وجود دارد که میتواند کمی دقیقتر باشد، زیرا از مدلهای آموزشی فشردهتر OpenAI استفاده میکند، اما نسخه رایگان برای اکثر افراد عالی کار میکند.
MacWhisper به شما امکان می دهد کلمه رونویسی شده را در چند فرمت مختلف از جمله متن ساده، CSV یا حتی فرمت فایل زیرنویس مانند SRT و VTT صادر کنید.
و MacWhisper فقط برای انگلیسی نیست. شما می توانید صدا را به 100 زبان مختلف رونویسی کنید، که فوق العاده مفید است. تنها ویژگی MacWhisper که من از بازی با Whisper در برنامه ترمینال لذت بردم، ترجمه زبان است. من ویدیوهای ویروسی را به روسی و چینی ترجمه کردهام و افرادی که در توییتر به این زبانها صحبت میکنند به من گفتهاند که ترجمهها دقیق.
ویژگی دیگری که MacWhisper ندارد، اگرچه در OpenAI's Whisper نیز موجود نیست، توانایی متمایز کردن بلندگوها است. برای مثال، اگر در حال رونویسی یک مصاحبه با دو گوینده هستید، هیچ علامت واضحی وجود ندارد که نشان دهد زمانی که یک گوینده متوقف شده و دیگری شروع شده است. اما من گمان می کنم که در نهایت کسی این توانایی را ایجاد کند. سرویسهای پولی مانند Tint این کار را بهطور خودکار انجام میدهند، و اگر در نهایت به صورت رایگان داشته باشید، عالی است، اما آنچه را که برای آن پرداخت میکنید، دریافت میکنید.
همچنین یک ویژگی با MacWhisper وجود دارد که در آن میتوانید گفتار را از میکروفون رایانه خود به متن تبدیل کنید، که اگر میخواهید چیزی را در لحظه رونویسی کنید، میتواند مفید باشد.
من ماهها به این فکر میکردم که بالاخره کی میتواند یک رابط کاربری گرافیکی برای Whisper ایجاد کند، زیرا چند نفر آن را بررسی کردند، اما چیزی خیلی کاربرپسند ایجاد نکردند. اما MacWhisper که توسط Jordi Bruin توسعه داده شد، نرم افزاری است که من منتظرش بودم. Bruin همچنین نرم افزارهایی مانند MacGPT، که به کاربران امکان می دهد از نوار منوی خود به ChatGPT دسترسی پیدا کنند.
می توانید MacWhisper را دانلود کنید رایگان، با ثبت ایمیل، در وب سایت بروین.
منبع: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/