OpenAI، یکی از پیشروان در زمینه هوش مصنوعی، به تازگی مدلی جدید با نام “Voice Engine” را معرفی کرده است. این مدل قادر است با استفاده از یک نمونه صوتی 15 ثانیه ای، صدای طبیعی و شبیه به صدای اصلی سخنگو را تولید کند.
این تکنولوژی، که از اواخر سال 2022 در حال توسعه بوده، قبلاً برای تولید صداهای پیش فرض در API متن به گفتار OpenAI، ChatGPT Voice و Read Aloud استفاده شده است. اما با این حال، OpenAI به دلیل احتمال سوء استفاده از صدای مصنوعی، در مورد انتشار گسترده این تکنولوژی به صورت محتاط عمل می کند.
برای درک بهتر از کاربردهای احتمالی این تکنولوژی، OpenAI در پایان سال گذشته شروع به آزمایش خصوصی آن با گروه کوچکی از شرکای معتبر کرده است. این آزمایشات مقیاس کوچک به OpenAI کمک می کنند تا درک بهتری از چگونگی استفاده از Voice Engine در صنایع مختلف بدست آورد.
به عنوان مثال، شرکت فناوری آموزشی Age of Learning با استفاده از این تکنولوژی، محتوای صوتی پیش نویس شده را تولید کرده و همچنین با استفاده از Voice Engine و GPT-4، پاسخ های شخصی سازی شده واقعی را برای تعامل با دانش آموزان ایجاد کرده است.
با این تکنولوژی، Age of Learning توانسته است محتوای بیشتری را برای جمعیت گسترده تری ایجاد کند. این فقط یکی از کاربردهای ممکن برای Voice Engine است و امکانات بیشتری در انتظار کشف هستند.
با این حال، همچنان چالش هایی در راه است. OpenAI می داند که تولید صدا که شبیه به صدای افراد واقعی است، خطرات جدی دارد و به همین دلیل در مورد انتشار گسترده این تکنولوژی به صورت محتاط عمل می کند. اما با توجه به نتایج آزمایشات مقیاس کوچک، OpenAI قصد دارد تصمیم بهتری در مورد اینکه آیا و چگونه این تکنولوژی را در مقیاس بزرگ انتشار دهد، بگیرد.
با این حال، با توجه به پیشرفت های اخیر، آینده صدای مصنوعی بسیار روشن به نظر می رسد. با توجه به تلاش های OpenAI، ما می توانیم انتظار داشته باشیم که Voice Engine در آینده نزدیک، تحولات بزرگی را در زمینه تولید صدا ایجاد کند.