OpenAI додала в ChatGPT розпізнавання мови, картинок і озвучування тексту

1 рік назад

ChatGPT тепер вміє «говорити» і «слухати». Але лише у платній версії

Компанія OpenAI анонсувала масштабне оновлення чат-бота ChatGPT, яке передбачає пошук за зображеннями, розпізнавання мови та озвучування тексту.

Розпізнавання мови дає змогу поставити запитання чат-боту за допомогою голосу. Для цього ChatGPT використовує Whisper – модель з відкритим вихідним кодом, яку розробила OpenAI.

За перетворення тексту на мову відповідає нова модель, яка, за словами компанії, може генерувати “людиноподібний голос” лише за кількома секундами зразків мови. Наразі доступно п’ять варіантів голосів на вибір.

Пошук за зображеннями дає змогу зробити знімок предмета, що цікавить, і надіслати його в ChatGPT. Чат-бот спробує зрозуміти запит і відповісти відповідним чином.

Також можна використовувати інструмент малювання всередині програми, щоб вказати на конкретну частину картинки.

OpenAI визнає потенційні ризики нових функцій. Компанія не дозволяє ChatGPT обробляти фото людей і відповідати на запитання про них.

Нові функції стануть доступні передплатникам ChatGPT Plus Enterprise протягом двох тижнів. Пізніше компанія відкриє доступ до них для всіх охочих.

641
0
Дивіться також
Netpeak Group та Мінцифри запустили курс навчання з користування штучним інтелектом. Там викладатимуть технології написання текстів, створення картинок та вирішення завдань за ...
OpenAI випускає нову модель під назвою o1, першу в запланованій серії моделей штучного інтелекту здатних, до міркування» та ланцюжкового ...
OpenAI анонсував випуск свого наступного великого продукту: модель генеративного штучного інтелекту під кодовою назвою Strawberry, офіційна назва OpenAI ...