Голос все частіше стає методом взаємодії з нашими пристроями, крім того, що він є єдиним методом для тих, хто потребує цього типу методів доступності. У будь-якому випадку досить зручно говорити, щоб диктувати текст, або просто вводити голосові команди в наші системи, щоб вони виконували якусь операцію, не використовуючи рук. Проблема в тому розпізнавання мови вони засновані на механізмах, які використовують математичні алгоритми для розпізнавання мови і не є 100% надійними.
Технологічний прогрес все більше приносить надійність до досконалості, а штучний інтелект та системи великих даних також дуже допомагають вдосконалити програми розпізнавання мови. Останнім часом докладається багато зусиль для вдосконалення цих систем до максимуму, і багато досліджень зосереджено на ньому, щоб поліпшити управління та зробити їх інтерфейсом майбутнього. Майте на увазі, що поточні інтерфейси менш природні для людей і менш швидкі, ніж голосові.
Системи розпізнавання голосу матимуть вартість у найближчі роки близько 10 мільярдів доларів, і тому великі компанії зосереджуються на розробці таких помічників, як Siri від Apple, Cortana від Microsoft або Mycroft для Linux, крім того, що вони стають все популярнішими та частішими продуктами, такими як Amazon Echo, Google Home або Apple HomePod для дому, а також інтегрують складні системи розпізнавання голосу в підключених автомобілях.
Що сказав наш список інструментів розпізнавання мови для Linux звук:
- Юлій: це потужний механізм безперервного розпізнавання мови з великим словниковим запасом.
- DeepSpeech: є реалізацією TensorFLow архітектури DeepSpeech від Baidu.
- Саймон: досить гнучка програма розпізнавання мови.
- Калді: є набором інструментів для розробки розпізнавання мовлення на C ++.
- CMUSphinx: у цьому випадку це механізм розпізнавання голосу для мобільних додатків та серверів.
- deepspeech.python: є реалізацією DeepSPeech з Python та використанням Baidu Warp-CTC.
Дуже добре, і чи буде якийсь хороший TTS (перетворення тексту в мову) для Linux?
У Windows та Android є дуже якісні голоси, такі як Loquendo, Ivona або NeoSpeech, але вони не для Linux. У Linux я спробував голоси mbrola та picoTTS, але вони дуже роботизовані.
Cepstral пропонує безкоштовний голос Алехандри для Linux, що цілком непогано, але я не знав, як його встановити.
Я гуляю тим самим, якщо ви отримуєте хорошу частку
Ви можете використовувати loquendo з вином на Linux. Я рекомендую це відео ...
https://www.youtube.com/watch?v=OfGxR_O0Vjk
Я спробував встановити помічника, я маю на увазі Google Assistant, і я не зміг, я залишився в тій частині файлу реєстру, я думаю, що він називається. Шкода, що Алекса - це лайно ...
Програма espeak працює на консолі espeak debian apt install. І приєднайтеся, наприклад, до espeak -ves «Hello World»
-ves - це v = голоси є = іспанська
У вас є багато варіантів прочитати текстовий файл, записати результат у wav-файл.
привіт
правда все дуже погано, вікна - це інший світ ... ось вони на 10 років позаду
А через 3 роки так! це все ще прострочене.