08.00.14 Google навчила ШІ виділяти голос однієї людини в натовпі | |
Як правило, люди можуть досить добре виділяти голос одного співрозмовника в галасливому натовпі, f jn комп'ютери з цим завданням справляються значно гірше. Однак в компанії Google розробили рішення для усунення цієї проблеми.
Група дослідників в рамках Google розробила систему глибокого навчання, яка здатна виділяти конкретні голоси, фіксуючи особи людей і визначаючи, коли вони говорять. Команда навчила свою нейронну мережу розпізнавати окремих мовців людей, а потім створювала віртуальні «групи» (разом з фоновим шумом), щоб навчити ШІ, як ізолювати кілька голосів на окремі звукові доріжки. В результаті, система штучного інтелекту навчилася досить добре розпізнавати голос окремої людини, навіть коли кілька людей говорить одночасно. При цьому, виходить створювати окремі звукові доріжки з чистою вимовою кожного мовця. ШІ справляється навіть з тими ситуаціями, коли людина частково закриває обличчя руками або мікрофоном. З результатом роботи системи можна ознайомитися в відео. В даний час Google вивчає можливості використання цієї функції в своїх продуктах. В якості основних сфер застосування називаються відеочати (Hangouts або Duo), де система зможе допомогти зрозуміти, хто говорить в переповненому приміщенні. Також дане рішення може бути корисно для поліпшення мови при запису відео. Крім того, можливі застосування і в інших сферах. Наприклад, об'єднавши слуховий апарат з камерою, можна посилювати звук голосу співрозмовника, відсікаючи фонові звуки і голоси інших людей. Хоча існують і потенційні проблеми конфіденційності, якщо хтось вирішить скористатися системою для публічного підслуховування. Джерело: Engadget | |
|
Всього коментарів: 0 | |