Microsoft разпознава реч по-добре от човек

      Публикувано на четвъртък, 22 ноември , 2018      1471 Прегледа      Коментари Добави коментар
Microsoft разпознава реч по-добре от човек

  • Матрица

Технологията на Microsoft за разпознаване на устна човешка реч вече се справя с тази задача по-добре от хората.

В процеса на транскрибиране на телефонен разговор системата дава 5,1% грешки – колкото екип от специално обучени хора и по-малко от обикновените хора, при които делът на грешките е 5,9%, съобщават от компанията, цитирани от technews.bg.



През септември 2016 г. системата на Microsoft допускаше 6,3% грешки, което по онова време беше световен рекорд за точност при машинно транскрибиране.

Но през октомври компанията намали дела на грешките до 5,9% – точно толкова грешки допуска и средностатистическият човек.

Под дял на грешките се разбира процентът на думите, които се транскрибират неправилно по време на прослушване на телефонен разговор. За проверка на системата Microsoft прилага стандартен тест за правилно разпознаване на реч Switchboard, който се използва широко в тази сфера, вкл. от компании като IBM и Google.

В момента технологията на Microsoft може само да разпознава устна реч и да я представя коректно в писмена форма. Системата все още не е способна да разбере смисъла на думите. Освен това разпознаването е добро само при отчетлив разговор, на качествен запис. При наличие на странични шумове, процентът на грешките нараства.

Преди 20 години делът на неправилно разпознаваните от компютрите думи надвишаваше 43%. Компании от рода на Microsoft и IBM успяха да напреднат в тази сфера, благодарение на дълбоките невронни мрежи, чиято работа наподобява биологичните процеси в главния мозък на човека.

Невронните мрежи се считат за ключова технология не само в разпознаването на реч, но и в разработките на компютърно зрение. Тези мрежи се състоят от няколко слоя, а наскоро Microsoft създаде нов тип връзки между слоевете, благодарение на което спечели конкурса за компютърно зрение ImageNet 2016.

Критично важен компонент в системата за разпознаване на реч е инструментариумът за невронни мрежи Microsoft Cognitive Toolkit 2.1 (CNTK), който задейства дълбоки обучаващи алгоритми. За подобряване на акустичното моделиране също се използва специална невронна мрежа в комбинация с двупосочна краткотрайна памет.



Тласък на разработките даде и паралелната работа на графичните процесори (GPU). Първоначално те бяха създадени за компютърна графика, но в последните години се използват все по-често за обработка на сложни алгоритми, вкл. за разпознаване на реч. В частност, за по-бързо обучение на системата и тестване на нови идеи Microsoft използва облачни Azure GPU решения.

Етикети:
Категория Матрица | 2018/11/22 последна редакция в 7:10 AM
Източник : Дир | Снимка : Google
1472 Прегледа
Коментари Добави Коментар



Подобни публикации

Редакционният екип на Е Вести Лондон би искал да предостави на всички свои читатели от Лондон и целия свят възможността да участват активно в развитието на сайта! Ако си видял нещо интересно, забавно, скандално - просто нещо, което си заслужава да видят повече хора. Снимай го и го сподели в Е Вести Лондон заедно с кратък текст.
Реклама

Имате информация, която искате да достигне до нашите читатели?

Изпрати статия

Последни коментари

Спонсорирани връзки


Неизвестният Уинстън Чърчил BG Лондон

Неизвестният Уинстън Чърчил

В най-мрачните дни на Втората световна война способността му да поддържа духа на британците помогна за победата над…

С колко пари да дойда от България в Лондон? BG Лондон

С колко пари да дойда от България в Лондон?

Струмен Паунов 07786 967299 www.alexdevelopment.co.uk С колкото повече, толкова повече. Така би отговорил мечо Пух и ще Ви…

Бялата, красивата… BG Лондон

Бялата, красивата…

Тя не се обяснява. Идва неочаквано очаквано. Като всяка красота. Като подарък от сърце. Като крехка принцеса. Запазената…

С вкус на просеко и уикенд BG Лондон

С вкус на просеко и уикенд

Две много добре съчетаващи се думи. Не че не може всяка отделно да има своята сила и да…

Парченца живот BG Лондон

Парченца живот

Пролет, предпоследен ден, последен ден… Лято, първи ден, втори ден…за някои е горещо, за други – прохладно, че…

Газ….спирачка – запазената марка на автобусите в Лондон BG Лондон

Газ….спирачка – запазената марка на автобусите в Лондон

Да пътуваш с автобус в Лондон е много приятно, когато си турист. Даже си е кеф – гледаш…

BGM TV

Популярно в BGM TV

London, England – Kensington Gardens

7094 Прегледа

A walk through London, England that includes stops at Kensington Gardens, Hyde Park, Buckingham Palace and Westminster Abbey

Последно добавени в BGM TV

256 Прегледа

Aldgate Square

1602 Прегледа

London is Open

Royal

Актуална информация за кралскoто семейство във Великобритания

Лайфстайл

Начин на живот

Матрица

Всичко за новите технологии

Спорт

Aктуална спортна информация от страната и света.

Свежо

Интересни и любопитни новини

Коли

Из света на колите

Здраве

Всичко за вашето здраве. Здравни съвети, алтернативна медицина и билки