Брой 10, 2022
Тема: ПОРТРЕТ
Представяме ви проф. Стоян Михов
През тази година началото на лятото зарадва незрящите хора в България с появата на новия, качествено различен синтезатор на българска реч Neural speechLab, който е революционен не само за нашата страна, но и в световен мащаб.
Огромна част от незрящите българи са чували името на проф. Стоян Михов. Той заедно с екипа си разработи двата български синтезатора – новия, но и първия, популярен в средите на незрящите като Гергана.
Доскоро ние просто бяхме чували и знаехме името на проф. Михов, но нямахме представа кой всъщност е той.
С изключително удоволствие се срещнах с него, за да поговорим за неговата житейска биография и научната му кариера.
И така - запознайте се по-отблизо с проф. Стоян Михов.
Той е роден през 1968 година в София.
Сменил е няколко училища, като е учил в Софийската математическа гимназия, но завършва Националната математическа гимназия през 1986 година.
След отбиването на задължителната тогава двегодишна военна служба през 1988 г., той е студент в Софийския университет със специалност "Математика".
"Смея да твърдя, че по онова време образованието, което получавахме във Факултета по математика и информатика за специалността "Математика" беше наистина на световно ниво. Тогавашното ни образование беше по-добро от образованието, което получаваха нашите западни колеги."
Проф. Михов сподели, че е ориентиран към математиката още от ранните си години. Спомня си, че когато е бил в прогимназиална възраст, са му подарили книга на Мартин Гарднер, наречена "Математически развлечения", което е и първият му допир до тази наука.
По-късно той има късмета да попадне на добри преподаватели в гимназията, повечето от които са били от Софийския университет.
Това са причините и предпоставките, предопределили професионалната и научната му кариера.
- Кога и как се ориентирахте към информационните технологии?
- Когато бях ученик, компютърните технологии тепърва изгряваха и в училище имахме едни много, много стари машини "Правец 82". Всъщност имаше някакви часове по информатика, но те не бяха в рамките на официалната програма. И, разбира се, всички много се забавлявахме с елементарните тогава компютърни игрички. Програмирахме си също нещо елементарно. Но още преди да постъпя в университета, много разумно ме посъветваха да се занимавам по-скоро с математика, защото на един добър математик е много по-лесно да работи с информационни технологии. Напоследък много програмисти се занимават с информатика твърде технологично. Имам предвид, че повечето от тях масово преизползват готови модули и много рядко им се налага сами да програмират нещо ново. По този начин се реализират някакви компилации от вече създадени кодове. Ако обаче човек иска да направи нещо наистина съществено ново, той трябва да разбере как работят нещата в дълбочина, т.е. – математиката. Затова съм много благодарен на моите учители, които ме посъветваха да се насоча по-скоро към математиката, за да ми е лесно за всичко останало в бъдеще. Всъщност точно така и стана. След като се е преборил с тежките математически предмети, на човек е доста по-лесно да се занимава със задачите от информатиката. Но от моя гледна точка - светът е еднороден. Просто ние изкуствено си го разделяме на някакви отделни области. Абстрактно погледнато, проблемите са единни – дали ще правим синтез на реч, или ще строим космическа ракета - физиката си е физика и светът се подчинява на едни и същи физически закони. И ако човек иска да направи нещо съществено, той трябва да може да ги разбира, да ги използва. Та ето затова се занимавах с математика и по-нататък вече ми беше лесно да прилагам знанията си за решаването на някакви по-конкретни приложни задачи.
- Откога и по какъв начин възникна контактът ви с незрящи хора и респективно интересът ви към технологиите text to speech?
- Нека се върна малко по-назад във времето. Когато завърших семестриално обучението си в Софийския университет, аз прекарах известно време в Мюнхенския университет в Центъра за обработка на език и информация. Тогава слушах няколко интересни курса, единият от които беше курс за обработка на реч, където професор Тилман ми беше направил много силно впечатление. Именно там за пръв път се сблъсках с въпросите за цифрова обработка на сигналите за реч, за артикулационен апарат и така нататък.
Години по-късно информационните технологии събират проф. Михов с незрящи, изявили желание да се включат в магистърска програма по компютърна лингвистика на Софийския университет. Един от тях е Ивайло Маринов, който обяснява много детайлно крещящата нужда на слепите хора от български синтезатор на реч, работещ под windows. Като резултат през март 2005 г. започна разпространението на нова качествена програма за синтез на българска реч - SpeechLab. Тази програма е разработена от Българската асоциация по компютърна лингвистика с финансиране от Microsoft. Програмата се разпространява безплатно и се ползва и до днес от незрящите хора в България. SpeechLab е съобразена със стандарта SAPI5 на Microsoft и се интегрира много добре със скрийн рийдъри като JAWS for Windows, Window-eyes и NVDA. Програмата дава възможност потребителят да настройва скоростта, интонацията, височината на гласа, различни начини на четене на числа (вкл. и римски), чете относително добре дори на английски. Основният двигател за реализирането й беше Стоян Михов, който заедно с екипа на БАКЛ я адаптира и за мобилни телефони, работещи под андроид.
На въпроса ми има ли опасност с напредването на технологиите и усъвършенстването на хардуера синтезаторът speechLab да спре да работи - професорът ме убеди, че ако операционната система не се измени коренно с последващите обновления, нашата Гергана ще продължи да работи още години напред.
И въпреки че за новия софтуерен продукт neural speechLab вече е казано и написано много, отново ще подчертая, че за разлика от текущия speechLab той е едно наистина революционно творение на научния гений на нашите специалисти, базиран на коренно различна основа на дълбоките невронни мрежи и предоставящ едно изключително високо качество на гласовете.
Както при реализирането на всеки нов софтуер, и при този има известни забележки от потребители, свързани с някои специфики на произношението или с несъвместимостта му с по-остарели устройства.
С течение на времето обаче всички тези нестиковки ще се изчистят и гласовете на neural speechLab ще навлязат сред незрящите така масово, както и гласът на актрисата Гергана Стоянова.
По принцип е напълно възможно към текущата платформа да бъдат добавени и други гласове, различни от тези на Александър Воронов и Христина Ибришимова, но това е въпрос на бъдещи проекти.
Професор Михов е убеден, че екипът му ще реализира съвместни проекти за създаване на нови софтуерни продукти, улесняващи достъпа до информация на хората лишени от зрение. В този смисъл вече има изграден здрав мост за бъдещо сътрудничество.
"Изградихме много добри и успешни отношения с хора от Съюза на слепите, а с някои от тях в някакъв смисъл станахме дори приятели", допълни той.
Стоян Михов е професор в Института по информационни и комуникационни технологии на Българската академия на науките. Завежда лаборатория на института, където ръководи развитието на речевите технологии. Наред с това, той е и лектор, и научен ръководител на магистърската програма по компютърна лингвистика във Факултета по математика и информатика на СУ "Свети Климент Охридски". В момента ръководи разработването на научноизследователски и развойни проекти за най-съвременни системи за разпознаване на българска реч и синтез на реч, базирани на дълбоки невронни мрежи. Автор е на над 60 научни статии и монография, публикувани от световни научни издания.
Марина ПЕТКОВА
Всички статии на Брой 10, 2022
**ПРАВОСЛАВЕН КАЛЕНДАР
м. Ноември15 ОКТОМВРИ – МЕЖДУНАРОДЕН ДЕН НА БЕЛИЯ БАСТУН
Живот като на родеоДАРИТЕЛСТВО
Пореден жест на търговска верига "БИЛЛА – България"ИЗ ЖИВОТА НА ОРГАНИЗАЦИИТЕ
ВарнаВелико Търново
Мездра
Русе
ПОРТРЕТ
Представяме ви проф. Стоян МиховРЕКЛАМИРАЙТЕ ПРИ НАС
Рекламна тарифа на списание "Зари"РЕКЛАМНА СТРАНИЦА
Представяме ви "Успех Филтър ССБ" ЕООДРЕХАБИЛИТАЦИЯ
Трета национална конференция по ориентиране и мобилностС ПОЛЪХ НА ЕСЕН
Наслука и във второто десетилетиеСОЦИАЛНИ ДЕЙНОСТИ
Нова крачка в развитието на социалните услуги за хората със зрителни уврежданияСПОРТ
Десето държавно първенство по шоудаунНационален турнир по боулинг за купа "Марица"