Брой 10, 2008
Тема: ИНФОРМАЦИОННА БАНКА ЗАРИ
Съвременни форми на достъп до информация за хора със зрителни увреждания
Брайлов дисплей и синтетична реч
Съвременните методи на достъп до информацията са свързани с електронните технологии. Компютърът е средство за максимално удобно събиране, обработване и ползване на информация. За щастие, незрящите имат възможност чрез специални устройства и програми да ползват компютър, което означава, че те сами могат да набират и обработват информация. Но също така означава, че те могат да ползват огромно количество информация, събрана и обработена от други хора. Като изключим работата с графични изображения (снимки и видеофилми), незрящите са напълно равнопоставени със зрящите си колеги при ползването на компютърните технологии.
Работата с компютър е свързана с обмен на информация между потребителя и компютъра. За да подава команди към компютъра, незрящият потребител ползва стандартна клавиатура. Стандартната мишка е неудобна за ползване от незрящи.
През последните години са създадени и се усъвършенстват програми за командване на компютъра и въвеждане на информация чрез гласови команди - "ВиаВоис" и "Драгон Диктейт". Тези програми за разпознаване на говор се създават за ползване не само от слепи, но и от хора с двигателно-опорни затруднения, както и в области като медицината и космонавтиката. Това означава, че търсенето на такива програми ще нараства и съответно ще се усъвършенстват много по-бързо. За съжаление внедряването на подобни иновационни технологии е твърде скъпо за България. Но вече се разработват проекти за разпознаване на българска реч.
Обратната връзка между компютъра и незрящия се получава отново под формата на брайл или реч. Създадени са устройства, наречени брайлови дисплеи, които възпроизвеждат информацията от екрана на брайл. Поради високата им цена, обаче, редовият потребител не може да си позволи това удобство. Цените на брайловите дисплеи се измерват в хиляди долари.
До 2003 незрящите в България ползваха почти изключително синтезатора на българска реч, създаден в края на 80-те години на миналия век от Борислав Захариев. Синтезаторът на говор се състои от програма, синтезираща реч и специална платка за извеждане на звука. След усъвършенстванията, направени през 1995 г. от Торос Хованесиян, синтезаторът вече говори относително добре и на английски. Необходимостта от специална платка също отпадна. Сега синтезаторът може да работи и с широко разпространеното и евтино устройство "ковокс", и с повечето обикновени саундкарти.
През 1995 г. бе създадена програмата "Ехо" (тип скрийнрийдър), която озвучава клавиатурата и екрана на компютъра в операционна система DOS. С помощта на тази програма при всяко натискане на клавиш синтезаторът на говор произнася съответния знак. Със съответните команди незрящият потребител може да чуе определена буква, дума, ред, прозорец или съобщение на екрана; програмата автоматично разпознава и съобщава осветените команди от менютата, следи за появата на дадени съобщения, за да изпълни избрана команда; може сравнително лесно да се настрои към всяко приложение за DOS, работещо в текстов режим.
И така, притежавайки най-обикновен компютър с най-нисък клас 16-битов процесор, "ковокс" и описаните току-що програми, които са безплатни, незрящият потребител има равни условия за работа с информация с един зрящ потребител. Той може самостоятелно да набира и обработва информация; може да чете и обработва и набраната от някой друг информация.
В последните десетина години се наблюдава тенденцията големите производители на софтуер да създават програми за другите операционни системи, пренебрегвайки DOS. Отдавна има говорещи програми (тип скрийнрийдър), работещи много добре в среда на Windows 9X/XP, но за съжаление все още тези програми не работят добре с българска реч. Такива програми са JAWS for Windows (http://www.freedomscientific.com) и Window-eyes (http://www.gwmicro.com). Тези програми имат вградени синтезатори на английски и няколко други езика, които са с изключително добро качество. През 2003 г. бе създаден първият синтезатор на българска реч за операционна система Windows; качеството на синтезатора не бе на необходимото ниво, но чрез него стана възможно да се ползва Windows и от незрящи потребители, с български език.
През март 2005 г. започна разпространението на нова, много по-качествена програма за синтез на българска реч - SpeechLab. Тази програма е разработена от Българската асоциация по компютърна лингвистика с финансиране от Microsoft. Програмата се разпространява безплатно за незрящите хора в България от Фондация "Хоризонти" (http://horizonti.bg) и от Съюза на слепите в България.
SpeechLab е съобразена със стандарта SAPI5 на Microsoft и се интегрира много добре със скрийн рийдъри като JAWS for Windows, Window-eyes.
Програмата дава възможност потребителят да настройва скоростта, интонацията, височината на гласа, различни начини на четене на числа (вкл. и римски), чете относително добре дори на английски.
Преобразуване на Информацията
Видяхме, че информацията е напълно достъпна за незрящите чрез компютъра и говорещите програми. Чрез брайловия дисплей или синтетичната реч, обаче, незрящият може да чете само електронен текст; поради своето естество нито снимките, нито текущата видеоинформация може да бъде възпроизведена по този начин.
Това налага преобразувания на информацията в електронен текст. Традиционният и същевременно най-сигурен начин за въвеждане на електронни текстове е чрез клавиатурата на компютъра. Това е работа, с която и незрящите се справят чудесно. Но набирането на текст е твърде бавно и поради това неудобно за големи обеми от информация.
Съществуват и други, по-бързи начини за въвеждане на електронен текст.
OCR-програми за разпознаване на оптични символи
Това са програми, с помощта на които заснети чрез скенер страници с плоскопечатен шрифт се разпознават като електронен текст. Този процес протича на два етапа:
Сканиране (заснемане) на страница - извършва се чрез снимащо устройство - скенер - и се запаметява и показва от компютъра. За качеството на снимката е от голямо значение предварителната настройка на скенера и по-специално разделителната способност, контраста и цветността. Разбира се, сниманата страница също трябва да е чиста - без зацапвания, подчертавания и други подобни - и с гладка повърхност. Трябва да се отбележи, че за нуждите на OCR-програмите е достатъчен черно-бял скенер с разделителна способност 300 точки на квадратен инч - характеристики, които притежава и най-евтиният скенер.
Разпознаване на снимката като текст
Въпреки че снимката може да съдържа само текст, за компютъра това е снимка, графично изображение и е невъзможно да се обработва като текст. Функцията на OCR-програмите е да анализират снимките и да разпознаят и извлекат текстовата информация. Тази задача се усложнява твърде много от голямото разнообразие на шрифтове, различното качество на печата и хартията и не на последно място от способността на програмата да поддържа различни езици и в частност български. Поради тази сложност, степента на автоматично разпознаване варира и рядко достига 100%. Затова тези програми се правят за работа в интерактивен режим с оператора. Повечето OCR-програми могат да бъдат обучени да разпознават нетрадиционни шрифтове или дори ръкописи.
Веднъж разпознат, електронният текст може да бъде записан във формат, който може да се обработва от популярните текстообработващи програми като Microsoft Word и др.; в тези случаи шрифтът, разположението на текста върху страницата и целият формат на текста, включително и таблици и графики, се запазват. Разпознатият текст може да се запише и като чист, неформатиран текст, който потребителят може да обработи и форматира според специфичните си нужди.
С оглед на специфичните нужди на незрящите потребители в процеса на преобразуването може да се включи още един етап - приспособяване, преподреждане на части от текста за последователно прослушване. Много често текстовете съдържат сложни таблици с множество графи и колони. В тези случаи операторът разделя таблиците на графи и колони и ги подрежда последователно, като в зависимост от сложността на таблицата може да се наложи неколкократно повторение на отделни графи или колони.
Предимствата на сканирането на текстове се отнасят най-вече до скоростта на въвеждане на информацията. Както споменахме, електронният текст може обратно да се преобразува в реч. Това означава, че при много висока скорост на сканиране и разпознаване на текста той може в реално време да бъде преобразуван и в реч. На този принцип са създадени т. нар. "четящи машини". При тях целият процес е автоматизиран и протича много бързо, което позволява в момента на поставяне на страницата върху сканиращото устройство текстът да бъде прослушан.
Неудобствата на сканирането се свързват предимно с високите изисквания на OCR-програмите към шрифтовете и печата. Но с подобряването на полиграфическите технологии и материали тези затруднения постепенно се преодоляват.
В САЩ през 2002 е създаден специален стандарт за достъпни електронни книги Daisy (http://www.daisy.org). Този стандарт позволява текстът на книгата да се съхранява във вид, готов за ползване с говор, с брайлови дисплеи, изпринтен на брайл, с увеличен шрифт и т.н. Все още няма книги на български език, издадени в този формат.
Източници на електронни текстове
Поради удобствата, които компютрите предлагат, огромни количества информация са набрани и се набират на електронни носители. Световната мрежа "интернет" е средството за достъп и обмен на тази информация. Благодарение на синтетичната реч и на няколко програми, работещи в среда на операционната система DOS, незрящите в България също могат да ползват интернет дори и с най-старите 16-битови компютри. Това са програмите:LYNX - WWW-браузер, Minuet - WWW-браузер, E-mail клиент, FTP клиент; Nettamer - мултиклиент, подържащ HTTP, FTP, POP3 и дори IRC. Характерно за всички тези програми е, че работят в текстов режим на екрана.
Чрез Windows възможностите на потребителите значително се разшириха, защото скрийнрийдърите в тази операционна система могат да четат Web-страници, ориентирани към силно графичен и мултимедиен дизайн. От 2005 г. това е значително по-удобно и за незрящите български граждани, защото те могат да чуват информацията вече чрез SpeechLab.
Но при ползване на интернет често възниква проблем с достъпността на сайтовете. Консорциумът W3C е разработил правила за достъпност на сайтовете, които при спазване дават наистина добри резултати. (Правилата са поместени на адрес http://www.w3.org). В общи линии, при ползването на една WEB-страница проблеми с достъпността възникват, когато поместените на страницата документи съдържат скриптове, фреймове, неетикетирани картинки, анимирани изображения и др.
Всички статии на Брой 10, 2008
15 ОКТОМВРИ - МЕЖДУНАРОДЕН ДЕН НА БЕЛИЯ БАСТУН
Сбъдната мечтаНашият ден
АБОНИРАЙТЕ СЕ
Започна абонаментната кампания за изданията на ССБ за 2009 година.ДИСКУСИЯ
Кой манипулира съюзните членове и защо?По делата им ще ги познаете
ИЗ ЖИВОТА НА ОРГАНИЗАЦИИТЕ
ТроянДобрич
Плевен
Червен бряг
Левски
Долни Дъбник
Чирпан
ИНФОРМАЦИОННА БАНКА ЗАРИ
Съвременни форми на достъп до информация за хора със зрителни уврежданияКратък обзор на програмните продукти, поддържащи функции за достъпност
ЛИЧНОСТИ
Сърца, които могат само да изгарятОСЕМДЕСЕТ ГОДИНИ ОТ ОСНОВАВАНЕТО НА НАЦИОНАЛНО ЧИТАЛИЩЕ "ЛУИ БРАЙЛ"
Национално читалище на слепите "Луи Брайл" - носител на орден "Свети Кирил и Методий" първа степенПРЕМИЕРА
Димитър ГрудевПРОЕКТИ
"Създаване на ефективен модел за социално-икономическо развитие на териториалните структури на Съюза на слепите в България"СПОДЕЛЕНО ОТ ЧИТАТЕЛИ
ИзповедСПОРТ
Спортният риболов - все по-популярен сред незрящитеСпортовете, достъпни за незрящи, се обогатяват с още един
Отворен турнир за купата на България по голбал
Интервюта след големия финал