Подходы к решению проблемы невизуального представления математических текстов.
Картавцев С.А.
Украина.
Введение.
1.1 Актуальность проблемы.
За последние десятилетия стало очевидным, что незрячие специалисты и учёные в сфере точных наук способны реализовать свой творческий потенциал весьма эффективно и плодотворно. В настоящее время на различных предприятиях, в научных и учебных заведениях стран СНГ трудятся десятки незрячих инженеров-программистов, научных сотрудников, преподавателей, кандидатов и докторов математических и технических отраслей науки. И как можно предвидеть, в связи с появлением новых возможностей обработки информации, количество незрячих занятых в данной сфере со временем будет расти. Этот вид деятельности может стать весьма перспективным для трудоустройства и реализации творческих возможностей многих незрячих людей. Однако, такое станет возможным только в том случае, если удастся создать для них достаточно эффективные и доступные методы восприятия и обработки специфических видов информации, таких как математические, химические, формулы и другие виды формальных записей. Без решения этой проблемы труд незрячих в области точных наук будет неоправданно затруднён, что не может не сказаться резко отрицательно на конкурентной способности незрячих в условиях формирующегося рынка труда.
1.2 Существующие методы.
Наиболее традиционным решением данной проблемы является использование зрячего помощника, который призван читать вслух необходимые тексты и записывать под диктовку незрячего специалиста. Однако такой принцип работы ставит незрячего человека в психологическую и организационную зависимость от своего помощника. Зачастую это весьма негативно сказывается на эффективности творческого труда. Далеко не каждый человек может в полной мере проявить свой творческий потенциал, находясь в такой ситуации. А также большую роль играет оплата такого труда.
Традиционный Шрифт Брайля также не может быть эффективным средством передачи информации в виду ограниченности возможностей его использования.
Применение персонального компьютера в труде незрячих специалистов за последние годы показало огромные возможности этого инструмента обработки информации. Впервые незрячие получили равноправный доступ в всеобщее информационное пространство. Однако, в отличие от литературных текстов, записи на формальных языках математических формул и другой специфической информации оказываются весьма трудными для восприятия незрячим человеком.
1.3 Вывод информации
Для незрячего пользователя доступными являются только две формы представления информации: тактильный и звуковой.
К тактильному выводу относится информация выводимая на брайлевскую строку рельефно-точечных дисплеев, а также распечатки брайлевских принтеров. Эта информация может быть текстовой и графической.
При выводе математической информации шрифтом Брайля используются различные брайлевские системы записи формул, которые различным математическим объектам ставят в соответствие последовательности брайлевских символов. Такие записи по сути своей одномерны и потому весьма сходны с представлением информации в памяти компьютера. Также к тактильной форме необходимо отнести рельефные изображения. Простые схематические графические объекты возможно выводить с помощью некоторых брайлевских принтеров и рельефно-точечных графопостроителей. Также известны экспериментальные образцы графических рельефно-точечных дисплеев. Однако, серийно такие устройства пока не выпускаются в виду их чрезмерно высокой себестоимости.
Звуковая информация выводится в виде человеческой речи - записанной или синтезированной, а также в виде различных звуковых сигналов - музыкальных аккордов, простых тональных сигналов и т.п.
Оптимальным очевидно является одновременное использование обоих - тактильного и звуко-речевого, форм вывода информации, которые дополняют друг друга. Однако, в реальных экономических условиях наших стран для рядового пользователя более доступным является звуковой вывод информации, так как он требует аппаратного обеспечения, цена которого на 2 порядка ниже стоимости тактильных устройств.
2. Возможные пути решения.
Наиболее перспективным путём решения задачи невизуального представления математических объектов мы считаем создание программных средств, конвертирующих стандартные формальные языки записи математических объектов в форму звуко-речевых сообщений и/или в форму брайлевских нотаций. Такие программные продукты могут представлять собой как самостоятельные браузеры или редакторы математических текстов, так и инструментарий, включаемый в состав стандартных программных пакетов.
Система Брайля записи математических формул сама по себе является формальным языком со строго определённым синтаксисом. Поэтому здесь проблема состоит лишь в создании транслятора из одного формального языка в другой.
Сложнее дело обстоит со звуко-речевым представлением математической информации. Дело в том, что до сих пор не существует строгих описаний устно-речевого прочтения математических формул. Предполагается, что профессиональный математик интуитивно знает, как необходимо правильно прочитывать такие объекты вслух. Однако, для создания программного генератора устно-речевых описаний математических объектов необходимо строгое описание правил построения таких фраз.
3. Проблема интерпретации математических объектов.
3.1 Визуальная форма.
Обычный Литературный текст, который представляет собой простую последовательность символов, имеет одномерную, линейную структуру Чтение такого текста происходит в одном направлении - слева направо. В математических же нотациях большое значение имеет не только расположение символов относительно друг друга по горизонтали, но и их вертикальное размещение один относительно другого и по отношению к уровню основной строки. Читать такие структуры необходимо уже в двух направлениях: слева направо и сверху вниз. Таким образом, математические записи имеют уже двухмерную структуру.
Однако любая информация в памяти компьютера может храниться только как одномерная последовательность символов - линейная структура. Поэтому для описания визуальных конструкций математических формул используются различные формальные языки сходные с языками программирования. Примером такого языка может служить "TeX" разработанный известным американским математиком Дональдом Кнутом (Donald Knuth). Для описания размещения символов в этом языке используются специальные метасимволы - управляющие последовательности. Так, например, дробь вида:
(X+2)/(X-2)
на языке TeX описывается следующим образом:
$${x+2} {x-2}$$
По сути, команда в приведённой записи означает, что первая группа символов должна находится над второй и эти группы должны быть разделены дробной чертой. Подобным же образом работают и все остальные команды этого языка. Цель его использования: подготовка математических и других текстовых документов для высококачественной типографской печати.
Такая графическая ориентация формальных языков описания математических текстов порождает множество неоднозначностей в трактовке графических символьных конструкций. Так, например, запись:
COS x SIN x
Можно считать как произведением двух тригонометрических функций, так и суперпозицией:
COS(x*(SIN x)).
В то же время, любая математическая формула имеет чётко выраженную древовидную структуру. Например, выражение:
y=x+2
можно представить в виде дерева, корнем которого является равенство (=), левой ветвью - переменная y, а правая ветвь в свою очередь представляет собою поддерево с операцией сложения (+) в корне и символами x и 2, в левой и правой своих ветвях, соответственно.
3.2 Устно-речевое описание.
При речевом описании математических формул языком профессиональных математиков, как раз используется древовидная структура присущая этим объектам. Однако, в речевых конструкциях математических описаний также заложено много неоднозначностей. В основном они касаются группировки символов. Обычно, границы вложенных групп символов (ветвей древовидной структуры) обозначаются неречевыми средствами, такими как паузы после конца описания очередной группы.
4. Програмный интерпретатор.
Таким образом, становится ясным, что для преобразования графических записей в речевые конструкции описания математических формул необходимо создать транслятор, который способен преобразовывать описания графических конструкций в речевые формы. Такой транслятор должен состоять, как минимум, из трёх частей:
1) распознаватель символьных последовательностей формальных описаний графических конструкций,
2) преобразователь во внутренний язык представления математических формул;
3) звуко-зечевого браузера по математическому документу.
При создании распознавателя необходимо учитывать массу возникающих неоднозначностей в графических описаниях и продумать возможность влияния со стороны пользователя на интерпретацию символьных последовательностей.
Внутренний язык представления формул должен отображать логическую структуру формул и быть достаточно гибким для изменения трактовки различных объектов в зависимости от контекста и желания пользователя.
В задачу браузера входит создание дружественного интерфейса с пользователем и генерация звуко-речевых описаний математических формул.
5.Зарубежные аналоги.
Нам известна, по крайней мере, одна разработка, преследующая выше описанные цели. Это программа AsTeR (от англ. Audio system of Technical Reading). Её автор - американский математик Т.В. Раман (T.V. Raman). Ему удалось воплотить в своей разработке многое из поставленных задач.
6. Заключение.
Задача создания программной оболочки для речевого воспроизведения и редактирования математических текстов представляет собой нетривиальную проблему, решение которой позволит не только значительно повысить возможности специалистов с дефектами зрения, но и даст повод пересмотреть принципы подготовки электронных документов. Авторам и издателям технической литературы следует понимать, что графическая форма представления документов далеко не единственный способ донесения его до читателя. Различные информационные системы, базы знаний, поисковые сервера уже в самом ближайшем будущем потребуют чёткой однозначной организации математических и других формальных объектов. Поэтому потребуется не только их поверхностное графическое описание, но и воссоздание семантической структуры. И речевой интерпретатор является красноречивым тому свидетельством.
.[Содержание]