Основные понятия технологии обработки экономической информации
Функционирование АИС основано на ТПОД. Эффективность АИС во многом определяется качеством построения и функционирования ТПОД. С целью дальнейшего рассмотрения конкретизируем определения основных категорий ТПОД. Технологический процесс обработки данных — это совокупность методов и средств, организованных в логическую последовательность этапов обработки и выдачи информации пользователю для решения экономических задач. Этап ТПОД — это совокупность взаимосвязанных процедур, реализующих определенную функцию технологического процесса. Процедура ТПОД — это совокупность технологических операций, обеспечивающая реализацию логической части этапа технологического процесса обработки данных. Операция ТПОД — это элементарное действие, обеспечивающее промежуточный логический результат процедуры технологического процесса обработки данных. Технологический процесс состоит из этапов. Процедурой может быть распечатка отдельного документа на принтере среди множества других результатных документов, просмотр промежуточных документов, уточнение содержания буфера обмена и др. Процедура реализуется посредством набора операций обработки. Примером операции может быть нажатие клавиши «ввод» на клавиатуре, которое идентифицируется как команда на начало поиска или вывода найденного файла на экран.
Процедуры преобразования данных имеют арифметическую и логическую основы. Арифметическую основу составляют операции сложения, вычитания, умножения и деления. Логические условия работы ЭВМ и алгоритма обработки определяются в соответствии с аксиоматическим аппаратом алгебры логики. Этот аппарат сформулировал английский математик Дж. Буль (отсюда название — булева алгебра).
Задавайте вопросы нашему консультанту, он ждет вас внизу экрана и всегда онлайн специально для Вас. Не стесняемся, мы работаем совершенно бесплатно!!!
Также оказываем консультации по телефону: 8 (800) 600-76-83, звонок по России бесплатный!
Отметим основные категории булевой алгебры:
• конъюнкция (логическое умножение) — связывание двух или нескольких высказываний в одно посредством союза «И»
• дизъюнкция (логическое сложение) — объединение двух или нескольких высказываний посредством союза «ИЛИ»
• инверсия (логическое отрицание) — присоединение частицы «НЕ» к высказыванию.
• эквивалентность — логическая операция, результат которой истинен, если оба высказывания имеют одинаковые значения (оба истинны или оба ложны).
• импликация — логическая операция, заключающаяся в логическом следовании «если А, то В».
Очень часто в информационном поиске применяются булевские операции, в частности при сопоставлении ПОД и ПОЗ. Так, например, при необходимости исключения из поиска и выдачи данных по определенному объекту в ПОЗ этому объекту проставляется знак инверсии. Применение логических операторов значительно улучшает качество поиска необходимых сведений.
Следует отметить, что каждый этап ТПОД реализует определенную функцию АИС, в частности регистрацию, сбор, передачу, ввод в ЭВМ, обработку, поиск, хранение, актуализацию, корректировку, вывод, отображение, копирование, тиражирование и др. Эти этапы взаимоувязаны между собой в логическую последовательность. Коротко поясним каждую из указанных функций. Регистрация данных — фиксирование сведений на материальный носитель. Сбор данных — процесс получения сведений от источников информации. Передача данных — процесс перенесения сведений от источника к получателю. Ввод данных в ЭВМ — процесс перевода сведений в память ЭВМ. Обработка данных — совокупность логических и арифметических операций по преобразованию данных в информацию, обеспечивающую решение задачи пользователя. Поиск данных — совокупность логических операций по отбору необходимых сведений из БД по запросу пользователя. Хранение данных — размещение сведений на материальном носителе и поддержание их в работоспособном состоянии. Актуализация данных — процесс обновления сведений путем добавления, в единицу информации вновь полученных данных. Корректировка данных — процесс исправления ошибочных сведений в определенной единице информации. Вывод данных из ЭВМ — процесс перемещения данных из памяти ЭВМ на устройства представления данных, находящиеся вне ЭВМ. Отображение данных — процесс представления сведений в удобной для восприятия человеком форме. Копирование данных — операция по идентичному воспроизведению данных. Тиражирование данных — процесс воспроизведения данных в определенном количестве идентичных экземпляров.
ТПОД в значительной мере определяется характером АИС и соответствующим объектом управления. Современные технологии обработки данных представляют довольно широкий типологический ряд. По уровню открытости архитектуры технологии можно дифференцировать на замкнутые и сетевые. Сетевые технологии можно разделить на локальные и открытые. По характеру обрабатываемой информации технологии можно разделить на текстовые, табличные и графические. По логическому уровню обработки информации они подразделяются на технологии обработки данных, технологии поиска данных, технологии преобразования данных, технологии интеллектуальных систем. Возьмем несколько оснований деления и выделим классы технологических процессов.
Путем сочетания выделенных классов можно строить различные схемы технологических процессов обработки данных от простых до сложных. Так, например, можно в глобальной сети выдавать ежедневно в интерактивном режиме комбинированную информацию об объекте по любому набору показателей деятельности предприятия.
После исправления ошибок на этапе 9 осуществляется ввод документов в ЭВМ. В расширенном понимании ввод данных в ЭВМ может быть выполнен посредством набора текста документа (данных) на клавиатуре — этап 10, через оптико-читающее устройство, например сканер (этап 2), через каналы связи — этап 12, если АИС имеет сетевую реализацию, или ЭВМ коммутирована с абонируемым каналом связи, а также через речевой ввод — этап 13. В АИС с расширенными технологическими свойствами ввод данных может происходить через набор устройств ввода. Выбор устройства определяется характером документов и соответствующей экономической задачи. Так, например, необходимость оперативности ввода данных вызывает необходимость применения сканера на автоматизированном рабочем месте продавца магазина.
На этапе 14 проводится программный контроль входных документов. Соответствующие программы настроены на форматы входных документов и выполняют в зависимости от содержания и структуры документа лексический, синтаксический, логический или арифметический виды контроля достоверности и полноты данных в документе.
При условии отсутствия ошибок во входных документах они заносятся в БД. Затем на этапе 15 происходит формирование исходных массивов документов для решения определенной задачи и обработка данных. Обработка проводится в соответствии с прикладными программами пользователя по решению функциональных задач.
В зависимости от характера задачи, объемов обрабатываемой информации и технологического времени ЭВМ во время обработки на этапе 16 могут быть применены процедуры промежуточного контроля корректности обработки, например вывод промежуточных документов, визуальный контроль достоверности данных (на дисплее) со стороны оператора решения задачи. Если замечены ошибки, обработка прекращается, принимаются меры по выявлению ошибок в работе программных или технических средств, что предотвращает непродуктивное использование временных, трудовых и вычислительных ресурсов АИС. Если ошибок нет, то производится окончание обработки и выдача документов на этапе 17. В зависимости от класса АИС вывод результатов обработки может быть проведен на различные устройства — дисплей, принтер, специальные планшеты и др.
На этапе 18 проводится заключительный контроль результатов обработки данных по решению задачи. Если ошибки обнаружены, они исправляются. Например, при плохом качестве распечатки документа на принтере, проводится перепечатка документа. Если же ошибки более серьезного характера, например результаты расчетов неправильны, то проводится перепроверка исходных данных и новый сеанс обработки данных. При условии отсутствия ошибок в выходных документах последние на этапе 19 передаются пользователю, те специалисту, ответственному за решение задачи. На этапе 20 проводится анализ документов пользователем. Если в результате анализа на этапе 21 обнаружены ошибки, то на этапе 22 проводится идентификация, классификация и исправление ошибок. Если же ошибок нет, то на этапе 23 проводится анализ ситуации и подготовка решения по управлению экономическим объектом.
В рамках задач АСОД обрабатываются данные сравнительно обширного объема, но по тривиальным алгоритмам. В зависимости от уровня АСОД и характера решаемой задачи технологическое время обработки может составлять от минуты до нескольких десятков часов. Основная трудоемкость и технологическое время приходится здесь на этапы ввода документов (этап 9) и корректировку ошибочных данных (этап 14). Решение задач АСУ, наряду с обработкой данных в режиме АСОД, связано также с обработкой и подготовкой оптимальных вариантов решения задач управления экономическим объектом. Задачи оптимизации базируются на исходных данных сравнительно небольшого объема. Однако технологическое время реализации программ ЭВМ по расчету оптимальных вариантов решения задач требует значительных вычислительных ресурсов. Иногда машинное время решения оптимизационной задачи составляет несколько часов.
При решении экономических задач довольно часто пользователь вынужден осуществлять поиск необходимой информации по соответствующему запросу Технология прохождения запроса на поиск информации представлена в виде принципиальной схемы функционирования АИПС.
С целью получения необходимых документов или данных пользователь составляет запрос в произвольной форме на естественном языке (этап 2). Свой запрос он направляет в контур АИПС в службу индексирования. Его запрос регистрируется и редактируется (этап 3). Запрос редактируется в части обеспечения его полноты и уточнения содержания с позиций ПрО решаемой экономической задачи. Затем запрос индексируется, те. проводится аналитико-синтетическая переработка текста запроса (этап 4). Индексирование запроса состоит в анализе набора ключевых слов запроса и унификации этого набора в виде дескрипторов соответствующего дескрипторного ИПЯ (этап 5). Затем в этом блоке проводится перенос результатов индексирования запроса на специальный формат (бланк) — поисковое предписание, или ПОЗ (этап 6). В этом предписании содержатся дескрипторы, а также логические правила, по которым будет выполняться поиск нужной информации. Затем ПОЗ передается на участок ввода документов в ЭВМ (этап 7). В зависимости от режимов загрузки ЭВМ этот ПОЗ может быть введен сразу или по мере накопления комплекта определенного объема. При вводе документа в ЭВМ проводится лексический, синтаксический, логический или арифметический виды контроля в зависимости от характера ПОЗ (этап 8). При условии обнаружения ошибки производится ее идентификация и исправление (этап 9).
Сообщения об ошибке оператору могут быть выведены на дисплей или принтер в форме протокола ввода ПОЗ в ЭВМ. При условии отсутствия замеченных ошибок проводится вызов программы поиска. Эта программа проводит обращение к структурированной БД и последующий анализ документов (этап 10).
Технология поиска информации по запросу в значительной мере определяется характером БД. При поиске в документальной БД проводится сравнение дескрипторов ПОД с дескрипторами ПОЗ на предмет их совпадения (этап 11). При условии совпадения определенного количества дескрипторов ПОД и ПОЗ программа проводит селекцию ПОД из БД в отдельный массив ПОД (этап 12). Программа проводит селекцию при условии релевантности ПОД. Релевантность — это соответствие содержания документа в БД поисковому образу запроса пользователя. Релевантность программа поиска определяет на основе заданного критерия смыслового соответствия или критерия выдачи (см. разд. 3.2). Таким образом, обеспечивается полнота и точность выданных по запросу документов. В определенной мере полноту и точность при поиске обеспечивают условия логики поиска, задаваемые в ПОЗ. Так, например, из списка релевантных ПОД могут быть изъяты документы, содержащие информацию о матричных принтерах, если в ПОЗ стоит логическая метка, обозначающая условие «кроме матричных принтеров». При условии несовпадения программа пропускает ПОД и переходит к анализу следующего ПОД в БД (блок 13).
Поиск в фактографической БД проходит несколько иначе. Анализу подвергается каждая запись документа, содержащая идентификаторы в соответствии с ИПЯ задач, базирующихся на фактографической информации, т.е. здесь имеется в виду ИПЯ классификационного типа — кодификаторы, словари, справочники. При условии совпадения идентификаторов (кодов) искомой единицы информации (показателя, записи, документа и т.д.) и идентификаторов ПОЗ программа проводит селекцию релевантной единицы фактографической информации. Следует отметить, что селекция единицы информации проводится только при условии полного совпадения единицы информации и ПОЗ. Таким образом, действие критериев выдачи, полноты и точности относительно поиска фактографических единиц информации теряет смысловую нагрузку.
Результаты поиска могут быть выданы на видеотерминал или распечатаны на принтере (этап 14). Затем проводится контроль качества поиска и распечатки результатов (этап 15). При низком качестве поиска, как по содержанию, так и по оформлению проводится идентификация и исправление дефектов поиска (этап 9). Если дефектов не обнаружено, то результаты поиска передаются пользователю (этап 1). Получив результаты поиска, пользователь проводит анализ и оценку качества поиска. При удовлетворительном качестве он применяет полученную информацию в процессе решения соответствующей задачи. Если же результаты поиска не удовлетворяют пользователя, то он корректирует свой запрос и процедура поиска повторяется. Подобные технологические итерации могут повторяться до тех пор, пока пользователь не будет полностью удовлетворен результатами поиска.
При сетевом варианте АИС контур пользователя может быть представлен как АРМ. Тогда подготовка и передача запроса, а также выдача результатов поиска проходит по каналам связи. При данном условии упрощается корректировка запроса и сокращается технологическое время на реализацию уточненного сеанса поиска.
Методы и средства технологического контроля обработки экономической информации
Основная особенность технологии обработки данных в том, что в ее рамках обычно создается множество дефектов обработки, которые в конечном итоге снижают уровень качества не только ТПОД, но и работы АИС в целом. Следует отметить, что возникающие случаи искажения информации, идентифицируемые как дефекты обработки, носят вероятностный характер. Так, например, 0,4 % дефектов возникают по причине неисправности технических устройств, 21,6 % ошибок обусловлены недостатками проекта ИС, оставшийся объем — 78 % ошибок обусловлено человеческим фактором. Сюда входят условия работы, технологическая дисциплина, психомоторные характеристики персонала, психологический климат и др.
Один из эффективных путей улучшения качества обработки информации — разработка и реализация методов улучшения достоверности и полноты информации. Особую значимость проблема контроля данных приобретает при решении задачи поддержания целостности БД. Ограничения целостности реализуются механизмом СУБД. В СУБД ограничения целостности, например, может быть задано в виде фильтрации данных, например, поле «возраст» не должно иметь своим значением число превышающие 120 и т.д. В ППП СУБД ограничения целостности представляются обычно набором вспомогательных программ, иногда автономных по отношению к СУБД. Поддержание целостности в СУБД представляет весомую проблему
БД формируется посредством определенного набора технологических процедур. Поэтому качество БД находится в прямой зависимости от качества технологии обработки данных. Эффективное направление — применение системы контроля обработки данных. Значительный эффект методы контроля дают в системах обработки информации числового содержания — учетных, отчетных, статистических, плановых, фактографических, параметрических и др., где искажение даже одной цифры может иметь в некоторых случаях серьезные последствия в принятии решений.
Задача обеспечения требуемого уровня достоверности вызывает необходимость применения процедур контроля на всех основных этапах технологического процесса обработки информации. Особому контролю подвергается достоверность выходных (производных) документов, перед выдачей их абоненту. Корректировка ошибок требует привлечения довольно значительных дополнительных трудовых, материальных, финансовых и временных ресурсов. Иногда искажения в документах вызывают необходимость повторной обработки документов на ЭВМ. Для устранения подобных случаев особое внимание обращается на обнаружение и исправление ошибок на пред машинных этапах обработки. В связи с этим большую значимость приобретает программный контроль достоверности на этапе ввода данных в ЭВМ.
Достоверность и полнота информации в АИС обеспечивается целым комплексом методов защиты: аппаратных, программных, организационных, комбинированных и др.
По уровню применения технических средств методы контроля достоверности информации можно разделить на следующие основные категории:
• ручной, или визуальный, способ — заключается в проверке правильности данных без применения каких-либо технических средств;
• механизированный способ — состоит в применении вспомогательных технических устройств, например калькуляторов для подсчета контрольных сумм для пачки документов;
• автоматизированный метод контроля — состоит в диагностике правильности данных посредством соответствующих программных модулей;
• автоматический метод состоит в программном выявлении ошибочного данного, определения его истинного значения и замены ошибочного значения на истинное в памяти ЭВМ.
В практике технологии обработки обычно применяются все указанные методы. Степень их применения зависит от класса и масштаба АИС.
В значительной части систем организационного управления ввод информации в ЭВМ производится в форме документов. С целью реализации контроля достоверности входной информации разрабатываются специальные прикладные программы. Эти диагностические программы ориентированы на контроль формальных и содержательных параметров ВХОДНЫХ первичных документов. При обнаружении ошибок они выдают сообщения оператору об адресе и модификации ошибки.
Анализ работ по контролю достоверности данных показывает, что имеющиеся методы и программы контроля достоверности и полноты информации ориентированы в основном на обнаружение ошибок, их идентификацию. Исправление ошибок, восстановление достоверности данных выполняется только при непосредственном участии человека.
С целью определения основных требований к методам и средствам повышения уровня достоверности вернемся к схемам технологических процессов обработки информации в АИС. Почти каждый этап обработки сопровождается выполнением операций контроля данных, значительный объем которых приходится на контроль достоверности и полноты сведений в обрабатываемых документах. Особо тщательно должна проверяться производная документация перед выдачей ее абонентам. Неадекватность (недостоверность и неполнота) сведений в документации влечет за собой снижение эффективности принимаемых решений. Иногда это обусловливает повторную обработку пакета первичных документов, что увеличивает стоимость обработки информации, снижает уровень своевременности, ухудшает ее качество. Таким образом, эффективность обработки в значительной мере зависит от операций контроля, предшествующих этапу обработки документов в ЭВМ.
По характеру возникновения ошибки можно подразделить на ошибки, связанные с человеческим и аппаратным факторами. Ошибки (искажения) информации, вызываемые техническими (аппаратными) средствами обработки нейтрализуются на внутри машинном уровне специальными методами и средствами, например, функциональными блоками ЭВМ, с помощью устройств ввода-вывода данных и др. Ошибки человеческого фактора исправляются гораздо сложнее. Каким образом происходит обнаружение ошибок (этапы 4, 8, 14, 16, 18, 21) и их исправление на соответствующих этапах. В процедурном отношении последовательность программного обнаружения ошибок и последующего их исправления можно отобразить схемой корректировки ошибок в технологии АИС.
Схема состоит из контура А — этапы, выполняемые посредством ЭВМ, и контура В - этапы, выполняемые вручную. На этапе 1 происходит ввод данных в ЭВМ. На этапе 2 проводится анализ входных документов посредством программ контроля правильности входных данных. На этапе 3 документ при условии отсутствия ошибки размешается на внешнем накопителе ЭВМ. Если ошибка обнаружена, то на этапе 4 сведения о ней выводятся на терминальное устройство, например дисплей или принтер. На этапе 5 происходит идентификация ошибки. Затем на этапе 6 выполняется обращение к массиву первичных документов и поиск соответствующего ошибочного документа. На этапе 7 происходит определение и (или) вычисление достоверного значения показателя документа. Ошибки в документах могут иметь самые различные модификации. Дефект может заключаться в отсутствии (пропуске) значения показателя в документа-строке, искажении значения показателя документа и др. Искажение значения показателя (данного в записи) может быть допущено за счет недостающего или лишнего количества символов в значении показателя, искажения какого-либо символа, внедрения в цифровое значение алфавитного символа или наоборот, транспозиции («на ползания») символов одного значения на символы другого и др. На этапе 8 происходит заполнение оператором корректировочного бланка в режимах «удаление», «замена», «вставка».
Затем информация с корректировочного бланка вводится в ЭВМ и контролируется с помощью тех же методов контроля. Корректировка прекращается в случае отсутствия ошибок, возникающих при составлении бланка корректур и ввода данных с него в ЭВМ. В противном случае операции по выдаче идентификации ошибок, составление новых корректур и их ввод будут повторяться до тех пор, пока ошибки не будут полностью исправлены. По схеме видно, что операции контура у4 по сравнению с операциями контура в составляют значительную долю трудозатрат и времени на этапе ввода и контроля документов в ЭВМ.
В настоящее время для обработки информации различного класса и назначения сравнительно широко применяются системы управления базами данных и ППП. Программные средства, как правило, не имеют встроенных модулей для выполнения логически развитых функций контроля достоверности, а если и имеют, то состав функций контроля обычно недостаточен. Рассмотрим некоторые ППП, реализующие функции контроля достоверности информации, с точки зрения имеющихся в них методов контроля.
По строкам перечислены виды программного контроля, а по графам — обозначения классов ППП, практически применяемые в настоящее время в системах обработки информации различного назначения. На пересечении знаком «плюс» отмечено наличие тех или иных методов программного контроля в соответствующих пакетах. Знак «минус» означает отсутствие метода или сведений.
По выполняемым функциям указанные методы контроля можно подразделить на лексические, синтаксические, логические и арифметические.
Лексический контроль данных — это проверка правильности формата значений реквизитов (полей), допустимости класса информации, соответствия лексем входного языка принятому нормализованному составу лексем. Лексемы могут быть представлены в кодовом (шифрованном) или неформализованном (естественном) виде — отдельные слова или составные понятия. Форматы и значения полей вводимых записей проверяются на соответствие — только цифры, только буквы, только специальные символы, только алфавитно-цифровой, только комбинированный (смешанный текст — все виды символов). С целью повышения достоверности информации в классификаторах и кодификаторах технико-экономической информации каждый код снабжается контрольным разрядом. Контрольные разряды (цифры) определяются с использованием цифрового метода контроля с весовыми коэффициентами.
Синтаксический контроль данных — это проверка наличия регламентированного количества элементов в форматах и порядка их расположения. Например, во входных документах проверяется количество значений полей и порядок их следования в записи, в документо-строке, в таблице и т.д.
Логический контроль данных — это проверка содержательной взаимосвязи между отдельными значениями единиц информации. На основе свойств значений показателей можно установить контрольные соотношения между этими значениями типа «равно», «неравно», «больше», «меньше», «больше-равно», «меньше-равно» и др. Можно проверять правильность значений реквизитов-оснований и их совокупности на совпадение со значением их логических констант на уровне записи, файла, БД. На основе арифметических подсчетов отдельных значений показателей можно определить суммарное значение показателя и сравнить его со значением контролируемого показателя на логическое соотношение. Иногда логическая взаимосвязь в комплексе входных документов АИС может достигать более 1 тыс. соотношений.
Арифметический (счетный) контроль данных — это проверка равенства контрольного значения определенного группового и (или) итогового значения элемента информации с суммой значений соответствующих элементарных единиц информации. Так, например, может быть проверено равенство показателя типа «итого», «всего» с суммой группы значений элементарных реквизитов-оснований соответствующих документо-строк и (или) документо-граф документа. При отсутствии в форме документа групповых и (или) итоговых значений реквизитов в таблицу документа иногда вводят специальные контрольные суммы. При балансовом контроле отдельно проверяются значения показателей по документо-строкам или по документо-графам. Шахматный контроль обеспечивает контроль большего количества параметров, чем балансовый, потому что выполняется по строкам и графам табличного документа. Как правило, разработчики программ контроля достоверности и полноты данных стремятся максимально использовать имеющиеся методы диагностики входных документов. Однако по ряду причин не всегда и не везде это удается.
Следует отметить, что реализация методов контроля, как правило, влечет за собой необходимость введения в процессы обработки избыточности информационного, программного, технологического и организационного характера. Так, например, балансовой контроль как разновидность арифметического контроля предусматривает наличие в документе контрольных сумм, которые по существу являются избыточной информацией. Кроме того, программный модуль контроля достоверности данных, в сущности, избыточен в структуре программного обеспечения АИС. В технологическом процессе предусматриваются этапы (процедуры) контроля информации, что также избыточно. Как о разновидности организационной избыточности можно говорить об инструктаже персонала, отвечающего за процедуры контроля достоверности информации.
Необходимость обеспечения контроля как можно большего набора параметров входных документов вызывает увеличение числа соответствующих программных модулей. Подобная программная избыточность в общем случае отрицательно сказывается на значениях обобщенных показателей качества АИС. Поэтому необходимо, чтобы модули программного контроля обладали свойством многофункциональности контроля и при этом могли бы стабилизировать рост своего физического объема.
Рассмотренная выше схема контроля данных показывает, что наиболее перспективными и быстро развивающимися методами следует считать, по-видимому, такие программные средства, которые смогут обеспечить обнаружение ошибок с помощью ЭВМ без непосредственного участия человека. Следовательно, необходим способ, который не только обнаруживал бы ошибки, но и программно вычислял достоверные значения показателей и заменял бы ими соответствующие ошибочные значения. Подобный метод мог бы в значительной мере устранить, минимизировать объем временных, трудовых, материальных и финансовых ресурсов. Подобный алгоритм позволил бы автоматически исправлять обнаруженные ошибки в каждом первичном документе с сообщением адреса и модификации исправляемых ошибок оператору на принтер или видеотерминал.
Таким образом, алгоритм и программа автоматического обнаружения ошибок и восстановления достоверности показателей документов должны:
• повышать уровень достоверности и полноты информации;
• снижать объем временных, трудовых, материальных и финансовых ресурсов, используемых в технологии обработки данных;
• адаптироваться к сравнительно широкому классу обрабатываемых форматов документов;
• иметь возможность применения в других технологических процессах обработки данных;
• реализовывать максимальный состав функций лексического, синтаксического, логического и арифметического контроля при минимальном физическом объеме программного модуля.
Режимы автоматизированной обработки данных
В ТПОД могут применяться следующие основные режимы обработки данных — пакетный, мультипрограммный и интерактивный.
Пакетная обработка данных — это последовательная обработка данных по задачам пользователя в порядке их очередности. По каждой экономической задаче в соответствии с календарными сроками ее решения формируется пакет документов. При условии подготовки полного состава (пакета) документов эта задача ставится в очередь, а при освобождении вычислительных ресурсов ЭВМ запускается в обработку следующее задание может быть запушено только при окончании выполнения предшествующего. Сущность пакетного режима состоит в последовательном выполнении имеющейся совокупности программ обработки данных. При этом достигается уменьшение вмешательства операторов в процесс решения задач, так как средства операционной системы организуют ввод данных, вызов необходимых программных модулей, приведение требуемых внешних устройств в рабочее состояние, осуществление процесса обработки и управления им. Основная цель пакетного режима — обеспечение своевременного решения задач согласно установленным графикам и максимальной загрузки вычислительной системы. Вместе с тем, для определенного класса пакетных задач, требующих сравнительно больших временных ресурсов и вычислительных ресурсов ЭВМ, целесообразно применение промежуточных контрольных съемов данных, чтобы исключить сбои и ошибки в решении задачи.
Выполнение задания в режиме пакетной обработки характеризуется типовой очередностью процедур обработки данных, включающих:
• логическое преобразование исходных информационных массивов и создание рабочего массива;
• упорядочение рабочего массива;
• вычислительная обработка данных по заданному алгоритму;
• формирование выходного массива;
• контроль результатов решения задачи;
• выдача результатов обработки.
Особенность реализации пакетного режима обработки информации в том, что ее результаты, как правило, выводятся путем печати требуемых выходных документов на печатающем устройстве — принтере, или в виде массивов информации на магнитных носителях. Первые обычно содержат результаты планирования, учета и отчетности.
С целью сокращения времени на обработку данных и рационализации вычислительных ресурсов применяется мультипрограммный режим обработки данных, выполняется на ЭВМ повышенной производительности и расширенного объема памяти. Мультипрограммная обработка данных — это параллельная обработка данных по нескольким задачам пользователя. ОС управляет одновременно несколькими программами, реализующими набор соответствующих задач пользователей. Эти программы выполняются в режиме разделения времени, когда каждой программе выделяется через определенный промежуток (квант) времени доступ к вычислительным ресурсам ЭВМ — процессору, оперативной памяти и др.
Интерактивный режим обработки данных иногда называют диалоговым. Диалоговый режим обработки данных — это обработка данных по задаче, в процессе которой пользователь имеет возможность в реальном времени вмешиваться в ход решения задачи и изменять условия ее решения по своему усмотрению. Работа основана на взаимодействии пользователя с ЭВМ через терминал в режиме меню. Меню обеспечивает дружественность интерфейса, что создает дополнительные удобства и улучшает производительность работы. При реализации диалогового режима в меню активно используется варьирование цвета, мерцание символов, слов или строк, широко применяются средства подсказки, обучения пользователя, проверки его работы. Подсказка представляет собой совокупность инструкционных материалов по работе пользователя, сведений о типах и структурах входных и выходных данных, алгоритмах обработки информации. Например, описание конкретных процедур арифметического и логического контроля данных при формировании документов налоговой отчетности. Средства обучения обычно содержат контрольный пример, иллюстрирующий работу программного комплекса. Средства проверки работы пользователя включают полный список сообщений об ошибках, обнаруживаемых программным комплексом.
В диалоговом режиме пользователь занимает активную позицию по отношению к технологии обработки данных. В интерактивном режиме решается довольно широкий класс задач, например проведение поиска данных (документов) в БД по запросу пользователя. В процессе поиска пользователь может вносить коррективы в поисковое предписание и тем самым уточнять ПОД и логику поиска, добиваясь при этом лучших показателей его полноты и точности. Кроме того, в интерактивном режиме проводится решение задач имитационного класса. Здесь специалист может по ходу решения задачи задавать и корректировать условия решения задачи. Последовательность шагов в уточнении исходных условий обеспечивает более эффективное решение имитационной задачи при изучении управляемого объекта.
Диалоговый режим широко используется при подготовке аналитических записок по конкретным экономическим задачам. Эта работа осуществляется специалистами при получении различных расчетных таблиц на основе БД. В рамках решения аналитических задач широко используются процедуры расчета итоговых таблиц, подготовки на их основе графиков и диаграмм. Например, для аналитической работы может быть использован пакет ЛОТОС 1-2-3, а для формирования текстовой информации — текстовый процессор.
Диалоговый режим предусматривает интерактивную связь пользователя с вычислительной машиной через терминал, с которого возможен ввод команд, воздействующих на порядок работы программ обработки информации. Диалог проводится в двух режимах: текстовом и графическом. При текстовом режиме на экране отображаются алфавитно-цифровые символы, позволяющие строить тексты и таблицы. Графический режим используется при отображении графической ин-формации — это разнообразные диаграммы и графики. В некоторых пакетах программ реализованы возможности текстового и графического режимов.
Существует два приема формирования диалога: глобальный и локальный. При глобальном диалоге с помощью меню задается последовательность программ, характеризующая функциональные возможности программной системы при обработке данных. Локальный диалог формирует конкретный алгоритм обработки данных по запросу пользователя.
Автоматизированное рабочее место экономиста
В настоящее время в компьютерной обработке данных широкое распространение получили АРМ пользователей. Автоматизированное рабочее место — это совокупность методов, средств и процедур информационного, технического, программно-математического и организационно-правового характера по взаимодействию пользователя с ресурсами АИС. Методы, средства и процедуры АРМ основаны на категориях идентичных категориям, применяемым в ТПОД АИС. В область режимов функционирования ТПОД входит комплекс условий, который определяется системообразующими признаками АИС — принципами создания и функционирования, целями, задачами, функциями, структурой, технологией процедур и процессов, развития и др. АРМ в рамках АИС относится к классу АРМ конечного пользователя, но в общем контуре ТПОД он по своему статусу определяется как АРМ технологического пользователя.
При создании АРМ разработчики должны исходить из того, что в общем случае АРМ — это квинтэссенция ТПОД АИС. Один из основных принципов построения АРМ — придание ему свойства адаптивности к изменяющимся условиям в управлении экономическим объектом. Выдаваемые администратору сведения должны быть информативными, достоверными, полными, оперативными. Форма отображения данных должна обеспечивать их восприятие, анализ и принятие рациональных решении администратором в минимальное время. Поэтому основной акцент при создании, эксплуатации и развитии АРМ должен быть направлен на его логическую составляющую. АРМ должно базироваться на идеологии интеллектуальных ИС, в частности идеологии, систем автоматизированного проектирования, экспертно-советующих систем, нейро-сетевых технологий, БЗ и т д.
В настоящее время при решении регламентных задач АИС АРМ экономиста обеспечивает более эффективную организацию труда экономистов за счет автоматизации многообразных функций и непосредственного доступа к информационным ресурсам, установленным на рабочем месте экономиста, а также ресурсам, имеющимся у АИС.
АРМ экономиста автоматизирует различные аспекты деятельности и обеспечивает:
• снижение трудоемкости обработки информации;
• повышение оперативности использования получаемой информации;
• повышение персональной ответственности исполнителей за качество и достоверность информации, получаемой на рабочем месте.
АРМ может быть настроено на обеспечение обработки и получение информации, как в автономном, так и в сетевом режимах. Результатная информация может быть получена в форме сводных аналитических материалов и графиков.
В АРМ реализованы следующие функции:
• ввод данных в ЭВМ с первичных документов;
• контроль вводимых данных;
• корректировка информации;
• обработка текстовой, табличной, графической и мультимедиа информации;
• расчет данных по задаваемым формулам;
• накопление данных и их хранение по годам и периодам;
• логико-математическая обработка информации для получения информации по запросам;
• формирование сводных отчетов с выдачей на экран дисплея, на печать, а также на магнитные носители;
• группировка данных по характеристикам предприятий и показателям;
• обработка и представление данных в различных разрезах;
• построение графиков и диаграмм по финансово-экономическому состоянию предприятий;
• пересылка данных абонентам по каналам связи.
Диалог пользователя с ЭВМ в режиме АРМ организован по принципу «меню». В зависимости от характера решаемых задач в состав меню включаются разные программы, обеспечивающие соответствующие режимы работы: настройка персональной ЭВМ, введение лингвистических средств, видов документов, редактирование, сервис, помощь.
Например, в АРМ-статистика в режиме «Настройка» пользователь определяет нужный ему раздел из перечня массивов документов, файлов, разделов БД, а также хронологические рамки документов и другие параметры.
Режим «Лингвистические средства» может быть представлен списком ИПЯ, классификаторов, используемых для формирования сводных документов в виде группировок по значениям кодов этих классификаторов (ОКПО, СООГУ, ОКОНХ и др.), а также подготовки запроса и проведения документального поиска в БД.
С помощью режима «Документы» осуществляется ввод, контроль и запись данных первичных отчетов, необходимых по регламенту решения определенной задачи в рамках АИС. При входе в данный режим на экране дисплея отображается список документов, подлежащих вводу для заданной задачи. Затем данные вводятся в формы документов, например в электронные таблицы, в соответствии с определенным списком предприятий и организаций, отчитывающихся по данной форме.
В процессе ввода проводится проверка правильности вводимых данных с использованием средств контроля, предусмотренных для данной формы документа. Результатом контроля становится файл протокола, содержащий информацию об обнаруженных ошибках, который можно просмотреть на экране или распечатать. После анализа ошибок документы могут быть откорректированы. В данном режиме работы можно также рассчитать итоговые или средние значения для каждого показателя формы по заданной группе документов. Введенные документы можно поместить в файл, предназначенный для передачи абоненту.
АРМ выполняет также формирование сводных документов — сводки, отчеты за соответствующий период времени на основе введенных первичных документов. В сводные отчеты могут быть отобраны любые показатели по усмотрению пользователя. На основе привлеченных данных могут быть выполнены самые разнообразные расчеты. АРМ позволяет производить автоматическую группировку данных при получении сводок.
Данные могут группироваться по качественным признакам (атрибутивный ряд), по количественным признакам (вариационный ряд), по годам (динамический ряд). Атрибутивный ряд предназначен для просмотра данных по предприятиям и итогов по группировкам. Вариационный ряд включает итоги по всем показателям текущего периода с учетом заданного качественного ранжирования какого-либо показателя. Динамический ряд используется для просмотра данных по предприятиям и итогов по группировкам, а внутри каждой группировки — по годам. Тем самым можно проследить изменение показателей в заданном временном интервале от одного отчетного периода к другому
Для получения сводок данные могут группироваться как с нарастающим итогом с учетом данных прошлых периодов, так и без нарастающего итога.
Общий алгоритм формирования сводок выглядит следующим образом:
• последовательно выбираются данные из различных первичных отчетных документов;
• осуществляется их обработка с использованием задаваемых формул;
• устанавливается вид группировки данных;
• формируются итоговые данные.
АРМ предусматривает графическое отображение полученных сводок; Графики можно строить по любым выбранным показателям сводки, используя столбиковую, наложенную, линейную, круговую и другие виды диаграмм.
В режиме «Редактирование» создаются справочники классов отчетности, форм первичной отчетности, а также выполняется проектирование электронных образов форм первичных и сводных документов. Любая электронная таблица состоит из строк и колонок, пересечение которых образует клетку Клетка может содержать информацию, представленную постоянным текстом или переменным значением, которое бывает как числовая, так и символьным. Числовые значения могут рассчитываться по различным формулам с нарастающим итогом.
Для создания электронной таблицы в АРМ предусмотрены следующие возможности:
• создание новой таблицы;
• создание новой таблицы методом корректировки старой;
• создание для одного и того же первичного документа нескольких различных таблиц.
При создании разных таблиц отображения для одного и того же документа, показатели, включаемые в новую таблицу, сохраняют свое смысловое значение. Это очень удобно при получении различных справок, сводок и других видов отображения данных. В процессе создания новой электронной таблицы требуется ввести ее заголовок, изобразить шапку, присвоить соответствующие номера колонкам и строкам, ввести наименования показателей, заложить расчетные формулы контроля, присвоить номера показателей каждому значению таблицы. В процессе редактирования электронной таблицы необходимо предусмотреть правки шапки и строк, изменение ширины колонок, а также формул расчета и контроля, вставку и удаление строк и колонок.
В режиме «Сервис» предусмотрены следующие функции: индексирование, копирование, восстановление и сжатие информации, а также выборка данных из массивов нормативно-справочной информации, например классификаторов.
Режим «Помощь» служит для получения справок по пояснению и уточнению правил выполнения различных операций в АРМ.
В результате работы АРМ полученная информация может быть выведена на печать, записана на магнитные носители, а также передана в виде файла по каналам связи на вышестоящие (нижестоящие) уровни управления экономическим объектом.
Организация работы АРМ базируется на применении системной технологии обработки экономической информации, включающей следующие этапы:
• формирование электронных таблиц на основе документов с использованием необходимых расчетов и методов контроля информации;
• создание сводных документов в необходимых разрезах, используя данные электронных таблиц;
• формирование локальных БД;
• передача подготовленных сводных отчетов, справок, аналитических записок и других материалов в вышестоящие и другие инстанции;
• получение запросов на выполнение указанных выше видов работ с учетом изменений и дополнений, выработанных на основе анализа переданных материалов.
Применение АРМ в ТПОД обеспечивает повышение эффективности решения регламентных задач по обработке данных в их различных формах. Реализация АРМ в рамках системной технологии обеспечивает высокое качество и дисциплину представления результатных данных, типизацию технологического процесса обработки информации на различных уровнях управления экономической системой.
Телекоммуникационные технологии АИС
Идея расширения функциональных возможностей и масштабов реализации АИС привели к созданию так называемых телекоммуникационных технологий, основанных на организации сетевого взаимодействия вычислительных ресурсов ЭВМ. Сеть ЭВМ — это совокупность технических, программных и коммуникационных средств, обеспечивающих эффективное распределение вычислительных ресурсов.
В структурном плане сеть ЭВМ состоит из двух основных элементов, взаимодействующих между собой, — сервера и рабочих станций. В роли сервера выступает центральная ЭВМ (хост-ЭВМ) — узел сети. Сервер располагает и управляет использованием разделяемых ресурсов — БД, внешней памяти, принтеров и др. Рабочие (клиентские) станции представляют собой профессиональные ЭВМ, предназначенные для работы пользователей в интерактивном режиме с центральной ЭВМ. Это могут быть АРМ, имеющие скромные по сравнению с центральной ЭВМ вычислительные и информационные ресурсы.
В организации сетевого обмена данными существует несколько схем взаимодействия рабочих станций и сервера. В схеме «клиент — сервер» рабочая станция (клиент) получает от сервера те функции и те ресурсы, которые необходимы клиенту для решения его задачи. В подобных случаях состав и объем ресурсов обычно обусловлены содержанием запроса клиента к серверу. Это могут быть прикладные программы, сервис печати документов, файлы, которые соответствуют условию, указанному в запросе. Подобная схема широко используется в современных локальных вычислительных сетях. Схема «файл — сервер» представляет собой многопользовательскую систему управления данными. Здесь данные размещаются централизованно, в одном узле вычислительной сети под управлением сервера, а СУБД и другие программные ресурсы имеются на каждой рабочей станции. СУБД ведет обработку данных, а сервер выполняет роль управляющей программы (драйвера) магнитного диска, на котором хранятся БД.
Значительное место в сетевом обмене принадлежит серверам БД. К числу основных функций сервера БД относятся: организация размещения данных на магнитных носителях, хранение БД, обеспечение доступа пользователей к БД, поддержка БД в актуальном состоянии, реорганизация БД и др.
Один из способов актуализации БД — транзакция. Транзакция — короткий во времени цикл взаимодействия объектов, включающий запрос, выполнение задания и ответ В общем смысле транзакция идентифицируется входным сообщением, переводящим БД из одного состояния в ее другое непротиворечивое (актуальное) состояние. Характерный пример транзакции — работа в режиме диалога клиента и сервера. С рабочей станции пользователя направляется задание на поиск информации в БД сервера. В режиме реального времени производится быстрый поиск информации и выдача ее пользователю. Последовательность символов, которые содержатся в запросе транзакции, называется кодом транзакции. Сравнительно небольшой, но постоянно обновляемый набор данных называется файлом транзакций. Так, например, этот файл может содержать данные по изменению фамилии рабочего, тарифной ставки, объема рабочего времени и др. Транзакции могут быть зафиксированы путем занесения ее результатов в специальный журнал. Транзакции широко применяются в сетевых службах самого различного характера.
Несколько сложнее поддерживать актуальность распределенных БД. Здесь применяется прием репликации. Репликация — это процесс синхронного приведения данных нескольких распределенных БД в идентичное состояние. Задача репликации возникает тогда, когда несколько пользователей, работая с набором распределенных БД, вносят свои коррективы в соответствующие БД. Для обеспечения непротиворечивости необходимо синхронно проводить корректировки по всей структуре распределенных БД.
В организации ведения распределенных БД существует несколько видов репликаций. По уровню распространения различают одностороннюю и многостороннюю репликации. При односторонней репликации данные изменяются только в одной БД, а в других данные не изменяются. При многосторонней репликации данные корректируются во всех БД. По времени проведения можно выделить репликации реального времени и отложенные репликации. Репликации реального времени выполняются непосредственно после изменения состояния объектов. Отложенные репликации выполняются по определенному условию или событию, например пункту в графике администратора БД.
Сетевая технология обеспечивает:
• построение распределенных хранилищ информации;
• расширение перечня решаемых задач по обработке информации;
• повышение надежности АИС за счет дублирования работы набора ЭВМ;
• создание новых видов задач и услуг в направлении информационного взаимодействия, например электронной почты;
• снижение стоимости обработки информации.
В общем случае структура сетевой технологии должна обладать совокупностью определенных свойств, к ним относятся:
• открытость — возможность включения в сеть дополнительных модификаций современных ЭВМ и других сетевых устройств;
• ресурсоемкость — способность технических и аппаратных средств хранить, оперативно обрабатывать и представлять широкий набор данных;
• динамичность — минимизация времени ответа ЭВМ сети на запрос пользователя;
• эргономичность — развитый интерфейс по взаимодействию с ЭВМ, широкий набор сервисных функций по информационному обеспечению пользователя и создание адекватной ему информационной среды;
• автономность — относительно независимая работа сетей различных уровней;
• адаптивность — обеспечение совместимости и взаимодействия технических и программных средств при изменении требований надсистемы и изменении конфигурации сети;
• самоорганизация — защита данных от несанкционированного доступа, автоматическое восстановление работоспособности в случае аварийных сбоев, высокая достоверность передаваемой информации.
Вычислительные сети принято подразделять на два класса — ЛВС и ГВС. Локальная вычислительная сеть — это распределенная вычислительная система, в которой передача данных между компьютерами проводится на небольшие расстояния в пределах одного здания или нескольких зданий одной организации. ЛВС требует минимум специальных устройств, достаточно электрического соединения компьютеров с помощью кабелей и разъемов. Так как электрический сигнал при передаче по кабелю ослабевает (уменьшается его мощность) тем сильнее, чем протяжённее кабель, то, естественно, длина проводов, соединяющих компьютеры, ограничена. По этой причине ЛВС объединяют компьютеры, локализованные на весьма ограниченном пространстве. Обычно длина кабеля, по которому передаются данные между компьютерами, не должна превышать 1 км. Указанные ограничения обусловливают расположение компьютеров ЛВС в одном здании или в рядом стоящих зданиях. Обычно службы управления предприятий так и расположены, что и определило широкое использование в них ЛВС для реализации процессов обмена. Вместе с тем при построении определенных ЛВС применяются и дополнительные устройства, в частности репитеры, усиливающие сигналы в канале связи, и др.
ГВС объединяют ресурсы компьютеров, расположенных на значительном удалении. Глобальная вычислительная сеть — это распределенная сеть ЭВМ, имеющая развитый состав технических устройств, расположенных на межматериковом географическом пространстве. При создании ГВС необходимо применение специальных устройств, позволяющих передавать данные без искажения и по назначению. Эти устройства коммутируют (соединяют, переключают) между собой компьютеры сети и, в зависимости от ее конфигурации, могут быть как пассивными коммутаторами, соединяющими кабели, так и достаточно мощными ЭВМ, выполняющими логические функции выбора наименьших маршрутов передачи данных. В ГВС, помимо кабельных линий, применяют и другие среды передачи данных. Большие расстояния, через которые передаются данные в глобальных сетях, требуют особого внимания к процедуре передачи цифровой информации с тем, чтобы посланные в сети данные дошли до компьютера-получателя в полном и неискаженном виде. В глобальных сетях компьютеры отделены друг от друга расстоянием не менее 1 км и объединяют ресурсные возможности компьютеров в рамках определенной территории.
Отдельные ЛВС и ГВС могут объединяться, и тогда возникает сложная сеть, которую называют распределенной. Таким образом, в общем виде вычислительные сети представляют собой систему компьютеров, объединенных линиями связи и специальными устройствами, позволяющими передавать без искажения и перенаправлять потоки данных между компьютерами. Линии связи вместе с устройствами передачи и приема данных называют каналами связи, а устройства, производящие переключение потоков данных в сети, можно определить общим названием — узлы коммутации.
Топология вычислительных сетей. Важнейшей характеристикой сети является топология. Она определяет способ соединения ЭВМ в сети. Различают два вида топологии — физическую и логическую. Физическая топология — это реальная схема соединения технических устройств сети посредством каналов связи. Логическая топология — это установленная схема потоков данных между техническими устройствами сети. Термин «топология сетей» характеризует физическое расположение компьютеров, узлов коммутации и каналов связи в сети.
Построение топологии ЛВС выполняется по нескольким топологическим структурам. Базовыми топологиями являются: звездообразная — «звезда», кольцевая — «кольцо», магистральная — «шина». На основе этих структур могут быть построены более сложные, разветвленные и многосвязные сети.
Достоинство подобной структуры в экономичности и удобстве с точки зрения организации управления взаимодействием компьютеров (абонентов). Звездообразную сеть легко расширить, поскольку для добавления нового компьютера нужен только один новый канал связи. Существенным недостатком звездообразной топологии можно назвать низкую надежность — при отказе центрального узла выходит из строя вся сеть.
Кольцевая топология характерна тем, что компьютеры в этой сети подключаются к повторителям (репитерам) сигналов, связанным в однонаправленное кольцо.
По методу доступа к каналу связи различают два основных типа кольцевых сетей: маркерное и тактированное кольца. В маркерных кольцевых сетях по кольцу передается специальный управляющий маркер (метка), разрешающий передачу сообщений из компьютера, который им управляет в данный момент времени. Если компьютер получил маркер и у него есть сообщение для передачи, то он «захватывает» маркер и передает сообщение в кольцо. Данные проходят через все повторители, пока не окажутся на том повторителе, к которому подключен компьютер с адресом, указанным в данных. Получив подтверждение, передающий компьютер создает новый маркер и возвращает его в сеть. При отсутствии у компьютера сообщения для передачи он пропускает движущийся по кольцу маркер.
В тактированном кольце по сети непрерывно вращается замкнутая последовательность тактов — специально закодированных интервалов фиксированной длины. В каждом такте имеется бит-указатель занятости. Свободные такты могут заполняться передаваемыми сообщениями по мере необходимости либо за каждым узлом могут закрепляться определенные такты.
К достоинствам кольцевых сетей относится равенство компьютеров по доступу к сети и высокая расширяемость. К недостаткам следует отнести выход из строя всей сети при выходе из строя одного повторителя и остановку работы сети при изменении ее конфигурации.
Магистральная топология («шина»), в локальных сетях применяется очень широко. Здесь все компьютеры подключены к единому каналу связи с помощью трансиверов (приемопередатчиков).
С двух сторон канала имеются пассивные терминаторы, которые служат для поглощения передаваемых сигналов. От передающего компьютера данные направляются всем компьютерам сети, однако воспринимаются только тем компьютером, адрес которого указан в передаваемом ансамбле данных. Причем в каждый момент только один компьютер может вести передачу, Если один компьютер выйдет из строя, это не скажется на работе остальных, что относится к достоинствам шинной топологии. Другие достоинства шины — высокая расширяемость и экономичность в организации каналов связи. Как недостаток расценивается уменьшение пропускной способности сети при значительных объемах трафика — объема передаваемых по сети данных.
В настоящее время часто используются топологии, основанные на сочетании достоинств и нивелировании недостатков базовых топологий — «звезда — шина», «звезда — кольцо». Топология «звезда — шина» чаше всего выглядит как объединение с помощью магистральной шины нескольких звездообразных сетей. При топологии «звезда — кольцо» несколько звездообразных сетей соединяется своими центральными узлами коммутации в кольцо.
Развитие локальных и комбинированных топологий при условии удлинения линий связи приводит к необходимости их разделения и создания распределенных сетей. Это обусловливает особенности топологии ГВС. В распределенных сетях компонентами служат не отдельные компьютеры, а отдельные локальные сети, или сегменты. Узлами коммутации таких сетей становятся активные концентраторы и мосты — устройства, обеспечивающие коммутацией линии связи неоднородного класса и усиливающие проходящие через них сигналы. Мосты, кроме того, еще и управляют потоками данных между сегментами сети.
При соединении удаленных на большие расстояния компьютеров или сетей используются каналы связи и устройства коммутации, называемые маршрутизаторами и шлюзами. Маршрутизаторы взаимодействуют друг с другом и соединяются между собой каналами связи, образуя распределенный магистральный канал связи. Для согласования параметров данных (форматов, уровней сигналов, протоколов и т.п.), передаваемых по магистральному каналу связи, между маршрутизаторами и терминальными компонентами включаются устройства сопряжения. При подключении к магистральному каналу вычислительных сетей, которые невозможно согласовать с помощью стандартных устройств сопряжения, используются стандартные средства, называемые шлюзами. Терминальными абонентами называют отдельные компьютеры, локальные или распределенные сети, через маршрутизаторы подключенные к магистральному каналу, Таким образом, возникает ГВС.
Глобальные сети могут объединяться между собой путем соединения через маршрутизаторы магистральных каналов, что в конечном итоге приводит к созданию мировой информационно-вычислительной сети. Эти сети относятся к классу открытых систем и создаются на основе эталонной модели.
Базовая эталонная модель взаимодействия открытых сетей. Базовая эталонная модель стандарт 7498 180. Модель 081 можно назвать гибкой в том смысле, что она допускает эволюцию сетей в зависимости от развития теории и новых технических достижений, а также обеспечивает постепенность перехода от существующих реалий к новым стандартам. Основное понятие модели система. Система — автономная совокупность вычислительных средств, осуществляющих обработку данных прикладных задач пользователей.
Прикладной процесс, реализующий определенную задачу пользователя — важнейший компонент системы, обеспечивающий обработку информации. Роль прикладного процесса в системе выполняет человек-оператор, программа или группа программ. Основная задача сети состоит в обеспечении взаимодействия прикладных процессов, проходящих в различных системах. При этом система считается открытой, если она выполняет стандартное множество функций взаимодействия, принятое в сети.
Область взаимодействия открытых систем определяется последовательно-параллельными группами функций или модулями взаимодействия, реализуемыми программными или аппаратными средствами Модули, образующие область взаимодействия прикладных процессов и физических средств соединения, делятся на семь иерархических уровней. Каждый из них выполняет определенную функциональную задачу. В системе передачи физический, канальный и сетевой уровни вместе с прикладными процессами образуют область обработки данных, реализующих информационные процессы, выполняемые в системе. Процессы этой области используют сервис по транспортировке данных транспортного уровня, который осуществляет процедуры передачи информации от системы-отправителя к системе-адресату Транспортный, сеансовый, представительный и прикладной уровни образуют область передачи данных между множеством взаимодействующих систем, реализуют коммуникационные процессы по транспортировке данных. Протоколы ОС сети реализуют единый интерфейс между ОС разнотипных ЭВМ. Основополагающим в этом случае становится принцип виртуальности, определяющий общность процессов через виртуальный терминал, виртуальный файл, виртуальное задание и т д.
Существенно для прикладных процессов включение в систему обмена таких каналов связи, которые оптимизируют время прохождения данных. Важной здесь становится также и реализация взаимодействия процессов удаленных ЭВМ с управляющими блоками сети. В логическом отношений единую ОС должен образовывать набор программных и аппаратных протоколов информационного обмена и процедур, осуществляющих интерфейс управляющих сигналов и данных сети, вне зависимости от способа и места их реализации.
Функции, выполняемые протоколами уровней в различных системах, принято объединять в группы, именуемые службами. Транспортная служба обеспечивает выполнение задач, связанных с передачей информации через коммуникационную подсеть. Она охватывает транспортный, сетевой, канальный и физический уровни. Над ней находится абонентская служба. Эта служба располагается на прикладном, представительном и сеансовом уровнях и предназначена для обеспечения соединения прикладных процессов с транспортной службой. Соответственно семи уровням взаимодействия открытых систем вводится иерархия семи групп протоколов. Протоколы именуются так же, как уровни.
В соответствии с точками приложения иерархия протоколов делится на три специфические группы:
• физический (стандартный физический интерфейс) и канальный (стандарт наивысший уровень управления каналом данных) протоколы;
• протоколы транспортного и сетевого уровней, которые реализуют сквозное взаимодействие абонентских сетей. Здесь сетевые уровни и сетевой процесс коммуникационных систем инициируют компоненты, связывающие последовательность канальных соединений в единую сквозную систему коммуникационной подсети.
• протоколы трех верхних уровней (прикладного, представительного, сеансового), образующие группу, связанную с прикладными процессами. Эти уровни ответственны за последовательность канальных соединений.
Увеличение разнообразия различных архитектур связи побудило 180 направить значительные усилия на разработку стандарта архитектуры связи, который позволил бы системам открыто связываться между собой. Протоколы, реализующие уровни обмена данными, должны быть предусмотрены в каждом узле сети.
Уровень канала передачи данных и находящийся под ним физический уровень обеспечивают канал безошибочной передачи между двумя узлами в сети. Функция физического уровня заключается в гарантии того, что символы, поступающие в физическую среду передачи на одном уровне канала, достигнут другого конца. При использовании этой услуги по транспортировке символов задача протокола канала состоит в обеспечении надежной передачи блоков данных по каналу.
Функция сетевого уровня состоит в том, чтобы обеспечить передачу данных по сети от узла передачи до узла назначения. Этот уровень предусматривает также управление потоком или перегрузками в целях предотвращения переполнения сетевых ресурсов, которое может привести к прекращению работы.
Четыре верхних уровня предоставляют услуги самим оконечным пользователям и, таким образом, связаны с ними, а не с сетью.
Транспортный уровень обеспечивает надежный, последовательный обмен данными между двумя оконечными пользователями (для этой цели на транспортном уровне используется услуга сетевого уровня), а также управляет потоком, чтобы гарантировать правильный прием блоков данных.
Существование сеанса между двумя пользователями означает необходимость установления и прекращения сеанса. Это делается на уровне сеанса. Этот уровень при необходимости управляет переговорами, чтобы гарантировать правильный обмен данными.
Уровень представления управляет и преобразует синтаксис блоков данных, которыми обмениваются оконечные пользователи, а протоколы прикладного уровня придают соответствующий смысл обмениваемой информации. Блоки или кадры данных, передаваемые по каналу связи через сеть, состоят из пакетов, а также управляющей информации в виде заголовков и окончаний, добавляемых к пакету непосредственно перед его отправлением из узла. В каждом принимающем узле управляющая информация отделяется от остальной части пакета, а затем вновь добавляется, когда этот узел в свою очередь передает пакет по каналу в следующий соседний узел. Этот принцип добавления управляющей информации к данным в архитектуре 081 расширен и включает возможность добавления управляющей информации на каждом уровне архитектуры.
Информационные технологии Интернета
Значение ГВС в экономической деятельности трудно переоценить. Особую роль здесь приобретает Интернет Отличительная особенность Интернета — высокая надежность. Архитектура Интернета обеспечивает эффективную систему резервирования технических устройств. При выходе из строя части компьютеров и линий связи сеть будет продолжать функционировать. Такая надежность обеспечивается тем, что в сети Интернет нет единого центра управления. Если выходят из строя некоторые линии связи и компьютеры, то сообщения могут быть переданы по другим линиям связи. Как и любая другая компьютерная сеть, Интернет состоит из множества компьютеров, соединенных между собой линиями связи, и установленных на этих компьютерах программ. Интернет обеспечивает обмен информацией между всеми компьютерами, которые входят в сети, подключенные к ней. Тип компьютера и используемая ими ОС значения не имеют
Основные ячейки Интернета — ЛВС. Если ЛВС подключена к Интернету, то и каждая рабочая станция этой сети также может подключиться к Интернету Существуют также компьютеры, самостоятельно подключенные к Интернету — это хост-компьютеры.
Для создания каналов связи применяют все виды средств: от телефонного кабеля до спутниковой связи. Интернет представляет собой совокупность физически взаимосвязанных хост-компьютеров. Каждый подключенный к сети компьютер имеет свой адрес, по которому его может найти абонент из любой точки мира. Пользователи Интернета подключаются к сети через компьютеры специальных организаций, которые называются поставщиками услуг сети — интернет провайдерами. Провайдеры имеют множество линий для подключения пользователей и высокоскоростные линии связи для подключения их к остальной части Интернета. Мелкие поставщики подключены к более крупным и т.д. Однако и отдельный пользователь, и ЛВС могут подключаться высокоскоростной линией к структуре Интернета и стать провайдерами.
Компьютеры, подключенные к Интернету, называются ее узлами или сайтами. Узлы, установленные у провайдеров, обеспечивают доступ пользователей к Интернету многие фирмы создают веб-узлы в Интернете, с помощью которых они распространяют информацию о своих товарах и услугах.
Подключение к Интернету с помощью провайдера означает, что вы с помощью своего модема устанавливаете соединение с компьютером — поставщиком услуг сети, который связывает вас с Интернетом.
В настоящее время используется несколько вариантов подключения к Интернету:
• постоянное подключение (24 часа в сутки). Абонент подсоединяется с помощью выделенной линии связи, которая обеспечивает высокую скорость передачи информации. Используется средними и крупными фирмами, в частности интернет провайдерами;
• некоммутируемое соединение. Более надежное соединение. Этот способ используют в основном пользователи-профессионалы.
• коммутируемое 1Р-соединение. Через обычную телефонную линию модем абонента связывается с модемом провайдера. Это сеансовое соединение, так как во время сеанса абонент полноправный пользователь Интернета, но по окончании сеанса связь с Интернетом разрывается.
В рамках указанных режимов имеются еще несколько модификаций подключения. Так, например, сеансовое подключение возможно по обычным аналоговым телефонным линиям связи и асинхронное подключение по цифровым линиям (режим АВ8Ь) с возможностью использования спутниковой связи. В первом режиме обмен данными в сети не превышает пропускной способности сети, например, около 33 кбит/сек. В последнее время популярным стало использование спутникового канала, скорость передачи которого может быть в несколько раз выше обычного — 256—512 кбит/сек. Кроме того, возможен доступ в Интернет через мобильный телефон по протоколу ХУАР. Соединение это дорого, но для получения важного послания или сообщения о важной биржевой котировке этот режим может быть вполне приемлемым.
Существует два основных понятия — адрес и протокол. Свой уникальный адрес имеет любой компьютер, подключенный к Интернету Даже при временном соединении по коммутируемому каналу компьютеру выделяется уникальный адрес. Адрес должен иметь формат, позволяющий вести его обработку автоматически, а также должен нести некоторую информацию о своем владельце. С этой целью для каждого компьютера устанавливается два адреса: цифровой 1Р-адрес и доменный адрес.
По мере роста сети стало обременительным держать большие списки имен на каждом компьютере. Для того чтобы решить эту проблему, была придумана система доменных имен — N8. Для СССР был выделен домен. Когда республики Союза стали суверенными, многие из них получили свои собственные домены. Однако домен СССР сохранился, ибо просто так выбросить домен из сервера имен нельзя: на основе доменных имен строятся адреса электронной почты и доступ ко многим другим информационным ресурсам Интернет, Поэтому гораздо проще для России оказалось ввести новый домен к существующему домену СССР, чем заменить последний. Таким образом, в России существуют предприятия с доменными именами и СССР, и России.
Вслед за доменами верхнего уровня следуют домены, определяющие либо регионы, либо организации. Далее идут уровни, которые могут быть закреплены либо за небольшими организациями, либо за подразделениями больших организаций.
Сетевой протокол устанавливает правила работы компьютеров сети. Стандартные протоколы обеспечивают взаимодействие разных компьютеров на одном языке. Таким образом, осуществляется возможность подключения к Интернету разнотипных компьютеров, работающих под управлением различных операционных систем. На нижних уровнях используются два основных протокола: 1Р — интернет-протокол и ТСР — протокол управления передачей. Так как эти два протокола тесно взаимосвязаны, то часто их объединяют и говорят, что базовый протокол в Интернете — ТСР/1Р. Все остальные протоколы строятся на их базе. Конечные пользователи глобальной сети. Именно на их основе и функционирует Интернет.
Протокол ТСР разбивает информацию на порции, нумерует все порции, чтобы при получении можно было правильно собрать информацию. Каждый пакет получает заголовок ТСР, где, кроме адреса получателя, содержится информация об исправлении ошибок и о последовательности передачи пакетов. Затем пакеты ТСР разделяются на еще более мелкие пакеты 1Р. Пакеты состоят из трех различных уровней, каждый из которых содержит: данные приложения, информацию ТСР, информацию 1Р. Перед отправкой пакета протокол ТСР вычисляет контрольную сумму. При поступлении снова рассчитывается контрольная сумма, и если пакет поврежден, то запрашивается повторная передача. Затем принимающая программа объединяет пакеты 1Р в пакеты ТСР, из которых реконструируются исходные данные. Протоколы ТСР/1Р обеспечивают передачу информации между компьютерами. Все остальные протоколы с их помощью реализуют дополнительные функции Интернета.
Ресурсы Интернета представлены в настоящее время расширенным составом категорий. Информационные ресурсы Интернета — это вся совокупность информационных технологий и БД, которые доступны при помощи этих технологий.
К их числу, например, относятся:
• электронная почта;
• система телеконференций;
• система файловых архивов РТР;
• информационная сеть;
• информационная система;
• справочные книги Х.500;
• справочная служба.
Эффективное массовое средство электронных коммуникаций — электронная почта. Любой пользователь Интернета имеет свой почтовый ящик в сети. Если учесть, что через Интернет можно принять или отослать сообщения еще в два десятка международных компьютерных сетей, некоторые из которых не имеют сервиса, то становится понятным, что почта предоставляет возможности в некотором смысле даже более широкие, чем просто информационный сервис Интернета. Электронная почта во многом похожа на обычную почтовую службу. Корреспонденция подготавливается пользователем на своем рабочем месте либо с помощью программы подготовки почты, либо просто в обычном текстовом редакторе. Затем пользователь вызывает программу отправки — и сеанс обмена почтовым сообщением окончен.
Система телеконференций построена по принципу электронных досок объявлений, когда любой пользователь может поместить свою информацию в одну из групп новостей, и эта информация станет доступной другим пользователям, которые на данную группу новостей подписаны.
Система файловых архивов РТР — это огромное распределенное хранилище всевозможной информации, накопленной за последние годы в сети. Любой пользователь может воспользоваться ресурсами этого хранилища и скопировать интересующие его материалы. Объем программного обеспечения в архивах РТР составляет терабайты информации. Кроме программ для ЭВМ в РТР-архивах можно найти стандарты Интернета, пресс-релизы, книги по различным отраслям знаний и многое другое.
Распределенная гипертекстовая информационная система самая популярная технология Интернета. Темпы развития этого сервиса очень высоки. Этот режим предоставляет удобный доступ к большинству информационных архивов Интернета. Особенность системы в механизме гипертекстовых ссылок, благодаря которому пользователь может просматривать материалы в порядке выбора этих ссылок. В гипертексте на основе ассоциативной связи организуется нелинейная последовательность записи и чтения информации. Синтез этой концепции и полиморфизма приводит к новой концепции гипермедиа, в рамках которой между блоками информации, представленной в различной форме (текстовой, графической и других), организуются ассоциативные связи. Эти новые концепции работы с данными дают возможность решить проблемы, связанные с эффективностью процесса получения информации. Многие интерфейсы данной технологии позволяют выбирать интересующий материал простым нажатием кнопки мыши на нужном слове или поле графической картинки. Поскольку категория гипертекста имеет хорошую перспективу, рассмотрим эту технологию более пристально.
Исторически сложилось так, что основная масса источников содержит информацию, изложенную в линейной последовательности. Так, например, в учебнике обычно в начале излагаются определения терминов и понятий по определенной проблеме, затем приводится информация концептуального характера, рассматриваются цели, задачи, функции систем определенного класса. Далее даются более детальные характеристики технология функционирования, этапы разработки, критерии и оценка качества системы и др.
Вместе с тем решение экономических, научных, технических, производственных, управленческих задач делает необходимыми анализ и синтез информации на уровне каких-либо отдельно взятых признаков или фрагментов источников, например оценки состояния не только какой-либо определенной системы, но также и систем различных классов. Таким образом, возникает необходимость поиска и получения соответствующих сведений на уровне родственных фрагментов текстов, имеющихся в разнообразных источниках.
Один из путей решения подобной задачи — создание гипертекстов как новой и оригинальной разновидности источников информации. В более широком смысле гипертекст может рассматриваться как система источников информации. Гипертекст — это информационный массив, на котором заданы и автоматически поддерживаются ассоциативные связи между выделенными элементами, понятиями, терминами или разделами. В гипертексте логические блоки связаны друг с другом в нелинейной последовательности. Материальная реализация гипертекстов может быть осуществлена посредством традиционных носителей информации, например в виде картотеки, словарей, а также симбиозом средств различных классов, чаще всего с применением ЭВМ, с соответствующим структурированием, форматированием и отображением информации.
Форма существования гипертекста — гипер-среда. Гипер среда — это комбинированное информационное пространство, с которым взаимодействует пользователь с помощью ЭВМ. Это пространство включает в себя такие средства, как текст и гипертекст, графику, звуковое сопровождение.
Концепция гипертекста состоит в следующем. Какая-либо область знаний (проблема, тема, задача) путем деления (классификации) переводится на уровень дискретных знаний в виде когнитивных информационных элементов. Каждый элемент взаимосвязан с другими элементами ИС. Характер связи между элементами задается путем присвоения каждому элементу определенных обозначений. Таким образом, пользователь имеет возможность проводить ассоциативный поиск информации по различным направлениям, менять в интерактивном режиме его стратегию. Элементы гипертекста — это документы и (или) фрагменты документов с описанием проблем, идей, гипотез, резюме, постановок задач, методов, формул, списков источников, таблицами, схемами, рисунками и др. Необходимо отметить, что гипертекст становится ГТС, если он соединяется с информацией другого рода — музыкой, картами, чертежами, фотографиями, фильмами. Птертекстовая система — это способ построения гипертекста для представления информации и управления ею, при котором она реализуется в форме сетей, разнородных по видам информации узлов, объединенных с помощью типовых ссылок.
Эффективность выполнения разнообразных функций ГТС в значительной мере определяется уровнем ее структуры.
Структура ГТС в логическом отношении состоит из трех основных подсистем:
1) текстовая база данных;
2) семантическая сеть, реализующая связи компонентов текста;
3) интерфейс пользователя для взаимодействия пользователя и ЭВМ использования текстовой базы данных с семантической сетью.
Текстовая БД может содержать разнородную, как по содержанию, так и по форме представления информацию. Это могут быть фрагменты документов, отдельные документы, их совокупности, музыка, фильмы, фотографии, чертежи, рисунки, таблицы, карты, графики и др. Документы гипертекстовой структуры иногда называют.
В зависимости от способа реализации семантической сети и установления связи между элементами информации гипертекстовая БД может быть линейного, иерархического и сетевого типов. Разнообразие видов связей и их внутривидовых модификаций реализуется посредством системы ссылок, меток, шифров. Каждый логический элемент текста, например записанный на отдельной карточке, имеет соответствующий набор ссылок, определяющий характер и объем его связей с остальными элементами гипертекстовой БД.
Технология создания гипертекста отличается от технологии создания обычного текста. Необходимо, прежде всего, обеспечение нелинейной организации текста, образование механизма связей между его фрагментами и дружественного к пользователю интерфейса. ГТС по своей природе интегрирует средства создания, представления, обмена и аннотирования данных. Для ее создания необходимо определить типы данных (текст; таблицы; мультипликация; черно-белая, полутоновая, многоцветная графика и т.д.), систему навигации по тексту и стратегию внесения изменений.
Процесс создания ГТС предусматривает четыре этапа:
1) перевод текста и изображений в машиночитаемую форму;
2) векторизация, придание соответствующим элементам гипертекста форм графических объектов;
3) форматирование декларативных и процедурных частей документов, вводимых в ГТС;
4) организация диалогового поиска, взаимодействия пользователя и ГТС.
Перевод в машиночитаемую форму текста и изображений обычно выполняется с помощью сканирующего устройства. Полученные растровые изображения переводятся в графические объекты в процессе векторизации.
Типичный представитель гипертекста как нового средства записи, хранения представления информации гипер карта. Гипер карта — это набор программных средств, позволяющих пользователю интегрировать информацию в интерактивном режиме. Гипер карта дает возможность синтезировать разнородную информацию в рамках одной программы, а также связывать информацию на различных картах посредством карт — указателей связей.
Эксплуатируемые в настоящее время ГТС ориентированы на решение разнообразных задач. Так, например, посредством вышеописанной гипер карты можно моделировать механизм мыслительных операций, отображать концепции, гипотезы, ассоциации в виде специфических способов организации и использования информации.
На базе пакетов ППП гипер карты создана ГТС, предназначенная для автоматизации семинарской работы студентов. В систему вводятся и обрабатываются три вида информации: библиографические описания первоисточников, тексты рефератов студентов и замечания по рефератам. При обращении к системе экран дисплея делится на два окна: в одном отображается анализируемый текст, а в другом можно просматривать дополнительную информацию по теме реферата. Управление информацией в окне осуществляется путем выбора курсором управляющих символов на экране. Система позволяет просматривать документы, корректировать их, добавлять замечания студентов по рефератам. Пользуясь системой, любой из студентов может ознакомиться с текущим состоянием обсуждения, имеющимися рефератами и замечаниями по ним, использованными первоисточниками и др.
Гипертекстовая технология работы с документами и БД непрерывно развивается. Вместе с тем в настоящее время в Интернете возникают и новые средства отображения документов. Компания приняла новый стандарт хранения и структуризации информации. Технология главным образом предназначена для обмена информацией между неоднородными компьютерными системами, а также может быть использована для создания открытых БД. В том же году была также принята на вооружение технология Х8Ь, которая позволяет трансформировать документы в другие типы через шаблонные описания. Посредством можно извлечь определенные документы из базы и трансформировать их в поток для пользовательского браузера.
На веб-сайте также можно найти информацию о такой весьма полезной технологии, как технология КВР. КВР — это оболочка описания ресурсов, хранящихся на веб-странице. Она обеспечивает улучшенный обмен машиночитаемой документации между веб-системами. Стандарт КОР предназначен в основном для автоматизированных систем поиска документов.
В последнее время для обеспечения лучших эргономических свойств документов, содержащих экономическую информацию, стали активно применяться графические средства. Особенно эффективны они оказались в системах презентационного и рекламного характера. В настоящее время наиболее интенсивно развивается так называемая технология. Средства этой технологии позволяют разрабатывать оригинальные графические документы, пользовательские интерфейсы с включением анимации, видео и звука.
Существенное развитие ГТС получили в результате реализации пятой рамочной программы Европейского союза «Технология информационного общества». Она была рассчитана на 1998—2003 гг. и имела общий бюджет 3,6 млрд. евро.
В этой программе предусматривались четыре исследовательских направления:
• системы и службы для граждан;
• новые формы и способы работы и электронной коммерции;
Можно сказать, что ГТС и система универсальных адресов дает возможность использования практически всех информационных ресурсов Интернета. Многие фирмы взяли на вооружение для электронного представления своих информационных материалов — прайс-листов продукции, рекламных сообщений, новых изданий, электронных версий журналов и др. В системе существует большое количество различного рода каталогов, которые позволяют ориентироваться в сети. Кроме того, пользователи могут иметь доступ даже к удаленным программам, смотреть фильмы по сети. Такой сервис не обеспечивается другими информационными системами Интернета.
Система одна распределенная ИС Интернета. В основу ее интерфейсов положена идея иерархических каталогов. Внешне выглядит как огромная файловая система, которая расположена на машинах сети. Первоначально задумывался как информационная система университета с информационными ресурсами факультетов, кафедр, общежитий и т. п. В России серверы не так распространены, как во всем мире.
Система — распределенная информационно-поисковая система Интернета. В основу этой системы положен принцип поиска информации с использованием логических запросов, основанных на применении ключевых слов. Пользователь проводит поиск по всем серверам на наличие документов, соответствующих запросу Система широко применяется в других информационных сервисах Интернета, как поисковая машина. Наиболее известным проектом, где была применена, является электронная версия энциклопедии «Британик».
Система X.500 — европейский стандарт для компьютерных справочных служб. БД Х.500 содержат информацию о пользователях сети, их электронные и обычные адреса, идентификаторы и реальные имена, должности и места службы. Кроме того, в них хранится информация не только о физических лицах, но и об организациях. В последнем случае дается краткое описание основных направлений их деятельности.
Эффективность практического применения ресурсов Интернета во многом определяется средствами поиска и доступа к нужной информации.
В сети существуют несколько типов информационно-поисковых систем:
• по каталогам, формируемым на основе информации веб-страниц;
• поиск по адресам;
• поиск посредством других поисковых систем.
Как правило, страницы рассортированы по каталогам Интернета. Если пользователя интересует не отдельная страничка или сайт, а определенная тематика, например учет материальных ресурсов, необходимо войти в раздел «экономика» и в рамках этого раздела включать средства поиска. Самые популярные поисковые системы в российской части Интернета.
В настоящее время существует много поисковых систем. Каждая из них имеет свои достоинства и недостатки. В последнее время появились небольшие поисковики третьего типа — мульти поисковые машины. Задача этого класса систем включить в поиск ресурсы всех имеющихся АИПС, а затем по результатам поиска отсортировать дублирующиеся сведения. По такому принципу в российском Интернете работает «Буки». Такие системы способны одновременно работать с 10—20 АИПС. К числу российских мульти поисковиков относится Диско-Искатель, которая может работать с российскими и зарубежными серверами.
Сетевые информационные технологии электронной коммерции
В последние годы в число перспективных направлений сетевых информационных технологий вошли системы электронной коммерции. Еще недавно система Интернет рассматривалась лишь как глобальное средство представления информации. Однако уже сейчас эта сеть активно используется многими компаниями как оперативное средство связи. Речь идет как о связи внутри одной корпорации, так и об обмене информацией между разными фирмами, имеющими деловые связи. Подобное использование Интернета позволяет оптимизировать информационные потоки, ускорить и сделать более качественным процесс ведения самого бизнеса. Другая активно применяемая модель бизнеса в сети связана с использованием Интернета как средства массовой коммуникации для распространения сведений о фирме, ее продукции и услугах, в качестве средства маркетинговой политики.
Электронная коммерция. В настоящее время интенсивно развиваются различные формы электронной коммерции. Это наиболее перспективный вариант ведения сетевого бизнеса. Одна из распространенных форм электронной коммерции — организация торговли своей продукцией в сети путем создания виртуального магазина.
Виртуальный магазин — это представление предприятия в Интернете путем создания веб-сервера. Основная цель организации веб-сервера заключается в продаже товаров и услуг другим пользователям Интернета. Посетитель такого магазина, посредством гипертекстовых ссылок, используя многочисленные мультимедийные возможности, может получить в полном объеме информацию о продукции и сделать заказ. Виртуальный магазин должен иметь доменный адрес, как и любой другой веб-сервер, он состоит из целого ряда гипертекстовых страниц, часто с мультимедийными элементами.
Виртуальные магазины во многом схожи с обыкновенными торговыми центрами, однако при этом имеют ряд неоспоримых преимуществ. Как в любом магазине, здесь обязательно должен присутствовать торговый зал, где покупатель может спокойно просмотреть всю интересующую его информацию о товарах. При наличии широкого ассортимента товаров имеет смысл разложить товар по отдельным страницам, чтобы пользователям было легче ориентироваться. Пользователь должен иметь возможность узнать о заинтересовавшем его продукте все, что ему нужно. Это основной принцип, из которого следует исходить при создании виртуального магазина. Некоторые из таких магазинов организованы таким образом, что покупатель, прежде чем принять окончательное решение о покупке, может осмотреть товар со всех сторон, узнать все возможные параметры вплоть до звука его работы и даже его запаха.
Выбрав в виртуальном магазине товар и узнав его стоимость, покупатель может, перейдя по ссылке на другую страницу заказать его и получить счет при оплате заказанного товара можно воспользоваться кредитной карточкой. Однако существуют определенного рода опасения, что информация о номерах и персональных кодах кредитных карточек может стать добычей сетевых злоумышленников — хакеров. Проблема безопасности сети, тормозящая развитие всего сетевого бизнеса, уже сейчас с успехом решается с помощью различных способов и схем шифрования информации, передаваемой по Интернету для лучшей реализации идеи виртуального магазина необходимо также разместить информацию о фирме, посвятить один из разделов сервера партнерам, как существующим, так и потенциальным, где будет размещаться вся необходимая и оперативная информация для налаживания эффективных контактов.
Виртуальная коммерция способствует улучшению конкурентных позиций фирмы. Так как в сферу ее деятельности попадает фактически территория всего земного шара. К тому же виртуальный магазин, работая 24 часа в сутки, способен быстро и адекватно реагировать на запросы пользователей, у которых поиск нужной информации занимает всего несколько секунд. Необходимо также отметить значимость сети как эффективного маркетингового инструмента. Любой посетитель может заполнить предложенную ему анкету Таким образом, можно без особых затрат изучить потенциального покупателя, круг его интересов и в дальнейшем учесть полученные результаты при ведении как реального, так и виртуального бизнеса.
Одним из наиболее значимых факторов распространения виртуальной торговли следует считать относительно низкие издержки. Это касается, во-первых, процесса организации самого виртуального магазина или веб-сервера, который оказывается более дешевым, чем процесс организации обычной торговой точки, причем виртуальный магазин может обслуживать гораздо более широкий круг покупателей; во-вторых, снижаются затраты на продвижение и торговлю товарами и услугами. Так, для нормального функционирования веб-магазина необходимо существенно меньше работников, поскольку большинство их функций берет на себя непосредственно программа.
Торговля информацией — одна из старейших форм коммерции в сети. Среди всего объема информации 30—40 % посвящено бизнесу и финансам. Можно выделить несколько вариантов предоставления информационного сервиса по бизнесу и финансам.
Во-первых, следует отметить существование каталогов и справочных систем по ресурсам в Интернете. Они созданы с целью облегчить работу пользователей в сети. Интерфейс подобных систем позволяет организовать поиск данных по определенному ключу, однако предоставление подобного сервиса не следует считать электронной коммерцией, поскольку пользование услугами происходит на бесплатной основе. Среди российских сервисов подобного рода можно отметить российские поисковые системы, а также новый проект «Российский Интернет — рубрикатор ресурсов». Такие проекты чаще всего позволяют получать прибыль за счет большого объема рекламы, размещаемой на их страницах, поскольку поисковые системы — одни из самых посещаемых пользователями серверов.
Другая форма информационного бизнеса связана с массовым появлением различных печатных изданий в Интернете. Компания-издатель организует веб-сервер, на котором размещает материалы печатного издания либо его электронную версию. Основная цель — увеличение числа читателей издания. Для решения данной проблемы обычно применяется комбинированный подход. Один из наиболее распространенных вариантов — размещение на сервере дайджеста из информации, опубликованной в печатном издании, который мог бы заинтересовать читателя, но в то же время не был бы полной версией материалов, приглашая тем самым ознакомиться с печатным изданием. Одновременно пользователь должен иметь возможность подписаться на издание, перечислив на счет издательства его стоимость.
Кроме того, часто можно подписаться и на электронную версию издания. В этом случае после перечисления необходимой суммы денег на счет издательства пользователь получает определенное имя и пароль, которые необходимо вводить для доступа к информации. Однако, чтобы исключить переход к другому поставщику аналогичной информации, которая предоставляется на бесплатной основе, издательства предоставляют наиболее свежую и оперативную информацию на платной основе, в то время как архив выпусков печатного издания делают доступным для любого пользователя.
Практически все российские информационные агентства имеют свое представительство в сети: ИТАР-ТАСС, РИА-новости, Национальная служба новостей и др. Многие газеты размещают в сети электронные версии своих изданий. В последнее время также стали появляться принципиально новые средства массовой информации. Первым среди них стал общедоступный Интернет-сервер АКДИ «Экономика и жизнь», который зарегистрирован в Госкомитете РФ по печати и специализируется на предоставлении информации и консультаций в сети по экономическим, финансовым, правовым вопросам.
Наиболее фундаментальные электронные издания в сети — реализованные в технологии аналоги крупных печатных изданий — гипертекстовые книги, энциклопедии. В качестве примера можно привести реализацию в виде гипертекстовой мультимедийной энциклопедии одной из старейших энциклопедий мира — «Британик». Доступ к ней платный, однако, предоставляется возможность недельного бесплатного пользования энциклопедией для ознакомления с работой системы.
Еще один вариант информационной коммерции в сети — предоставление бизнес-информации. Это могут быть котировки ценных бумаг, курсы валют, цены на биржах, оперативные новости. В последнее время организуются специальные ИС, или бизнес-службы.
Технология платежных средств в Интернете. Маркетинговый потенциал сети Интернет растет с увеличением количества пользователей, с одной стороны, и организаций, заинтересованных в размещении коммерческой рекламы в Интернете, — с другой.
Однако возможности делового использования глобальных цифровых коммуникаций не ограничиваются размещением рекламы. У потенциального покупателя должна быть возможность приобретения товара. Со временем возможность расчетов и платежей с использованием компьютерных сетей публичного доступа превратилась из теоретической проблемы в разряд практических задач. В основе всех предлагаемых сегодня систем расчетов и платежей с использованием Интернета лежат довольно развитые криптографические технологии обеспечения конфиденциальности информации и аутентичности пользователей.
Предложенные на сегодня средства электронных расчетов можно разбить на фи категории: суррогатные расчетные средства, чеки и пластиковые карточки, электронная наличность.
В Интернете представлены две технологии, реализующие эту идею. Компания предлагает сетевую версию электронного кошелька, реализованную в виде аппаратно-программного комплекса. Компания представила технологию сетевых электронных денег в программном варианте. В основе технологии лежит тот же прием криптозащиты с открытыми ключами. Эмитент электронной наличности (банк) имеет, кроме обычной пары ключей, аутентифицирующей его, последовательность пар ключей, в соответствии с которыми ставятся номиналы «цифровых монет». Снятие наличных со счета производится следующим образом. В ходе сеанса связи клиент и банк (точнее, их программы-представители) аутентифицируют друг друга. Затем клиент генерирует уникальную последовательность символов. Процедура заключается в преобразовании последовательности символов путем ее «умножения» на случайный множитель. Затем клиент «закрывает» полученный результат открытым ключом банка и отправляет «монету» в банк. Банк «раскрывает» «монету», используя свой секретный ключ, «заверяет» ее электронной подписью, соответствующей номиналу «монеты», «закрывает» ее открытым ключом клиента и возвращает ее клиенту, одновременно списывая соответствующую сумму с его счета. Клиент, получив «монету», «открывает» ее с помощью своего секретного ключа, затем «делит» ее символьное представление на запомненный случайный множитель и сохраняет результат в «кошельке». Теперь банк может принять только однократно эту «монету» от кого бы она ни поступила.
Для вложения наличности клиент просто связывается с банком и отправляет ему полученную «монету», закрыв ее открытым ключом банка. Банк проверяет, не была ли она уже использована, заносит номер в регистр входящих и зачисляет соответствующую сумму на счет клиента. Сделка между двумя клиентами предполагает лишь передачу «монеты» от покупателя к продавцу, который может либо сразу внести ее в банк, либо принять ее без проверки. Вместе с «монетой» передается некоторая дополнительная информация, которая сама по себе не может помочь идентификации плательщика, но в случае попытки дважды использовать одну и ту же «монету» позволяет его обнаружить.
Использование и составляет суть приема «слепой подписи» в дополнение к обычному методу криптозащиты с открытыми ключами. Благодаря использованию «слепой подписи» банк, будучи не в состоянии накапливать информацию о плательщиках, сохраняет возможность следить за однократным использованием каждой «монеты» данным клиентом и идентифицировать получателя каждого платежа. Подобная логика взаимодействия сторон обеспечивает одностороннюю безусловную конфиденциальность платежей. В этой технологии покупатель не распознается даже при злом умысле продавца и банка. В то же время покупатель при желании может идентифицировать себя сам и доказать факт осуществления сделки, апеллируя к банку. Такая логика призвана воспрепятствовать криминальному использованию электронной наличности.
Интеллектуальные информационные технологии в экономической деятельности
в экономической деятельности приходится решать разнообразные задачи. Достаточно хорошо структурированные задачи решаются на основе программных систем, построенных на формализованных моделях. Однако не всегда и не везде экономические задачи можно решить только на строго детерминированных принципах. Существует класс задач, при решении которых операторы управления, как правило, вынуждены прибегать к так называемым интуитивным, или эвристическим, решениям. Эти решения основаны на нечетких алгоритмах. Решения, получаемые при этом, неоптимальные в математическом смысле, тем не менее, учитывают сложную природу взаимосвязи реальных объектов, процессов и их элементов между собой и внешней средой. Поэтому синтез моделей объектов или процессов, которые учитывают еще и профессиональные знания (опыт, интуицию) ЛПР, позволяет повысить обоснованность принимаемых решений и добиться нового качества управления сложными экономическими системами.
Один из основных путей улучшения качества управления сложными организационными системами — создание ИИТ.
Создание ИИТ связано с решением комплекса проблем синтеза в ЭС. Синтез БЗ — это не только сложная научная проблема, но и длительный, трудоемкий и слабоструктурированный процесс. До 90 % времени при создании систем с БЗ идет на процесс приобретения и формализации знаний. Эффективность ЭС в значительной степени определяется знаниями, введенными в БЗ. ЭС — это средство информационной технологии, автоматизирующее процесс представления знаний и процедур получения и генерации (вывода) знаний.
Создание и модификация БЗ осуществляются совместными усилиями эксперта и инженера по знаниям. Для этой цели создается интеллектуальный редактор БЗ. Он представляет собой программу, работающую в диалоговом режиме, который облегчает работу с БЗ. Решатель (блок логического вывода) производит вывод (генерацию) нового знания, те. решает поставленную задачу на основе имеющихся в БЗ. При желании пользователь ЭС может получить объяснение того, как была решена задача. Для этого в ЭС включают блок объяснений. Взаимодействие с ЭС пользователя происходит при помощи интерфейса пользователя. Центральный блок ЭС — БЗ.
Свойства знаний. Обязательный элемент, определяющий эффективность функционирования любой АИИС — знания. В этих системах нет общепризнанного формального определения понятию «знания». Знания есть особая информация, зафиксированная и выраженная в языке. Основные типы отношений, определяющие опосредованную связь знаний с внешним миром отображаются с позиций семиотики и подчиняются ее основным категориям — семантике, синтаксису и прагматике. Таким образом, знания — это не только особая форма информации, но и особая система отношений. В качестве рабочего можно принять следующее определение: знания — это особая форма информации, представляющая собой совокупность структурированных теоретических и эмпирических положений предметной области, которые обладают определенными свойствами и связаны синтаксическими, семантическими и прагматическими отношениями. Грань, отделяющая информацию от знаний, условна. Признается, что знания имеют пять важных свойств, позволяющих считать их таковыми: внутренняя интерпретируемость, рекурсивная структурируемость, взаимосвязь единиц, наличие семантического пространства с метрикой и активность.
В настоящее время не создано баз знаний АИИС, в которых в полной мере были бы реализованы все свойства знаний. Основные причины этого — ограниченные возможности используемых МПЗ, неполнота знаний ПрО, несовершенство методов приобретения знаний и несоответствие типов используемых знаний и моделей их представления.
Модели представления знаний. Представление знаний в АИИС не только фундаментальное понятие, но и решающий аспект их разработки. Выбор МПЗ важен ввиду их многообразия и размытости критериев выбора. Последствия неудачного решения проблемы представления знаний могут быть катастрофическими. Используемый в АИИС формализм представления знаний определяет характер их получения и накопления. В результате создается БЗ, ориентированная на определенную структуру представления, а не на сущность самих знаний. Таким образом, выбор модели, неадекватной типам знаний, приводит к потере многих существенных деталей прикладной задачи.
Проблемы представления знаний в компьютерных системах решаются на трех уровнях:
1) техническом — реализация сложного представления знаний, требующая ЭВМ с чрезвычайно развитой функциональной структурой, которая обеспечивает параллельные вычисления в режиме реального времени;
2) программном — создание программ, которые обеспечивают выполнение всех алгоритмов, необходимых для представления знаний;
Под представлением знаний подразумевают соглашение о том, как описывать реальную ПрО, в частности понятия и отношения. Иногда такое соглашение называют нотацией. Каждая модель определяет форму представления знаний, будучи формализмом, призванным отобразить объекты, связи между ними, иерархию понятий ПрО и изменение отношений между объектами. Для решения проблемы представления знаний разработаны разнообразные МПЗ. В системах искусственного интеллекта используются в основном четыре типа МПЗ: логическая, продукционная, семантическая сеть и фрейм.
Логические МПЗ представляют знания в виде формул, которые состоят из констант, переменных, функций, предикатов, логических связок и кванторов. Каждая логическая формула дает частичное описание состояния ПрО.
Среди реализаций логических МПЗ различают системы дедуктивного типа (имеют фиксированную систему правил вывода) и индуктивного типа (правила вывода порождаются системой на основе конечного числа обучающих примеров).
В логических схемах синтаксис задается набором правил построения правильных синтаксических выражений, а семантика — набором правил преобразования выражений и разрешающей процедурой, позволяющей однозначным образом и за конечное число шагов определить, является ли данное выражение семантически правильным. К достоинствам логических МПЗ относятся: высокий уровень модульности знаний, лаконичность представления, наличие четкого объекта анализа и определение понятия логического вывода. Они позволяют формальным путем получить новые знания. К недостаткам можно отнести чрезмерный уровень формализации знаний, слабая наглядность, трудность прочтения логических формул и сложность их понимания. Кроме того, логические МПЗ имеют технологические ограничения: низкая производительность при отработке знаний, необходимость большой памяти, отсутствие выразительности средств для отражения особенностей ПрО и структурирования знаний, громоздкость при описании больших объемов знаний. Чаще всего логические МПЗ применяются в сочетании с другими моделями.
Продукционные МПЗ задаются в виде выражений: «если имеется условие, то предполагается выполнить действие»; «если имеется причина, то она влечет следствие»; «если возникает ситуация, то предполагается решение». Продукционные модели могут быть реализованы, в частности, процедурно. В процедурных системах присутствуют фи компонента: БД, некоторое число продукционных правил (продукций), состоящих из условий и действий; интерпретатор, который последовательно определяет, какие продукции могут быть активированы в зависимости от содержащихся в них условий. В БД хранятся известные факты выбранного ПО. Продукционные правила (продукции) содержат специфические знания ПО о том, какие еще дополнительные факты могут быть учтены, есть ли специфические данные в БД. В АИИС, построенных на использовании продукционных МПЗ, БД представляет собой переменную часть, а правила и интерпретатор не изменяются. Благодаря свойству модульности, присущему продукционным МПЗ, можно добавлять и изменять знания (правила, факты). Поэтому продукционные МПЗ применяются в ПО, где нет четкой логики и задачи решаются на основе независимых правил (эвристик). Продукционные правила несут информацию о последовательности целенаправленных действий. Продукционные модели благодаря причинно-следственному характеру правил хорошо отражают прагматическую составляющую знаний.
АИИС продукционного типа удобна, если решается небольшая задача. С увеличением объема знаний эффективность такой АИИС снижается.
Семантические сети МПЗ основываются на результатах изучения организации долговременной памяти человека. Характерная особенность семантических сетей в том, что они для образования своей структуры используют два компонента — вершинам сети соответствуют понятия (объекты, события, процессы, явления), а дугам, их соединяющим, — отношения, связи между понятиями.
В зависимости от структуры узлов и характера отношений между ними различают следующие сети: простые и иерархические, однородные и неоднородные. Последние делятся на функциональные сети, сценарии и семантические сети.
В семантических сетях знания представлены в терминах естественного языка и естественных отношений между ними (элемент-класс, класс-подкласс, функциональные дуги).
Основные общие характеристики сетей следующие:
• описание объектов производится на естественном языке;
• все знания накапливаются в относительно однородной структуре памяти;
• на сетях определяются унифицированные отношения между объектами, которым соответствуют унифицированные методы вывода;
• методы вывода в соответствии с запросами определяют участки семантического знания, имеющего отношение к поставленной задаче;
• аппарат вывода определяет процедуру понимания запроса и соответствующую цепь выводов по решению задачи.
К достоинствам семантических сетей можно отнести: логическую гибкость, полученную благодаря наличию свойств ассоциативности и иерархичности; гармоничность и естественность сочетания декларативного и процедурного, синтаксического и семантического знаний; наглядность отображения объектов, связей, отношений в силу присущей им возможности графической нотации; лучшую читаемость и понимаемость знаний; высокую степень структуризации знаний. Среди недостатков следует выделить: сложность и трудность разработки алгоритмов анализа семантической сети в силу нерегулярности структуры и большого количества дуг, несущих синтаксическую информацию; пассивность структуры сети, для обработки которой необходим сложный аппарат формального вывода и планирования; разнообразие типов вершин и связей, произвольность структуры, требующие большого разнообразия процедуры обработки; трудность представления и обработки неточных и противоречивых знаний. В целом семантические сети позволяют представлять семантику ПО, а также осуществлять за счет наличия связей и отношений между понятиями целевую ориентацию и, таким образом, отражать прагматическую составляющую знаний. В связи с указанными недостатками предприняты попытки усовершенствования семантических сетей, которые нацелены в основном на организацию процессов обобщения, решение проблемы поиска и повышение изобразительных возможностей сетей.
Фреймовые МПЗ — это особые познавательные структуры, дающие целостное представление о явлениях и их типах. Основной элемент этой МПЗ — фрейм.
Фреймы отражают концептуальную основу организации памяти человека. Слоты — это некоторые структурные элементы фрейма, заполнение которых приводит к тому, что фрейм ставится в соответствие некоторому объекту — предмету или явлению. Значениями слота могут быть конкретные данные, процедуры и даже продукции. В качестве слота может быть указано имя другого фрейма. Слот может быть пустым (незаполненным). Из всех ранее рассмотренных МПЗ только фреймам свойственна высокая структурируемость, внутренняя интерпретируемость посредством имен и значений и связность слотов и их значений.
Кроме того, фреймы обладают высокой наглядностью и модульностью, объединяют достоинства декларативного и процедурного представления знаний. Однако фреймы наиболее эффективны при обработке семантической составляющей знаний. У фреймов, как и у семантических сетей, отсутствуют универсальные процедуры их обработки, что приводит к неэффективному использованию ресурсов процессора и памяти ЭВМ.
Рассмотренные МПЗ — это в некотором смысле разновидности структур данных, хотя эти МПЗ и используются в АИИС для обработки знаний. На основе МПЗ строятся технологии приобретения знаний.
Технология приобретения знаний. Главная задача при построении АИИС — приобретение знаний. От качества и полноты первоначальных знаний, введенных в БЗ, в решающей степени зависят эффективность работы АИИС и качество решения задач пользователя.
В современных экспертных системах генерация знаний базируется на следующих основных компонентах:
• БЗ;
• подсистеме приобретения знаний;
• интерфейсе пользователя;
• подсистеме объяснения;
• машине вывода;
• доске объявлений (рабочая память);
• подсистеме совершенствования вывода.
Такая структура обеспечивает пользователю возможность наполнения ЭС нужными данными и знаниями и проведения консультаций с системой при решении экономических задач. Среда разработки используется разработчиком ЭС для введения и представления экспертных знаний. Среда консультации доступна пользователям для получения экспертных знаний и подсказок.
В подсистеме приобретения знаний происходит сбор, передача и преобразование опыта решения экономических задач из определенных источников знаний в компьютерные программы при их создании или расширении. Источники знаний — это эксперты, специалисты, БД, научные отчеты, учебная литература, опыт пользователей-экономистов. Извлечение знаний в силу своей сложности — узкое место в создании и технологии ЭС. Для построения БЗ нужен инженер по знаниям. Он оказывает эксперту методическую помощь в структурировании его знания о ПрО, интерпретирует и интегрирует ответы на вопросы, находит аналогии, предлагает контрмеры и выявляет затруднения в определении концептуального уровня задач.
В БЗ содержится все необходимое для понимания, формирования и решения задач. Она содержит два основных элемента: факты (данные) из ПрО и специальные правила, или так называемые эвристики, которые управляют использованием фактов при генерации знаний. Кроме того, БЗ может включать мета-правила, т.е. правила о правилах для решения проблем и получения выводов. Эвристики выражают формальные суждения о ПрО. Для ЭС первичный исходный материал — знания, а не факты. Информация БЗ включается в программу ЭВМ в процессе представления знаний.
Экспертной системы — машина вывода, или интерпретатор правил. Этот блок — программа ЭВМ, поддерживающая методологию обработки информации из БЗ, получение и представление заключений и рекомендаций посредством формирования и организации последовательности процедур, необходимых для решения задачи.
Машина вывода состоит из следующих основных элементов:
• интерпретатор, выполняющий выбранные процедуры с применением соответствующих правил базы знаний;
• планировщик, управляющий процессом выполнения процедур посредством оценки эффекта применения различных правил с точки зрения приоритетов или других критериев.
Доска объявлений как область рабочей памяти выделяется для описания текущей задачи посредством специфицированных входных данных. Она используется также для записи промежуточных результатов. Здесь регистрируются текущие гипотезы и управляющая информация. В частности, план (стратегия для решения задачи), повестка (потенциальные действия, ожидающие выполнения), решения (гипотезы и альтернативные способы действий, порожденные ЭС).
Интерфейс пользователя ЭС играет существенную роль в эффективности решения задач. ЭС имеет лингвистический процессор, который обеспечивает дружественный и проблемно-ориентированный интерфейс пользователя с ЭВМ. Здесь может использоваться многооконное меню с естественным языком и графикой.
Подсистема объяснения обеспечивает возможность проверки соответствия выводов их посылкам и имеет важное значение, как при передаче опыта, так и при решении задач. Подсистема объяснения может проследить соответствие и объяснить поведение ЭС, интерактивно отвечая на вопросы типа: «Как было получено это заключение?», «Почему эта альтернатива была отвергнута?», «Какова последовательность подготовки решения?» и др.
Компонент совершенствования вывода основан на обратной связи. В процессе решения задач ЭС проводит двусторонний диалог с пользователем. Она запрашивает его о фактах, уточняя конкретную ситуацию решаемой задачи. После получения ответов ЭС пытается получить заключение. Эта попытка выполняется машиной вывода. Она определяет, какие эвристики необходимо использовать, чтобы установить порядок применения знаний из БЗ. При необходимости пользователь может запросить объяснение ЭС ее заключений. Истинность вывода зависит от метода, который был выбран для представления знаний, полноты БЗ и логического аппарата машины вывода.
Эксперты проводят тщательную работу по накоплению знаний, опыта, набора правил порождения знаний и др. Это позволяет в дальнейшем анализировать и оценивать успешность принятых решений, методик и средств, задействованных при построении и эксплуатации ЭС. Это приводит к «очищению» знаний, улучшению их представления и выработки, к совершенствованию технологии ЭС в целом.
В осуществлении процесса приобретения знаний принимают участие инженеры по знаниям, программисты и так называемые источники знаний. В роли источников знаний выступают эксперты, факты, примеры, данные ПрО, в частности учебники, монографии, статьи, инструкции и т.п. Инженеры по знаниям и эксперты в процессе приобретения знаний могут выполнять различные функции в зависимости от применяемых методов извлечения, получения и формирования знаний, а также наличия и степени развитости средств автоматизации.
Инженер по знаниям выполняет следующие основные функции:
• управление процессом коммуникации в форме последовательности содержательных сообщений;
• переработка сведений, включающая все возможные способы анализа и синтеза информации;
• идентификация и конструирование понятий, выяснение и фиксирование их смысла, а также установление отношений между ними и когнитивными элементами;
• хранение информации путем запоминания, выборки и документирования.
Поскольку приобретение знаний и разработка прототипа ЭС — процесс трудоемкий и сложный, вполне естественно, что его стремятся максимально автоматизировать. Основная задача автоматизации приобретения знаний состоит в облегчении труда эксперта и инженера по знаниям. Эта задача может быть решена двумя путями. Первый путь состоит в том, что автоматизированной системе может быть передана часть функций по приобретению знаний. Во втором случае эксперт и инженер полностью исключаются из процесса генерации знаний и создания автоматизированной системы приобретения знаний.
Применение автоматизированных систем приобретения знаний позволяет реализовать одну из трех стратегий получения знаний. В рамках первой стратегии основные функции по актуализации и формированию знаний выполняет эксперт, обращаясь при этом за помощью к АИИС. Благодаря этой помощи эксперт структурирует, систематизирует и формализует свои знания, используя некоторые средства формализации.
В результате получаются готовые формы знания для непосредственного кодирования и ввода в БЗ. Такая стратегия позволяет исключить инженеров по знаниям из технологической цепочки приобретения знаний и все их функции возложить на автоматизированную систему.
В рамках второй стратегии получения знаний ведущая сторона в диалоге — автоматизированная система. По ответам эксперта АИИС конструирует готовые формы знания и затем передает их в другие компоненты АИИС для включения в состав БЗ. Инженер по знаниям полностью исключается из рассмотренной технологической цепочки получения знаний.
Третья стратегия приобретения знаний связана с исключением из классической технологии и инженера познанием, и программиста. Заполнение знаниями таких АИИС может быть осуществлено без изменения механизма логического вывода с помощью редактора знаний. Основная функция редактора знаний — возможность заполнение БЗ нужными знаниями самим экспертом.
Методы приобретения знаний. Рассматривая методы приобретения знаний, будем использовать следующие термины: извлечение, получение, формирование, приобретение знаний и обучение БЗ. Под извлечением знаний понимают процесс приобретения материализованных знаний из текстологических источников информации с помощью некоторой совокупности методов и процедур, позволяющих переходить от знаний в текстовой форме к их аналогам, адаптированным для ввода в БЗ АИИС. Получение знаний — это процесс приобретения вербализуемых и не вербализуемых знаний эксперта, основанный на использовании непосредственно им самим или инженером по знаниям приемов, процедур, методов и инструментальных средств. Формирование знаний — это процесс автоматического приобретения системой искусственного интеллекта или инструментальным средством нового и полезного знания из исходной и текущей информации, которое в явном виде эксперты не формируют. Под приобретением знаний понимается процесс, основанный на переносе знаний из различных источников в БЗ путем использования различных методов, моделей, алгоритмов и средств. Понятие «получение знаний» соотносится с понятиями «извлечение», «приобретение», «формирование знаний» как целое—часть. Обучение БЗ — это процесс ввода (переноса) приобретенных знаний в АИИС на основе применения совокупности методов, приемов и процедур в целях ее заполнения, расширения и модификации. Термин «обучение» рассматривается как свойство БЗ, совокупность методов, приемов и процедур ввода знаний в БЗ и процесс переноса знаний в АИИС. Большинство методов извлечения и получения знаний основано на прямом диалоге с экспертом.
Методы извлечения знаний состоят из текстологических методов и методов автоматической обработки текстов. Текстологические методы предназначены для получения инженером по знаниям знаний из материализованных источников. Текстологические методы, несмотря на их простоту, наименее разработаны. Эти методы основываются не только на выявлении и понимании смысла текста, но и на выделении базовых понятий и отношений, т. е. формировании семантической (понятийной) структуры ПО.
Компрессия текста служит методологической основой для использования текстологических процедур извлечения знаний. Текстологические методы самые трудоемкие и применяются, как правило, на начальном этапе создания АИИС. Значительное развитие получили методы извлечения знаний, применяющие современные информационные технологии, в частности гипертекстовые технологии.
К методам получения экспертных знаний можно отнести и коммуникативные методы (пассивные и активные), основанные на прямом диалоге экспертов и инженеров по знаниям как без использования АИИС, так и с их применением при использовании психо-семантики и тестирования БЗ. Коммуникативные методы получения знаний рассматриваются как разновидности интервьюирования. Они отличаются своей низкой эффективностью. Так, при непосредственном взаимодействии инженера по знаниям и эксперта теряется до 76 % информации. Один из путей совершенствования процесса приобретения знаний состоит в разработке методов, позволяющих передать часть функций, выполняемых инженером по знаниям, самому эксперту или АИИС.
Трудности извлечения знаний из текстовых источников и получения их от экспертов стимулировали развитие методов формирования знаний, известных как «методы машинного обучения». Для развитых АИИС способность обучаться, т.е. самостоятельно формировать новые знания на основе текущих знаний и собственного опыта решения прикладных задач, — это их существенная характеристика. Методы формирования знаний лежат в основе автоматических систем приобретения знаний. Автоматические системы формирования знаний являются предпочтительными, так как снижается время приобретения знаний, уменьшается вероятность ошибок в них. Следует отметить, что фундамент формирования знаний — индукция, которая лежит в основе получения общих выводов из совокупности частных утверждений. Поэтому главная проблема, которую необходимо решить по мере развития методов, — как от набора частных случаев перейти к их обобщению.
Основное направление повышения эффективности процесса представления знаний — его автоматизация. Процесс приобретения знаний поглощает от 50 до 90 % общего времени и ресурсов, затрачиваемых на построение АИИС. Одновременно применение оболочек уменьшает стоимость генерации единицы знания примерно в 10 раз. Однако применяемые АИИС, в частности ЭС, дают значительный выигрыш по ресурсо-затратам в зависимости от сферы их применения. Так, например, в проектировании они повышают производительность труда в три— шесть раз; ускоряют поиск неисправностей в технических системах в 5—10 раз; в профессиональной подготовке снижают затраты времени в 8—12 раз.
ЭС, применяемые в финансовой области. ЭС находят все большее применение в коммерческой деятельности, позволяя аккумулировать знания дорогостоящих экспертов и использовать эти знания неоднократно. ЭС служат в качестве автоматизированных помощников при страховании, кредитном обслуживании и управлении портфелями ценных бумаг, финансовом планировании, оценке риска, аудиторских и ревизионных проверках.
Характерная особенность ЭС, применяемых в финансовой области, — их гибридность, т. е. они используют парадигмы, базирующиеся на правилах, однако тесно интегрированы с обычными аналитическими средствами и БД. Например, экспертная система (консультант менеджера), разработанная фирмой помогает менеджеру в планировании коммерческих операций. Система включает, кроме БЗ, электронную таблицу, БД и графические программы с возможностью использования мыши. Сеанс работы представляет собой последовательность итеративных действий, которая состоит из базового решения, его оценки, различных модификаций, сообщения о пересмотре и принятии решения и выполнения дальнейшей итерации. В процессе итерации пользователь может проследить влияние каждого элемента управления и сделать необходимые корректировки с помощью диалога или сообщений.
ЭС оценивает риск в страховании для определения калькуляции цен. Эта система может использоваться в коммерческой сфере для подсчета стоимости работника с оценкой его страховки при страховании моряков внутренних морей, страхования общей ответственности и в коммерческом автостраховании.
ЭС разработана известной нью-йоркской фирмой (имеет отделение в Москве). Она готовит рекомендации ревизорам и налоговым специалистам в подготовке финансовых деклараций и расчетов по налогам. Система имеет форму живого вопросника, который побуждает пользователя собирать информацию, задавать только относящиеся к делу вопросы. Процесс управляется пользователем, который решает — отвечать ли на вопрос, спросить, почему он был задан, или пропустить его. После того как система получает достаточно детальную информацию о проблеме, она структурирует свой поиск так, чтобы минимизировать его, исключив излишние пути, и загрузить в память только те части БЗ, которые будут использованы. БЗ системы отражает опыт свыше 20 экспертов в области налогов и аудиторской проверки и накапливает информацию в более чем 1 тыс. легко поддерживаемых фреймах двух типов. Фреймы вопросов определяют вопросы, ответы, предварительные условия и правила для управления диалогом; фреймы сообщений определяют, что должно быть отображено на экране, что помещено в итоговый отчет. Отчет используется для подготовки окончательного расчета налогов и выдачи рекомендаций клиентам по планированию налогов.
Пример системы для автоматизации офиса — ЭС (письмо консультанта по кредитам), разработанная фирмой и Национальным американским банком для помощи клерку в подготовке и оплате кредитных писем. В экспортно-импортных операциях кредитное письмо — базовый документ эти операции при сделке обычно оговариваются особо. Система содержит правила, находящие разногласия в документации, связанной с этими операциями. После ответа на свой запрос пользователь вводит информацию о кредитном письме и смежных документах. Система проверяет информацию на отсутствие разногласий. При их отсутствии готовится документация к оплате.
В задачах автоматизации офиса приемлемы небольшие по размеру ЭС. Они становятся интеллектуальным подспорьем в офисной работе. Эти системы позволяют быстро менять БЗ, реструктурировать их при необходимости и представлять в удобном для эксплуатации формате — электронная таблица, естественный язык, меню-окна и др.
Пример отечественной ЭС, использующей знания опытных экспертов для решения кадровых вопросов, — инструментальная интеллектуальная система психологических исследований Р8У, разработанная специалистами ВНТК «Сайнтекс» (Москва). Данная система используется руководителями учреждений, менеджерами, работниками кадровых служб и психологами для проведения профессионального и психологического отбора при приеме на работу, анализа межличностных отношений и психологической совместимости сотрудников, ведения БД по кадрам с учетом личностных характеристик людей.
Система позволяет:
• использовать готовые тесты для психологического обследования — в поставку системы включаются разнообразные тесты, необходимые для определения уровня развития личностных, деловых, социальных и интеллектуальных качеств персонала, отклонений от психологической нормы;
• получать готовые текстовые характеристики по результатам обследования;
• проводить обработку результатов тестирования, осуществлять подбор наиболее подходящих кандидатур на конкретные должности с учетом их профессиональных и личностных качеств;
• создавать и редактировать тесты, анкеты и вопросники — осуществлять коррекцию вопросов, ответов, шкал, условий и текстов интерпретаций, сортировку и статистическую обработку результатов обследований.
Система Р8У представляет собой, по сути, гибридную ЭС, включающую, кроме БЗ, обширную БД для хранения тестов и сведений о персонале, а также процедуры статистической обработки.
Отображением знаний в системе служит аппарат правил продукционного типа. На основе этих знаний формируется характеристика обследуемых. Сюда же входит и анализ особенностей формирования личности на основе биографических данных. ЭС насчитывает около 6 тыс. продукционных правил. Развитый логический аппарат позволяет системе формировать улучшенные тесты для отбора по конкретной специальности на основании профессиональных требований, определяемых пользователем системы. Система может подстраиваться и корректировать состав тестов для углубленного изучения свойств обследуемого.
Нейросетевые технологии. В составе технологий интеллектуального уровня определенное место занимают аналитические информационные технологии, которые относятся к классу нейронных сетей. В основе нейронных сетей положены алгоритмы, обладающие способностью самообучения на примерах, которые они извлекают из потока информации как скрытые закономерности. Компьютерные технологии нейросетевой структуры работают по аналогии с принципами строения и функционирования нейронов головного мозга человека и способны благодаря этому решать чрезвычайно широкий круг задач: распознавание человеческой речи и абстрактных образов, классификация состояний сложных систем, распознавание технологических процессов и финансовых потоков, решение аналитических, исследовательских, производственных задач, связанных с объемными информационными потоками. Будучи мощным технологическим инструментом, нейросетевые технологии облегчают специалисту процесс принятия важных и неочевидных решений в условиях неопределенности, ограниченных информационных ресурсов или дефицита времени. Эти важные свойства и определили практическое применение нейросетевых технологий.
Интенсивное продвижение на рынок нейросетевых технологий началось в 1990-х гг. Появилось новое поколение систем этого класса, основанное на достаточно мощных, но недорогих и простых в использовании персональных ЭВМ. Среди систем этого поколения можно назвать нейросетевой пакет американской фирмы. В настоящее время это один из самых популярных нейросетевых пакетов на рынке США. На российском рынке он появился в финансово-кредитной сфере. Финансисты стали довольно широко применять этот пакет в аналитической работе банков. Кроме финансовой сферы пакет начал применяться и в решении задач властных структур.
Одно из достоинств нейронных сетей — их способность адаптироваться к изменениям условий решаемой задачи. Механизм адаптации базируется на идее самообучения. Алгоритм самообучения не требуют каких-либо предварительных знаний о существующих в ПрО взаимосвязях. Здесь надо только подобрать достаточное число примеров, описывающих поведение моделируемой системы в прошлом. Основанная на нейросетях технология не предъявляет повышенных требований к точности входных данных, как на этапе самообучения, так и при их применении. Примером может служить распознавание симптомов приближения критических ситуаций для краткосрочных, а иногда и долгосрочных прогнозов.
Таким образом, нейросетевая технология обладает двумя следующими необходимыми свойствами:
• способностью обучаться на конкретном множестве примеров;
• умением стабильно распознавать и прогнозировать новые ситуации с высокой степенью точности даже в условиях внешних помех, например при появлении противоречивых или неполных значений в потоках информации.
Создание нейросетевой технологии имеет свои этапы:
1) формулировка задачи — один из принципиальных моментов разработки технологии. На этом этапе необходимо четко определить, что пользователь хочет увидеть в качестве результата нейросетевой технологии. Это могут быть функция доходности ценных бумаг, доминирующие факторы развития рынка определенной номенклатуры товаров, результаты ревизии портфеля инвестиционных проектов фирмы и др.;
2) определение и подготовка исходных данных — отбор источников информации, которые наиболее точно и полно описывают процесс решения задачи. Для этого привлекаются специалисты, хорошо знающие ПрО задачи и имеющие достаточный опыт ее решения. При этом необходимо соблюдать равновесие между стремлением увеличить количество исходных параметров и вероятностью получить плохо обучаемую сеть, которая будет производить неправильные прогнозы;
3) физический ввод данных в систему, подготовка файлов для тренировки и тестирования системы — формирование того состава ситуаций, который поможет аналитику-пользователю при решении задач, и распределение исходных данных по этим ситуациям. Здесь очень важно выделить степень влияния того или иного параметра на прогнозируемую величину это соответствие выясняется в виде процедуры «если..., то..., иначе...»;
4) обучение нейросетевой технологии. Система может быть настроена на решение разных задач, в частности на прогнозирование временных рядов. Эти ряды могут быть применены для описания финансовых рынков. Средством решения задачи часто становится так называемый генетический алгоритм. В реализации задач автоматической классификации и распознавания образов могут быть применены технологии. Принципиальная трудность состоит в настройке нейросети на обучающую выборку данных. При настройке следует определить оптимальное число параметров, свойств изучаемых данных, рациональное число соотношения дней ретроспективы и прогноза;
5) тестирование нейросети и ее запуск для получения пробного прогноза. Адекватность обученных нейросетей определяется по тестовой выборке данных. По результатам тестирования выбирается наиболее подходящий состав вариантов. Критерием отбора служит точность и надежность прогноза. В случае неудовлетворительных результатов тестирования еще раз анализируется набор входных данных, корректируются некоторые обучающие программы или переопределяется сеть.
В бар зашли три зэка и заказали: гроб с костями, многоэтажку и то что мы строили. Официант им все принес и говорит: вот вам гроб с костями и многоэтажка. А то что вы строили – нет. Есть только то где вы были. Что заказали зэки?