Эксперт
Сергей
Сергей
Задать вопрос
Мы готовы помочь Вам.
  1. Жизненный Цикл Информационной Системы

ЖЦ  — это непрерывный процесс, который начинается с момента принятия решения о необходимости создания ИС и заканчивается в момент его полного изъятия из эксплуатации. Основным нормативным документом, регламентирующим ЖЦ является международный стандарт ISO/IEC 12207.Он определяет структуру ЖЦ, содержащую процессы, действия и задачи, которые должны быть выполнены во время создания ПО. Структура состоит из трех  процессов: основные (приобретение, поставка, разработка, эксплуатация, сопровождение); вспомогательные, обеспечивающие выполнение основных процессов (документирование, управление конфигурацией, обеспечение качества, верификация, аттестация, оценка, аудит, решение проблем); организационные (управление проектами, создание инфраструктуры проекта, определение, оценка и улучшение самого ЖЦ, обучение). Этапы ЖЦ: анализ, проектирование, реализация, внедрение, сопровождение. Модель ЖЦ – структ, определ послед-ть действий и задач выполняем на протяжении ЖЦ.

Основные модели ЖЦ: каскадная и спиральная. Характерной чертой КМ является разбиение всей разработки на этапы, причем переход с одного этапа на след происходит только после того, как будет полностью завершена работа на текущем. Каждый этап завершается выпуском полного комплекта документации, достаточной для того, чтобы разработка могла быть продолжена другой командой разработчиков. Выполняемые в логичной последовательности этапы работ позволяют планировать сроки завершения всех работ и соответствующие затраты. 

 

Каскадная модель ЖЦ проекта разработки ИС

 

 

Итерационная модель ЖЦ проекта разработки ИС

 

«+»: полный набор документов, подготовленных по всем правилам, можно планировать сроки завершен работы, а также планировать затраты «-»: ни одна разработка не укладывается в эту схему, т.к. любой процесс разраб – итерац процесс (должно быть можно вернуться на любой этап)

Спиральная модель ЖЦ делает упор на начальные этапы ЖЦ: анализ и проектирование. На этих этапах реализуемость технич решений проверяется путем создания прототипов. Каждый виток спирали соответствует созданию фрагмента или версии ПО, на нем уточняются цели и характеристики проекта, определяется его качество и планируются работы следующего витка спирали. Таким образом углубляются и последовательно конкретизируются детали проекта и в результате выбирается обоснованный вариант, который доводится до реализации. 

  1. Понятие канонического проектирования информационных систем.

Каноническое проектирование ИС отражает особенности ручной технологии индивидуального (оригинального) проектирования, осуществляемого на уровне исполнителей без использования каких-либо инструментальных средств, позволяющих интегрировать выполнение элементарных операций. 

Организация канонического проектирования ИС ориентирована на использование главным образом каскадной модели жизненного цикла ИС. Стадии и этапы работы описаны в стандарте ГОСТ 34.601-90.

В зависимости от сложности объекта автоматизации и набора задач, требующих решения при создании конкретной ИС, стадии и этапы работ могут иметь различную трудоемкость. Допускается объединять последовательные этапы и даже исключать некоторые из них на любой стадии проекта. Допускается также начинать выполнение работ следующей стадии до окончания предыдущей.

Стадии и этапы создания ИС, выполняемые организациями-участниками, прописываются в договорах и технических заданиях на выполнение работ:

Стадия 1. Формирование требований к ИС.

На начальной стадии проектирования выделяют следующие этапы работ:

  • обследование объекта и обоснование необходимости создания ИС; 
  • формирование требований пользователей к ИС; 
  • оформление отчета о выполненной работе и тактико-технического задания на разработку.

Стадия 2. Разработка концепции ИС.

  • изучение объекта автоматизации; 
  • проведение необходимых научно-исследовательских работ; 
  • разработка вариантов концепции ИС, удовлетворяющих требованиям пользователей; 
  • оформление отчета и утверждение концепции.

Стадия 3. Техническое задание.

  • разработка и утверждение технического задания на создание ИС.

Стадия 4. Эскизный проект.

  • разработка предварительных проектных решений по системе и ее частям; 
  • разработка эскизной документации на ИС и ее части.

Стадия 5. Технический проект.

  • разработка проектных решений по системе и ее частям; 
  • разработка документации на ИС и ее части; 
  • разработка и оформление документации на поставку комплектующих изделий; 
  1. Основной состав работ и документы  предпроектного этапа проектирования информационных систем.

ГОСТ 34.601-90

Стадии

Этапы работ

1.Формирование требований к АС

1.1.Обследование объекта и обоснование необходимости создания АС.
1.2.Формирование требований пользователя к АС.
1.3.Оформление отчёта о выполненной работе и заявки на разработку АС (тактико-технического задания)

2.Разработка концепции АС

2.1.Изучение объекта.
2.2.Проведение необходимых научно-исследовательских работ.
2.3.Разработка вариантов концепции АС, удовлетворяющего требованиям пользователя.
2.4. Оформление отчёта о выполненной работе.

3.Техническое задание

3.1.Разработка и утверждение технического задания на создание АС.

1. На этапе 1.1. «Обследование объекта и обоснование необходимости создания в АС» общем случае проводят:

а) сбор данных об объекте автоматизации и осуществляемых видах деятельности;
б) оценку качества функционирования объекта и осуществляемых видах деятельности, выявление проблем, решение которых возможно средствами автоматизации;
в) оценку (технико-экономической, социальной и т.д.) целесообразности создания АС.

2. На этапе 1.2. «Формирование требований пользователя к АС» проводят:

а) подготовку исходных данных для формирования требований АС (характеристика объекта автоматизации, описание требований к системе, ограничения допустимых затрат на разработку, ввод в действие и эксплуатацию, эффект, ожидаемый от системы, условия создания и функционирования системы);
б) формулировку и оформление требований пользователя к АС.

3. На этапе 1.3. «Оформление отчёта о выполненной работе и заявки на разработку АС (технико-технического задания)» проводят оформление отчета о выполненных работах на данной стадии и оформление заявки на разработку АС (тактико-технического задания) или другого заменяющего её документа с аналогичным содержанием.

4. На этапах 2.1. «Изучение объекта» и 2.2. «Проведение научно-исследовательских работ» организация-разработчик проводит детальное изучение объекта автоматизации и необходимые научно-исследовательские работы (НИР), связанные с поиском путей и оценкой возможности реализации требований пользователя, оформляют и утверждают отчёты о НИР.

5. На этапе 2.3. «Разработка вариантов концепции АС и выбор варианта концепции АС, удовлетворяющего требованиям пользователя» в общем случае, проводят разработку альтернативных вариантов концепции создаваемой АС и планов их реализации; оценку необходимых ресурсов на их реализацию и обеспечение функционирования; оценку преимуществ и недостатков каждого варианта; определение порядка оценки качества и условий приёмки системы; оценку эффектов, получаемых от системы.

6. На этапе 2.4. «Оформление отчёта о выполненной работе» подготавливают и оформляют отчет, содержащий описание выполненных работ на стадии описания и обоснования предлагаемого варианта концепции системы.

7. На этапе 3.1. «Разработка и утверждение технического задания на создание АС» проводят разработку, оформление, согласование и утверждение технического задания на АС и, при необходимости, технических заданий на части АС.

  1. Использование CASE-технологий в проектировании информационных систем

CASE(Computer Aided Software\System Enggineering)-средства-любое програмное ср-во автом-е некоторую сов-ть процессов ЖЦ. CASE-технологии бывают 2 видов: структурные и объектно-ориентиров-е, использующие диаграммы или тексты для описания внешних требований, связей между моделями системы, динамики поведения системы и архитектуры программных средств. Сущ интегрированные  CASE технол (покрывающие весь ЖЦ).

Классификация:

 по категориям(опред степень интегрир-ти) 

1.отдельные лок-е ср-ва, решающие автоном-е задачи (BPwin) 

2.частично интегририрующие ср-ва, охватывающие больш-во этапов ЖЦ (Bpwin +ERwin).

3.полность интегр-е, поддерживающие весь ЖЦ(ERwin).; 

по типам совпадает с компонентным составом CASE-ср-в:

1.ср-ва анализа(предназнач для построения модели предметной области(BPwin)).

2.ср-ва анализа и проэкт-я(Rational Rose).

3.ср-ва проэкт-я БД, обеспеч моделир-е данных и генерацию схем БД(ERwin, Rational Rose).

4.ср-ва разработки прилож-й(delphi, 1C, MS Visual Studio (C, VB, C#), Zend Studio (PHP)).

5.ср-ва конфигурирования предметной области (1С).

6.ср-ва реинж-а(ср-ва анализа предметной области (ExtendLT, AnyLogic))

Вспомагат-е типы:

ср-ва тестирования, документир-я, планир-я и упр-я проекта(MS Project, Project Expert). 

Успешное внедрение CASE-технологий должно обеспечить выгоды : 

— высокий уровень тех-й  поддержки процессов разработки и сопровождения ПО;

— соблюдение стандартов , документирование;

— успешность внедрения разработкиформирование и актулизация банка типовых моделей основных бизнес-процессов.

  • разработка заданий на проектирование в смежных частях проекта.

Стадия 6. Рабочая документация.

  • разработка рабочей документации на ИС и ее части; 
  • разработка и адаптация программ.

Стадия 7. Ввод в действие.

  • подготовка объекта автоматизации; 
  • подготовка персонала; 
  • комплектация ИС поставляемыми изделиями (программными и техническими средствами, программно-техническими комплексами, информационными изделиями); 
  • строительно-монтажные работы; 
  • пусконаладочные работы; 
  • проведение предварительных испытаний; 
  • проведение опытной эксплуатации; 
  • проведение приемочных испытаний.

Стадия 8. Сопровождение ИС.

  • выполнение работ в соответствии с гарантийными обязательствами; 
  • послегарантийное обслуживание.

Неполное завершение работ на каждом этапе позволяет переходить на следующий этап, не дожидаясь полного завершения работы на текущем. Главная задача — как можно быстрее показать пользователям системы работоспособный продукт, тем самым активизируя процесс уточнения и дополнения требований. Осн проблема спирального цикла — определение момента перехода на следующий этап. Для ее решения необходимо ввести временные ограничения на каждый из этапов жизненного цикла. Переход осуществляется в соотв с планом, даже если не вся запланированная работа закончена. План составляется на основе статистических данных, полученных в предыдущих проектах, и личного опыта разработчиков.

 

Спиральная модель ЖЦ проекта разработки ИС

«+»: наиболее реально отраж разраб ПО, включ шаг сист подхода в итерац структуре разраб-ки, оценка риска «-»: повышен требования к заказчику, трудность контроля и управл временем разраб-ки

Итерац модель- возможен переход на предыдущ этап, также, как и  каск модели хорошо ложится на структ подход

5. Понятие информационных систем. Специфика и задачи информационных систем.

ИС — взаимосвязанная совокупность средств, методов и персонала, используемая для сохранения, обработки и выдачи информации с целью решения конкретной задачи.  Подавляющее большинство ИС работает в режиме диалога с пользователем. Типичные программные компоненты ИС включают: 

  • диалоговую подсистему ввода-вывода, 
  • подсистему, которая реализует логику диалога, 
  • подсистему прикла-дной логики обработки данных, 
  • подсистему логики управ-ления данными. 

Можно выделить два свойства, которые являются общими для всех ИС. 

Во-первых, любая информационная система предназначена для сбора, хранения и обработки информации. Поэтому в основе любой ИС лежит среда хранения и доступа к данным.

 Во-вторых, информационные системы ориентируются на конечного пользователя. Должны обеспечивать простоту взаимодействия пользователя и прикладного интерфейса 

Классификации информационных систем:

  1. Классификация по архитектуре

По степени распределённости отличают:

настольные (desktop), или локальные ИС, в которых все компоненты (БДСУБД, клиентские приложения) находятся на одном компьютере;

распределённые (distributed) ИС, в которых компоненты распределены по нескольким компьютерам.

Распределённые ИС, в свою очередь, разделяют на:

В файл-серверных ИС база данных находится на файловом сервере, а СУБД и клиентские приложения находятся на рабочих станциях.

В клиент-серверных ИС база данных и СУБД находятся на сервере, а на рабочих станциях находятся клиентские приложения.

В свою очередь, клиент-серверные ИС разделяют на двухзвенные и многозвенные.

В двухзвенных (англ. two-tier) ИС всего два типа «звеньев»: сервер баз данных, на котором находятся БД и СУБД (back-end), и рабочие станции, на которых находятся клиентские приложения (front-end). Клиентские приложения обращаются к СУБД напрямую.

В многозвенных (англ. multi-tier) ИС добавляются промежуточные «звенья»: серверы приложений (application servers). Пользовательские клиентские приложения не обращаются к СУБД напрямую, они взаимодействуют с промежуточными звеньями. Типичный пример применения многозвенности — современные веб-приложения, использующие базы данных. В таких приложениях помимо звена СУБД и клиентского звена, выполняющегося в веб-браузере, имеется как минимум одно промежуточное звено — веб-сервер с соответствующим серверным ПО.

  1. Классификация по степени автоматизации
  • автоматизированные: информационные системы, в которых автоматизация может быть неполной (то есть требуется постоянное вмешательство персонала);
  • автоматические: информационные системы, в которых автоматизация является полной, то есть вмешательство персонала не требуется или требуется только эпизодически.

«Ручные ИС» («без компьютера») существовать не могут, поскольку существующие определения предписывают обязательное наличие в составе ИС аппаратно-программных средств. Вследствие этого понятия «автоматизированная информационная система», «компьютерная информационная система» и просто «информационная система» являются синонимами[4].

  1. Классификация по характеру обработки данных
  • информационно-справочные, или информационно-поисковые ИС, в которых нет сложных алгоритмов обработки данных, а целью системы является поиск и выдача информации в удобном виде;
  1. Способы оценки информационных угроз предприятию.

Угроза безоп-ти инф-ии- потенциально возможное событие, процесс или явление, кот могут привести к уничтож, утрате целост-ти, конфиденц-ти или доступ-ти инф-ии. 

Все угрозы разделены на 2 класса: 

  • случайные (стих бедствия и аварии, сбои и отказы тех ср-в, алгоритмич и программные ошибки)
  • преднамеренные (шпионаж и диверсии, НД к инф-и, вредительские программы).

Злоумышл может быть: 

  • разработчик КС(владеет наиболее полной инф-ей о прогр и аппаратн ср-х КС и имеет возм-ть внедр «закладок» на этапах создания и модерниз систем. Но он, как правило, не получает непосред-го доступа на эксплуатир объекты КС);
  • сотрудник из числа обслуж персонала; 
  • польз-ль(имеет общее представл-е о стр-ах КС, о работе механизмов защиты инф-ии. Он может осущ-ять сбор данных о системе защиты инф-ии методами шпионажа и предпринимать попытки НСД к инф-ии. Возможности внедрения «закладок» пользователями очень ограничены.); 
  • постороннее лицо(не имеет отношения к КС, в его распоряж имеются дистанц-ые методы шпионажа и возм-ть диверсионной деят-ти. Он может осущ-ть вредит-ие воздействия с использ-ем электромагн излучений и наводок, а также каналов связи). 

Можно распред-ть должностных лиц КС по группам риска:

  1. Наибольший: 
  • системный контролер; 
  • администратор безопасности. 
  1. Повышенный: 
  • оператор системы;  
  • менеджер обработки; 
  • системный программист. 
  1. Средний: 
  • инженер системы; 
  • менеджер ПО. 
  1. Ограниченный: 
  • прикладной программист; 
  • администратор баз данных; 
  • библиотекарь системных магнитных носителей; 
  • инженер по оборудованию; 
  1. Низкий: 
  • инженер по периферийному оборудованию; 
  • библиотекарь магнитных носителей пользователей. 

Подобная стр-ра распред-я персонала по степени риска должна служить основой  в  организации дифференц-го  разграничения  доступа пользователей к инф-ии и средствам КС.

                  

Способы оценки угроз предприятию:

  1. экспертн оценка (ставить оц опред угрозам) 
  2. исп-е матричн набора данных (ответы да/нет на опред вопросы, что позвол оценить угрозы). 

Программы: 

  1. CRAMM- бритнаск ,2 вар, 400 вопросов?формир матрица?опред риски? опред ущерб 

«-» заруб: дорогостоящ 21 тыс$, на англ яз.

  1. ГРИФ и КОНДОР-отеч , оценив риски, ранжир угрозы  

 наши в переделах 1тыс$, работают в более гибком варианте

  1. Компьютерные вирусы и способы борьбы с ними.

Вирус — это специально написанная небольшая по размерам программа, которая может «приписывать» себя  к другим  программ-мам (т.е. «заражать» их), а  также  выполнять различные  нежелательные действия  на компьютере. Собственно вирусы (worm) – сами по себе, распространяются с другими программами.Троянские делятся:back – door – получают доступ на компьютер не замеченными; для кражи кодов и паролей; нарушение в компьютерах; разрушение данных.  

Классификация компьютерных вирусов.

  • В настоящее время в мире насчитывается более 150 тысяч только зарегистрированных компьютерных вирусов. Все компьютерные вирусы могут быть классифицированы 

Средой обитания сетевых вирусов являются элементы компьютерных сетей. Файловые вирусы размещаются в исполняемых файлах. Загрузочные вирусы находятся в загрузочных секторах (областях) внешних запоминающих устройств (boot-секторах). Иногда загрузочные вирусы называют бутовыми. Комбинированные вирусы размещаются в нескольких средах обитания. Примером таких вирусов служат загрузочно-файловые вирусы. Эти вирусы могут размещаться как в загрузочных секторах накопителей на магнитных дисках, так и в теле загрузочных файлов.

Методы и средства борьбы с вирусами.

Массовое распространение вирусов, серьезность последствий их воздействия на ресурсы КС вызвали необходимость разработки и использования специальных антивирусных средств и методов их применения. Антивирусные средства применяются для решения следующих задач:

* обнаружение вирусов в КС;

* блокирование работы программ-вирусов;

* устранение последствий воздействия вирусов.

Самым надежным методом защиты от вирусов является использование аппаратно-программных антивирусных средств.

-ДЕТЕКТОРЫ позволяют обнаруживать файлы, зараженные одним из нескольких известных вирусов. Эти программы проверяют, имеется ли в файлах на указанном пользователем диске специфическая для данного вируса комбинация байтов.  При ее обнаружении в каком-либо файле на экран выводится соответствующее  сообщение. ПРОГРАММЫ-РЕВИЗОРЫ, ДОКТОРА-РЕВИЗОРЫ — программы, которые не только обнаруживают изменения в файлах и системных областях дисков, но и могут в случае изменений автоматически вернуть их в исходное состояние.   ПРОГРАММЫ-ФИЛЬТРЫ,. ПРОГРАММЫ-ВАКЦИНЫ, или  ИММУНИЗАТОРЫ,

  1. Обнаружение и нейтрализация несанкц доступа к информационным ресурсам.

Несанкционированный доступ — чтение, обновление или разрушение инф-ии при отсутствии на это соотв-их полномочий.Утечка через непосредственный доступ к ПК 

Устранение:

• безопасное размещение критических ресурсов;

• архивир-е с паролем особо важных док-ов;

• автоматическая блокировка ПК при отсутствии владельца.

Сущ и более кардинальные решения, например физич запирание дисковода, отключение порта USB для предотвращения съема инф-ии с помощью USB накопителей, установка персональных ключей идентификации.  

Утечка через локальную сеть.НД  к инф-ии через лок сеть может произойти по неск причинам: 

1владелец ПК дает в общесетевой доступ необоснованно широкий диапазон ресурсов. Очень часто приходится наблюдать в доступе весь диск. 

2заражение вирусом типа «Троянский конь», позволяющим его владельцу удаленно управлять зараженным ПК. 

3слишком простые пароли и использование имен пользователей по умолчанию, например «Администратор». 

Устранение:

• обоснованное предоставление ресурсов владельца ПК;

• своевременное обновление антивир-го пакета;

• грамотная парольная политика и конфигурация сервисов удаленного доступа.

Утечка при передаче инф-ии.Имея доступ к кабелю сети предприятия, злоум-к может прослушивать трафик. То же самое он может сделать и программным путем, установив на один из компьютеров программу-сниффер, кот перехватывает трафик подсети. В результ прослушивания злоумышленник может получить пароли.

Устранение:

• экранирование трафикового кабеля для защиты от прослушивания на физич уровне;

• использование шифрования протоколов (SSL, SSH);

• защищенная конфигурация сетевых ресурсов и коммутационного оборуд-я. 

Утечка информации, хранящейся на сервере.Инф-ию, хранящуюся на сервере, необходимо защищать от несанкц-го доступа как внутр польз-й, так и польз-й Интернет. 

С первой задачей справляются средствами администрирования ОС, под управлением которой находится сервер. Вторую решают с помощью брандмауэров. Брандмауэр заставляет все сетевые соединения проходить через шлюз, где они могут быть проанализированы и оценены с точки зрения безопасности, и предоставляет др средства, такие как меры усиленной аутентификации вместо паролей. Кроме того, он может ограничить доступ к тем или иным системам или доступ к Интернету от них, блокировать определенные сервисы TCP/IP или обеспечить другие меры безопасности. Стандартными средствами защиты инф-ии на сервере явл своевременное обновление антивирусного пакета и своевременное резервирование.

Устранение:

• защищенная конфигурация сетевых ресурсов, коммутационного оборудования и сервисов удаленного доступа; 

• грамотная парольная политика; 

• разработка процедур управления, резервирования;

• антивирусная защита;

• использование межсетевого экрана, брандмауэра (firewall).Описанные решения можно разделить на три группы:

• организационные мероприятия; 

• программные средства; 

• аппаратные средства. 

Сущ. способы разгранич: 

1. мандатный —  в соответствии с должн имеют право работать с определ ресурсами, с опред программами (ни больше, ни меньше) 

2. матричн – сложнее. есть матр (Объекты-файлы, прогр; Объекты — Люди)

  1. Классификация по сфере применения

Поскольку ИС создаются для удовлетворения информационных потребностей в рамках конкретной предметной области, то каждой предметной области (сфере применения) соответствует свой тип ИС. Перечислять все эти типы не имеет смысла, так как количество предметных областей велико, но можно указать в качестве примера следующие типы ИС:

  1. Классификация по охвату задач (масштабности)
  • Персональная ИС предназначена для решения некоторого круга задач одного человека.
  • Групповая ИС ориентирована на коллективное использование информации членами рабочей группы или подразделения.
  • Корпоративная ИС в идеале охватывает все информационные процессы целого предприятия, достигая их полной согласованности, безызбыточности и прозрачности. Такие системы иногда называют системами комплексной автоматизации предприятия.

Задачи, решаемые ИС: 

Специализированная обработка. Конкретные задачи, которые должны решаться ис, зависят от той прикладной области, для которой предназначена с-ма. Области применения и-ных приложений разнообразны: банковское дело, страхование, медицина, транспорт, образование и 

Хранение информации — уровень надежности и продолжительность хранения информации во многом определяются конкретными требова-ниями корпорации к ис. 

Традиционным методом организации информационных систем является двухзвенная архитектура клиент-сервер. В этом случае вся прикладная часть информационной системы выполняется на рабочих станциях (т. е. дублируется), а на стороне сервера(ов) осуществляется только доступ к базе данных.

 Еще один класс задач относится к обеспечению удобного и соответствующего целям ИС пользовательского интерфейса. Более или менее просто выяснить функциональные компоненты интерфейса, например, какого вида должны предлагаться формы и какого вида должны выдаваться отчеты.

9. Понятие цифровой подписи. Способы криптографической защиты информационных массивов и организация цифровой подписи.

Под КЗИ понимается преобразование исходной инф-и, в результате кот она становится недоступной для ознакомления и использования лицами, не имеющими на это полномочий. По виду воздействия на исходную инф-ю методы крипт-го преобр-я инф-и разделены на четыре группы: шифрование, стенография, кодирование и сжатие. 

Осн видом крипт-го преобр-я инф-и в КС явл шифр-е- процесс преобр-я открытой инф-и в зашифр-ю инф-ю (зашиф-ие) или процесс обратного преобр-я зашиф-й инф-и в открытую(расшиф-ие). Метод шифр-я (шифром)-сов-ть обратимых преобр-й открытой инф-и в закрытую в соответствии с алгоритмом шифр-я. Атака на шифр (криптоанализ) — это процесс расшифр-я закрытой инф-и без знания ключа и при отсутствии сведений об алгоритме шифр-я. Современные методы шифр-я должны отвечать след требованиям: стойкость шифра противостоять криптоан-у, криптостойкость должна быть такой, чтобы вскрытие его могло быть осущ-но только путем решения задачи полного перебора ключей; шифртекст не должен существенно превосходить по объему исходную инфо-ю; ошибки, возникающие при шифр-и, не должны приводить к искажениям и потерям инф-и; время шифр-я не должно быть большим; стоимость шифрования должна быть согласована со стоимостью закрываемой инф-и.Если алгоритм не  имеет скрытых слабых мест, то криптостойкость шифра опред-ся длиной ключа, т.к. единственный путь вскрытия зашифр-й инф-и — перебор комбинаций ключа и выполнение алгоритма расшифр-я. Таким образом, время и средства, затрачиваемые на криптоанализ, зависят от длины ключа и сложности алгоритма шифр-я.Алгоритм Гос стандарта РФ по ЭЦП (полное название Процессы формирования и проверки ЭЦП) является переложением схемы Эль Гамаль в область эллиптических кривых. Невозможность подделки ЭЦП опирается на большой обьем математических вычислений. ЭЦП зависит от текста док-та, требующего заверения , секретного и не секретного ключа . Преобразование , используемое для выработки подписи является криптографической функцией от указанных величин.

переделать

  1. Процесс унификации, стандартизации и сертификации в сфере информатизации.

Понятие унифицированной системы документации

Основной компонентой внемашинного информационного обеспечения ИС является система документации, применяемая в процессе управления экономическим объектом. Под документом понимается определенная совокупность сведений, используемая при решении технико-экономических задач, расположенная на материальном носителе в соответствии с установленной формой.

Система документации — это совокупность взаимосвязанных форм документов, регулярно используемых в процессе управления экономическим объектом. Отличительной особенностью системы экономической документации является большое разнообразие видов документов.

Существующие системы документации, характерные для неавтоматизированных ИС, отличаются большим количеством разных типов форм документов, большим объемом потоков документов и их запутанностью, дублированием информации в документах и работ по их обработке и, как следствие, низкой достоверностью получаемых результатов. Для того чтобы упростить систему документации, используют следующие два подхода:

  • проведение унификации и стандартизации документов; 
  • введение безбумажной технологии, основанной на использовании электронных документов и новых информационных технологий их обработки.

Унификация документов выполняется путем введения единых форм документов. Таким образом, вводится единообразие в наименования показателей, единиц измерения и терминов, в результате чего получается унифицированная система документации.

Унифицированная система документации (УСД) — это рационально организованный комплекс взаимосвязанных документов, который отвечает единым правилам и требованиям и содержит информацию, необходимую для управления некоторым экономическим объектом. По уровням управления, они делятся на межотраслевые системы документации, отраслевые и системы документации локального уровня, т. е. обязательные для использования в рамках предприятий или организаций.

Любой тип УСД должен удовлетворять следующим требованиям:

  • документы, входящие в состав УСД, должны разрабатываться с учетом их использования в системе взаимосвязанных ЭИС; 
  • УСД должна содержать полную информацию, необходимую для оптимального управления тем объектом, для которого разрабатывается эта система; 
  • УСД должна быть ориентирована на использование средств вычислительной техники для сбора, обработки и передачи информации; 
  • УСД должна обеспечить информационную совместимость ЭИС различных уровней; 
  • все документы, входящие в состав разрабатываемой УСД, и все реквизиты-признаки в них должны быть закодированы с использованием международных, общесистемных или локальных классификаторов.
  1. Проектирование баз данных с использованием CASE-технологии.

Система базы данных является фундаментальным компонентом более широкого понятия — информационной системы организации. Следовательно, жизненный цикл приложений баз данных неразрывно связан с жизненным циклом информационной системы.

Проектирование базы данных – этап ЖЦ приложения БД. Полный цикл этапа проектирования включает концептуальное, логическое и физическое проектирование базы данных.

Проектирование базы данных процесс создания проекта базы данных, предназначенной для поддержки функционирования предприятия и способствующей достижению его целей.

Основными целями проектирования базы данных являются:

• представление данных и связей между ними, необходимых для всех основных областей применения данного приложения и любых существующих групп его пользователей;

• создание модели данных, способной поддерживать выполнение любых требуемых транзакций обработки данных;

• разработка предварительного варианта проекта, структура которого позволяет удовлетворить все основные требования» предъявляемые к производительности системы — например, ко времени реакции системы.

Концептуальное проектирование базы данных — процесс создания модели используемой на предприятии информации, не зависящей от любых физических аспектов ее представления.

Логическое проектирование базы данных  процесс создания модели используемой на предприятии информации с учетом выбранной модели организации данных, но независимо от типа целевой СУБД и других физических аспектов реализации.

Физическое проектирование базы данных — процесс создания описания реализации базы данных на вторичных запоминающих устройствах с указанием структур хранения и методов доступа, используемых для организации эффективной обработки данных.

основной целью физического проектирования базы данных является описание способа физической реализации логического проекта базы данных. В случае реляционной модели данных под этим подразумевается следующее:

• создание набора реляционных таблиц и ограничений для них на основе информации, представленной в глобальной логической модели данных;

• определение конкретных структур хранения данных и методов доступа к ним, обеспечивающих оптимальную производительность системы с базой данных;

• разработка средств защиты создаваемой системы.

Case техн-системы автоматиз-и проектир-я ИС или ПО. Сущ структ-я(Bpwin ERwin) и объектная(Ration Rose). При проектир-и БД необх-о разработать концепт-ую(включ сущности(объекты) и связи между ними), логич, физич модель. Концептуальное и логическое моделирование  осуществляется на основе методов нормализации или построения модели «сущность-связь» (ERD-диаграмм). Для логич м-ли для каждой сущ-ти мы можем опред перечень атрибутов, кот характ-ют сущность. Для атрибутов задаются укрупненные типы(строковая, символьная). Реализация БД опред-ся на физич ур. На этом уровне: уточняются все идентиф-ры как табл так и атрибутов; уточн-ся типы переменных; выбирается конкретная СУБД(Oracl, Acsess). При проект-и с помощью объектно-ориент методах  необх-мо избавиться от множеств-го наследия(путем введения доп классов). При структ методе при переходе от логич к физич модели надо избавиться от множесв-го соединения(многие ко многим). Физич м-ль явл основой для описания БД. Case ср-ва позволяют проводить инжен-г БД т.е. получать описание БД. Если проводятся изменения в СУБД, то для обеспеч синхрониз-и модели и БД Case ср-ва позволяют провести реинж-г, т.е. синхр-ию БД и модели

  1. Имитационное моделирование информационных систем.

Основные понятия языка GPSS.«Имитац моделир»означ, мы имеем дело с такими моделями, с пом кот рез-т моделир заранее нельзя предсказать => необх провести эксперимент с моделью и по его результ судить о повед объекта моделир. Имитац модели (ИМ), явл подклассом мат моделей — имитация представл собой метод провед числ экспериментов (на комп) с мат моделями, описыв реальный объект. ИМ можно представить как «черный ящик»  X – вх парам, Y – вых парам, Z – внешн возд, A – внутр парам

Yi=Fi(x1,x2,…xn,z1,z2,…zn,a1,a2,…an) F – может быть случ ф-й, в этом случае проводят статистич эксперим с моделью(метод Монте Карло). СМО описывают широкий класс задач по обмену данными в ИС. СМО можно описать, если задать: вх поток, постановку в очередь и выход из нее, правила, по кот произв обслуж прибором, вых поток, режимы работы.

GPSS General Purpose Simulation System – для создания комп ИМ. Транзакт —  эл-т в СМО. Блок — обраб транзакты и передает их др блоку. Транзакт — спец структ данных.Блок — подпрогр, кот эти данные обрабат. Транзакты и блоки — объекты GPSS (+ еще объекты: перем, ф-и, очереди, табл). Кажд объект имеет определ набор св-в-стандартн числ атриб (СЧА). Например, длина очереди-свойство транзакта. Ввод транзактов в модель GENERATE [A], [B], [C], [D], [E]    A — ср знач интервала поступл транз B – 1/2 равномерно распредел интервала, относит А. Если B=0, то интервал времени поступл=A   С — момент врем появл 1-го транз D — ограничитель общего числа транз E — приоритет (число от 0 до 127) чем больше число, тем выше приоритет 

Удаление транзактов из модели (завершать)TERMINATE [A]  А – велич, на кот уменьш знач счетчика завершений — это ячейка памяти в кот хранится целое «+» число. Начальн знач счетчика завершений задается в начале моделир атрибутом А в команде START А

Задача о парикмахерской (фиксир число обслуж клиентов)

START 50 ;счетчик завершений = число клиентов

GENERATE 20, 5 ;приход клиента

QUEUE barberqueue ;клиент встал в очередь

SEIZE barber ;начало обслуживания клиента

DEPART barberqueue ;выход из очереди

ADVANCE 18, 6 ;обслуживание клиента

RELEASE barber ;окончание обслуживания клиента 

TERMINATE 1 ;уход клиента из парикмахерской

Задача о парикмахерской (фиксир время обслуж)

GENERATE 20, 5 ;приход клиента

QUEUE barberqueue ;клиент встал в очередь

SEIZE barber ;начало обслуживания клиента

DEPART barberqueue ;выход из очереди

ADVANCE 18, 6 ;обслуживание клиента

RELEASE barber ;окончание обслуживания клиента 

TERMINATE 0 ;уход клиента из парикмахерской

GENERATE 480 ;начало отсчета времени

TERMINATE 1 ;завершение работы модели

Передача управленияTRANSFER A,B,C (передать)

1.Безусл переход TRANSFER ,B   B – метка блока на кот должен перейти транз 2.Статистич режим TRANSFER A,[B],C  A – вер-ть передачи транз в блок С, 1-А – вер-ть передачи транз в блок В, если В нет, то транз в  след после TRANSFER блок

TRANSFER 0.4, L1,L2 (ниже L1 и L2 как на рис)

Режим BOTH    TRANSFER BOTH,[B],C  Сначала транз пытается войти в В, если не удается, то пытается войти в С, при неудаче попытки повторяются при каждом очередном просмотре списка текущ событий  TRANSFER BOTH, L1,L2 (ниже L1 и L2 как на рис)

Моделир многокан устр-в (МКУ)  

Блоки: (войти) ENTER А,[B] (выйти) LEAVE А,[B]   А – имя МКУ, В – кол-во занимаемых (освобождаемых устройств)  

Label STORAGE A (хранилище)  А – емкость МКУ, Label – метка МКУ

Пример: На одном станке 5 рабочих обрабатывают по очереди детали. Время обработки детали 20?2 мин. Промоделировать работу станка в течении 8 часов.

Функции в GPSS 

Дискретная числовая (D) необх задать коорд крайних правых точек отрезков Непрерывная числовая (C) необх задать коорд крайних всех точек, концов отрезков. Табличная числовая (L) Дискретная атрибутивная (E) Табличная атрибутивная (M)

Проектирование унифицированной системы документации ИС

При разработке системы документации в ЭИС проектировщик должен решать следующие проблемы: спроектировать и унифицировать новые документы; отобрать документы, которые будут использоваться в ЭИС без изменений; выявить в существующей системе те документы, которые надо унифицировать.

В процессе проектирования можно выделить три этапа работ:

  построение новых форм документов;

  унификация всей системы документации;

  разработка инструкций и методических материалов, регламентирующих работу пользователей с системой документации. Рассмотрим содержание работ, выполняемых на каждом этапе.

На первом этапе выполняются шесть работ. Содержание первой работы «Определение состава результатных показателей» зависит от того, какие формы документов проектируются. Выделяются первичные и результатные документы, состав которых выявляется после разработки всех постановок задач. При этом в первую очередь проектируются формы результатных документов, а затем первичных.

При выполнении второй работы «Определение состава первичных показателей» выявляется полный состав первичных — исходных показателей, на базе которых рассчитываются результатные показатели, отражаемые в формах результатных документов.

При выполнении третьей работы «Разбиение показателей по формам документов» определяется содержание форм результатных документов и форм первичных документов. Разбиение показателей по формам осуществляется по семантической близости показателей и по их алгоритмической увязке при расчете результатных показателей. Если проектировщик разрабатывает формы результатных документов, то критерий алгоритмической увязки показателей является главным. Например, обоснованным считается включение в один результатный документ «Ведомость отпуска товаров со склада за месяц» следующей группы показателей: «количество отпущенных товаров со склада по накладной», «цена товара», «стоимость отпущенных товаров по накладной», «итого стоимость отпущенных товаров по номенклатуре за месяц», «итого стоимость отпущенных товаров по каждому складу» и «по всем складам».

13. Компьютерные сети: устройство, назначение, виды.

Цель использования ком. сети

  • Обмен данными
  • Использование общих ресурсов

Глобальные сети объединяют территориально рассредоточенные компьютеры, которые могут находиться в различных городах и странах. Так как прокладка высококачественных линий связи на большие расстояния обходится очень дорого, в глобальных сетях часто используются уже существующие линии связи, изначально предназначенные совсем для других целей. Например, многие глобальные сети строятся на основе телефонных и телеграфных каналов общего назначения. 

Линия связи  состоит в общем случае из физической среды, по которой передаются электрические информационные сигналы, аппаратуры передачи данных и промежуточной аппаратуры. Синонимом термина линия связи (line) является термин канал связи(channel).

Физическая среда передачи данных (medium) может представлять собой кабель, то есть набор проводов, изоляционных и защитных оболочек и соединительных разъемов, а также земную атмосферу или космическое пространство, через которые распространяются электромагнитные волны.

В зависимости от среды передачи данных линии связи разделяются на следующие 

  • проводные (воздушные); представляют собой провода без каких-либо изолирующих или экранирующих оплеток, проложенные между столбами и висящие в воздухе. Сегодня проводные линии связи быстро вытесняются кабельными
  • кабельные (медные и волоконно-оптические) состоит из проводников, заключенных в несколько слоев изоляции: электрической, электромагнитной, механической, а также, возможно, климатической. Кроме того, кабель может быть оснащен разъемами, позволяющими быстро выполнять присоединение к нему различного оборудования
  • радиоканалы наземной и спутниковой связи.

В компьютерных сетях применяются три основных типа кабеля: 

  • кабели на основе скрученных пар медных проводов, 
  • коаксиальные кабели с медной жилой, 
  • волоконно-оптические кабели.

Сети делятся:

  • Локальные
  • Глобальные

Состав частей глоб. сети яв.

  • Коммутаторы пакетов
  • Маршрутизаторы
  • Линии связи

Сообщения передаются  по сети разбившись на пакеты: X.25, ISDN

Лок. сети имеют разную топологию

  • Шина
  • Петля (есть выделенный сервер)
  • Кольцо (нет выделенного сервера)
  • Звезда

На конечном этапе все пакеты собираются воедино.

  1. Модель построения компьютерной сети OSI. Протокол TCP/IP. Адресация в компьютерной сети.

В настоящее время взаимодействие в компьютерных сетях описывается с помощью модели взаимодействия открытых систем OSI). Модель была разработана  в Международной Организацией по Стандартизации (International Standard Organization, ISO) в 1984 году и представляет собой международный стандарт для проектирования сетевых коммуникаций. Модель OSI предполагает уровневый подход к построению сетей. Каждый уровень модели обслуживает различные этапы процесса взаимодействия.. 

Модель OSI разделяет сетевые функции на несколько уровней. 

 Уровень приложений — на этом уровне работают приложения, с которыми имеет дело пользователь Lotus 1-2-3 или Edit 

Уровень представления — является трансляция из одного формата данных в другие, сжатие данных и их шифровка. Этот уровень включает функции DOS и сетевой ОС. 

Сеансовый уровень — организует диалог между процессами на разных машинах, управляет этим диалогом и прерывает его по окончании.Транспортный. Сетевой.Уровень канала данных.  Физический. Как известно, история Internet началась с создания в 1969 году в Калифорнийском университете проекта сети ARPAnet. К началу   80-х к ARPAnet были подключены первые локальные сети и для работы был принят набор протоколов Transmission Сontrol Protocol/Internet Protocol (TCP/IP). Это и послужило началом его широкого распространения. Существует несколько причин, по которым TCP/IP были выбраны за основу сети Internet. Это, прежде всего, возможность работы с этими протоколами, как в локальных, так и в глобальных сетях, способность протоколов управлять большим количеством стационарных и мобильных пользователей, удобство  использования людьми и многие другие. 

В состав TCP/IP входят UDP, ARP, ICMP, TELNET, FTP и другие. Но поскольку TCP и IP  — наиболее известные протоколы данного комплекса, то часто, ссылаясь на данный набор протоколов используют термин ТCP/IP. 

TCP/IP  — это семейство протоколов. Вообще же семейство протоколов TCP/IP имеет 4 ярко выраженных уровня:

Краткая характеристика уровней.

 Уровень сопряжения с физической средой — Этот уровень решает задачи физической адресации, линейной дисциплины (каким образом использовать канал), уведомления о неисправностях и т.д. В семействе TCP/IP нет протоколов,  принадлежащих этому уровню ( за счет этого и достигается аппаратная независимость семейства), однако в состав семейства входят протоколы ARP и  RARP, обеспечивающие взаимодействие между этим и следующим  — сетевым уровнем. 

Сетевой уровень – обеспечивает маршрутизацию  пакетов от одного удаленного  узла другому. К этому уровню относится межсетевой протокол IP  — который и обеспечивает  доставку пакета по месту назначения (маршрутизацию), фрагментацию  и сборку поступивших пакетов на хосте получателя Транспортный уровень – предоставляет услуги по транспортировке данных.  Прикладной уровень 

Адресация в IP сетях.Интернет в целом и, в частности, Всемирная Паутина имеют стройную систему адресации, обеспечивающую точную идентификацию каждого входящего в Сеть узла путем присвоения ему оригинального адреса, имеющего числовой вид. Подобный код, называемый IP-адресом, выглядит как 195.218.218.38 или 193.124.148.65, что позволяет обозначить все параметры, начиная от страны и заканчивая персональным компьютером каждого пользователя. 

  1. Понятие информационно-поисковой системы, ее назначение и функции; различие между каталогами и индексами. Причины неудовлетворительных результатов запроса в ИПС.

ИПС–специализир-я автоматизир-ая инфор-я система, предназначенная для ввода, обработки, хранения и поиска электронной инф-ии в информационных ресурсах Интернет. включ себя след компоненты: программно-техническое обеспечение, базы данных, процедуры

функции: — хранения больших объемов информации; — быстрого поиска требуемой инф-и; — добавления, удаления и изменения хранимой инф-и; — вывода инф-и в удобном для человека виде. Каталоги.

Пр-р, Yahoo!. Регистрация в каталогах полностью зависит от людей — модераторов данной системы. Каталог обычно имеет тематическую разбивку на подкаталоги, те в свою очередь могут подразделяться на более мелкие поддиректории и т.д. Так как регистрация производится человеком, а не программой, то поиск по каталогам дает более релевантные результаты, нежели по поисковым системам. 

Индексы представляют собой гигантское вместилище инф-и, где хранятся копии текстовой составляющей всех посещенных и проиндексированных Spider-ом страниц. Индексы для самой поисковой системы добываются Spiderом, а каталог пополняется модераторами системы. Причины неудовлет. Запроса 1 не правильно составлен запрос. Процесс составления запроса сводится к выражению инф-й потребности пользователя на языке ИПС в терминах и понятиях, кот могут стать ключевыми словами.   2 причина как пользователь задает информационно- поисковое пространство. Т.к. Интернет — набор различных инф-х ресурсов=> пользователь, выбирая для работы определенную ПС, огранич-ся возможн-ми сетевых сервисов, в рамках кот функционирует выбранная сист. Т.о.. часть интересных для пользователя материалов может оказаться недоступной по чисто технич причинам.

  1. Понятие интеллектуальной собственности и способы ее защиты в области информатизации. Особенности проявления защиты интеллектуальной собственности в Интернет. Биометрические параметры или методы, на которых строятся системы распознавания.

Конвенция об учреждении Всемирной организ-и ИС (ВОИС), принятая в Стокгольме 14 июля 1967 г., предусматривает, что объекты ИС это: литерат-е художест-е произведения и научные труды; — исполнительская деят-ть артистов, фонограммы и радиопередачи; — изобретения во всех облас-х человеч-ой деятел-ти; — научные открытия; — промышленные образцы; — товарные знаки, — знаки обслуживания и коммерч-ие наимен-ния и обознач-ия; — пресечение недобросовестной конкуренции.

Защита ИС, имеет три вида юридич-ой защиты: 1) коммерч-ая тайна, 2) авторское право (АП) и 3) патентное право. В зарубежной практике выделяют еще право на товарные знаки (trademark), кот. в отношении к Интернет рассматр-ся в явлении киберсквотинга, регистрации известного доменного имени сайта с перспективой его перепродажи. Больш-во проблем возникает с сохранением АП открытых для копирования Интернет-ресурсов. Плагиат возрос многократно, в том числе потому, что часто на веб-страницах отсутствуют примеч-я о защите прав автора или организации. Плагиат – присвоение чужого авторства, выдача чужого произвед-я или изобретения за собствен-е => использ-е электронных копий рефератов, курсовых и работ студентами — яркий пример плагиата с использ-ем незащищенных (редко защищенных) знаком копирайта электр-ых информац-х ресурсов. По международ-у соглаш-ю автор имеет право на юридич-ю защиту своего АП в случае его нарушения даже без явного указания на него на своем веб-сайте, поэтому, копирование чего-либо с веб-страниц без получения разрешения является нарушением авторских прав. В Российм законод-ве можно выделить след. важн-е з-ны: «О СМИ», «О правовой охране программ для электрон-х-вычислит-х машин и Б.Д.», «Об авторском

праве и смежных правах» , «Об информ-и, информатизации и защите инфор-и», «Об электронной цифровой подписи» и д.р.

Биометрические признаки (БП) — это четкие, индивид-ые, биологи-и обусловленные характер-ки человека. Не существует 2 людей с одинак-ми БП. Пр-ры  биометрич-х методов идентификации: анализ отпечатков пальцев, геометрич-ой формы рук, узора радужной оболочки или сетчатки глаз, расположения кровеносных сосудов, термического образа, лица, голоса, динамики подписи, ритма работы на клавиатуре и т. д.Сегодня 3 биометр-х метода явл-ся практичными: распознавание по отпечаткам пальцев, радужной оболочке или сетчатке глаз и по чертам лица

Однако большую известность имеет DNS — система доменных имен). Ее задача — обеспечить уникальность каждого адреса в Сети, без необходимости запоминания чисел. Именно сервер DNS производит преобразование символьных (буквенных) адресов в числовые. логична и проста. Адрес любого web-сервера начинается с аббревиатуры http, обозначающей вид протокола передаваемых данных, в данном случае это (Протокол передачи гипертекста). Далее следуют двоеточие, две косые черты и латинские буквы www, после которых ставится точка. Затем идет конкретный адрес, содержащий название учреждения, персоны или аббревиатуру и, через точку, — указание на организационную или географическую принадлежность объекта. gov — правительственные, edu — образовательные, com — коммерческие, , mil — военные. Географическая .ru — Россия, .uk — Великобритания, .ca — Канада, .nl — Нидерланды и т.д. 

Система доменных имен, однако, являет лишь основу системы адресации. Каждый размещенный в Интернет документ имеет собственный адрес, обозначаемый как URL единый указатель ресурса. URL, помимо указания доменного имени, включает также и указание пути к конкретной странице. Сайты, в большинстве своем, имеют весьма разветвленную иерархическую структуру, каркас которой составляют многочисленные директории, разделяемые косыми чертами — «/». Поэтому адрес конкретного документа, как правило, имеет вид, подобный приведенному документу с сервера ГПНТБ России: http://www.gpntb.ru/win/inter-events/crimea2003/conferr.htm. В данном случае http://www.gpntb.ru — указание сайта, win/inter-events/crimea2003 — указание пути к файлу (фактически — перечень директорий), conferr.htm — имя конкретного файла.

17. Технологии и модели «Клиент-сервер».

В технологиях «Клиент-сервер» отступают от одного из главных принципов создания и функционирования распределенных систем — отсутствия центральной вычислительной машины. Поэтому можно выделить две основные идеи, лежащие в основе клиент-серверных технологий:

  • общие для всех пользователей данные на одном или нескольких серверах;
  • много пользователей (клиентов) на различных компьютерах, совместно (параллельно и одновременно) обрабатывающих общие данные.

Иначе говоря, системы, основанные на технологиях «Клиент-сервер», распределены только в отношении пользователей, поэтому часто их не относят к «настоящим» распределенным системам, а считают отдельным, уже упоминавшимся классом многопользовательских систем.

Под сервером понимается программно-аппаратная система, обладающая возможностью отвечать на запрос пользователя (клиента) о предоставлении ресурсов, ему необходимых,  получать запрошенные ресурсы (файлы на жестком диске, процессорное время, информацию из БД), используя аппаратную составляющую системы.

В виду того что аппаратная часть сервера должна быть способна отвечать на множественные запросы пользователей, и обрабатывать данные запросы без видимых для клиента задержек, сервера зачастую имеют отличную от обычных компьютеров конфигурацию. Отличие заключается в количестве физических процессоров (от 2 до 64 на одной материнсткой поате), количеством доступной оперативной памяти (от 8 Гб и выше), объемом дисковых массивов (от нескольких терабайт), а так же пропускной способностью каналов связи (1 Gbit/c или оптика).

Клиентом называется также любой программно-аппаратный комплекс, запрашивающий у сервера какой-либо ресурс, пользующийся этим ресурсом или обслуживаемый сервером иным способом.

В своем развитии системы «Клиент-сервер» прошли несколько этапов, в ходе которых сформировались различные модели систем «Клиент-сервер». Их реализация и, следовательно, правильное понимание основаны на разделении структуры клиент-серверного приложения (классический пример такого приложения – север, осуществляющий доступ к БД посредством СУБД) на три компонента:

  • компонент представления, реализующий функции ввода и отображения данных, называемый иногда еще просто как интерфейс пользователя;
  • прикладной компонент, включающий набор запросов, событий, правил, процедур и других вычислительных функций, реализующий предназначение автоматизированной информационной системы в конкретной предметной области (бизнес-логика);
  • компонент доступа к данным, реализующий функции хранения, извлечения, физического обновления и изменения данных (СУБД).

Исходя из особенностей реализации и распределения (расположения) в системе этих трех компонентов различают четыре модели технологий «Клиент-сервер»:

  • модель файлового сервера (File Server — FS);
  • модель удаленного доступа к данным (Remote Data Access —RDA);
  • модель сервера базы данных (DataBase Server — DBS);
  • модель сервера приложений (Application Server — AS).
  1. Стандарты MRP/ERP. Назначение, основные характеристики.

MRP (Material Requirement Planning) – это планирование потребности в материалах; («-»При расчете потребности в материалах не учитываются загрузка и амортизация производственных мощностей, стоимость рабочей силы, потребляемой энергии)

MRP II (Manufacturing Resource Planning) – это планирование производственных ресурсов;

ERP (Enterprise Resource Planning) – это планирование ресурсов всего предприятия.

Стандарты MRP/ERP поддерживаются Американским обществом по контролю над производственными запасами APICS (American Production and Inventory Control Society).

MRP/ERP – это набор проверенных на практике разумных принципов, моделей и процедур управления и контроля, предназначенных для повышения показателей экономической деятельности предприятия.

Сегодня модель MRP/ERP включает в себя следующие подсистемы, которые часто называют также блоками или сериями:  управление запасами; управление снабжением;

  • управление сбытом; управление производством; планирование; управление сервисным обслуживанием;
  • управление цепочками поставок; управление финансами.

Управление запасами. Эта подсистема обеспечивает реализацию следующих функций:

  • Inventory Control – мониторинг запасов;
  • Physical Inventory – регулирование и инвентаризация складских остатков.

При решении задач управления запасами — производится обработка и корректировка всей информации о приходе, движении и расходе сырья и материалов, промежуточной продукции и готовых изделий; учет запасов по складским ячейкам, выбор индивидуальных стратегий контроля, пополнения и списания запасов по каждой позиции номенклатуры сырья и материалов, и т.д. Учитывается нормативная и текущая фактическая стоимость запасов, а также отслеживается прохождение отдельных партий запасов и серий изготавливаемой продукции.

 Управления снабжением. Подсистема реализует следующие функции:Purchase Orders — заказы на закупку;

  • Supplier Schedules — график поставок;MRP — планирование потребности в материалах, понимаемое как управление заявками  на закупку.

Управление сбытом. Базовыми функциями этой подсистемы являются:

1) Sales Quotations — квотирование продаж;

2) Sales Orders / Invoices — заказы на продажу (счета фактуры);

3) Customer Schedules — график продаж потребителям;

4) Configured Products — конфигурирование продуктов;

5) Sales Analysis — анализ продаж;

6) Distributed Resource Planning (DRP) — управления ресурсами распределения.

Управления производством. В этой подсистеме реализуются следующие функции, соответствующие различным типам производственных процессов:

  • Product Structures — спецификация изделий, определяющая, какие материалы и комплектующие используются в производимом изделии;
  • Routings/Work Centers — операции/центры переработки, включает в себя описание цехов, участков, рабочих мест;
  • Formula/Process — технологические процессы производства продукции с маршрутизацией по рабочим центрам для объемного (процессного) производства.
  • Work Orders – наряд-задание (сменное задание) на производство работ для позаказного и мелкосерийного производства;
  1. Модели качества процессов разработки ПО. Уровни зрелости модели СММ

В современных условиях, условиях жесткой конкуренции, очень важно гарантировать высокое качество процесса разработки ПО. Такую гарантию дает сертификат качества процесса, подтверждающий его соответствие принятым международным стандартам. Каждый такой стандарт фиксирует свою модель обеспечения качества. Одним из таких стандартов является модель зрелости процесса разработки ПО (Capability Maturity Model — СММ) Института программной инженерии при американском университете Карнеги-Меллон. Базовым понятием модели СММ считается зрелость компании. Незрелой называют компанию, где процесс конструирования ПО и принимаемые решения зависят только от таланта конкретных разработчиков. Как следствие, здесь высока вероятность превышения бюджета или срыва сроков окончания проекта.

Напротив, в зрелой компании работают ясные процедуры управления проектами и построения программных продуктов. По мере необходимости эти процедуры уточняются и развиваются. Оценки длительности и затрат разработки точны, основываются на накопленном опыте. Кроме того, в компании имеются и действуют корпоративные стандарты на процессы взаимодействия с заказчиком, процессы анализа, проектирования, программирования, тестирования и внедрения программных продуктов. Все это создает среду, обеспечивающую качественную разработку программного обеспечения.

Таким образом, модель СММ фиксирует критерии для оценки зрелости компании и предлагает рецепты для улучшения существующих в ней процессов. Иными словами, в ней не только сформулированы условия, необходимые для достижения минимальной организованности процесса, но и даются рекомендации по дальнейшему совершенствованию процессов.Очень важно отметить, что модель СММ ориентирована на построение системы постоянного улучшения процессов. В ней зафиксированы пять уровней зрелости и предусмотрен плавный, поэтапный подход к совершенствованию процессов — можно поэтапно получать подтверждения об улучшении процессов после каждого уровня зрелости.

Начальный уровень (уровень 1) означает, что процесс в компании не формализован. Он не может строго планироваться и отслеживаться, его успех носит случайный характер. Результат работы целиком и полностью зависит от личных качеств отдельных сотрудников. При увольнений таких сотрудников проект останавливается.

Для перехода на повторяемый уровень (уровень 2) необходимо внедрить формальные процедуры для выполнения основных элементов процесса разработки ПО. Результаты выполнения процесса соответствуют заданным требованиям и стандартам. Основное отличие от уровня 1 состоит в том, что выполнение процесса планируется и контролируется. Применяемые средства планирования и управления дают возможность повторения ранее достигнутых успехов.

Следующий, определенный уровень (уровень 3) требует, чтобы все элементы процесса были определены, стандартизованы и задокументированы. Основное отличие от уровня 2 заключается в том, что элементы процесса уровня 3 планируются и управляются на основе единого стандарта компании. Качество разрабатываемого ПО уже не зависит от способностей отдельных личностей.

С переходом на управляемый уровень (уровень 4) в компании принимаются количественные показатели качества как программных продуктов, так и процесса. Это обеспечивает более точное планирование проекта и контроль качества его результатов. Основное отличие от уровня 3 состоит в более объективной, количественной оценке продукта и процесса.

Высший, оптимизирующий уровень (уровень 5) подразумевает, что главной задачей компании становится постоянное улучшение и повышение эффективности 

  1. Экспертные системы. Основные понятия, функциональные возможности и характеристика

Экспертная система— это система, которая использует человеческие знания, встраиваемые в компьютер, для решения задач, которые обычно требуют человеческой экспертизы. Хорошо разработанные системы имитируют процесс рассуждения экспертов, используя это для решения специфических задач.

ЭС — это сложные программы, которые манипулируют знаниями в целях получения эффективного решения в узкой предметной области. Как и настоящий человек-эксперт, эти системы используют символическую логику и эвристики (эмпирические правила) чтобы найти решения. Они могут ошибаться, но обладают способностью учиться на своих ошибках.

Основные понятия ЭС. 1. Экспертиза — это специфическое знание необходимое для решения задачи, извлеченное из обучения, чтения и опыта. Следующие типы знаний являются примерами того, что включает в себя экспертиза:

  • теории о проблемной области;
  • правила и процедуры относительно проблемной области;
  • правила (эвристики) о том, что делать в данной проблемной ситуации;
  • глобальные стратегии для решения таких типов задач;
  • мета-знания (знания о знаниях);
  • факты о проблемной области.

Эти типы знаний дают возможность ЛПР (лицо, прин реш-е) принимать решения лучше и быстрее при реш-ии сложных задач.

2. Эксперты. Трудно дать определение понятию эксперт, так как мы в действительности говорим о разных степенях или уровнях экспертизы. Возникает также вопрос: каким объемом экспертных знаний в данной области и какими навыками должен обладать человек, чтобы стать квалифицированным экспертом? Обычно, человеческая экспертиза включает многогранное интеллектуальное поведение, которое вовлекает в процесс следующие виды деятельности:

  • выявление и формулировка проблемы и задачи;
  • решение задачи быстро и надлежащим образом;
  • объяснение решения;
  • обучение из опыта;
  • реструктуризация знаний;
  • отказ при необходимости от устоявшихся правил и шаблонов;
  • определение уместности и соответствия;
  • осознание ограничений.

Для имитации эксперта-человека необходимо создать компьютерную систему, проявляющую все эти характеристики. Однако в современных ЭС прежде всего исследованы и разработаны вторая и третья из этих видов деятельности (решение задач и объяснение решений).

3. Проведение экспертизы. Целью ЭС является проведение экспертизы путем аккумуляции знаний от экспертов и предоставлению их другим людям (не экспертам). В этот процесс вовлечены четыре вида деятельности: 

  • извлечение знаний (из экспертов или других источников);
  • представление знаний (в компьютере);
  • вывод знаний;
  • передача знаний пользователю. 

Знания хранятся в компьютере в базе знаний (БЗ).

4.1. Вывод. Уникальной чертой ЭС является их способность рассуждать («думать»). Имеется в виду, что необходимые знания для экспертизы хранятся в БЗ, программа может иметь доступ к соответствующим данным в БД, а ЭС может делать логический вывод, получая нужное знание, зачастую не хранящееся в явном виде в БЗ. Процесс вывода осуществляется составляющей системы, которая называется машина вывода.

4.2. Способность объяснять. Другой уникальной чертой ЭС является ее способность объяснять свои советы или рекомендации. Объяснение и обоснование производятся подсистемой объяснений. Она дает возможность системе проверять свои рассуждения и объяснять их действия.

Основными характеристиками ЭС являются:

  • накопление и организация знаний;
  • знания — основа ЭС, они являются явными и доступными, что отличает эти системы от большинства традиционных программ;
  • применение для решения проблем высококачественного опыта квалифицированных экспертов. Именно высококачественный опыт в сочетании с умением его применять делает систему рентабельной. Этому также способствует гибкость системы;
  • наличие прогностических способностей. ЭС может объяснить каким образом новая ситуация привела к изменениям;
  • ведущие специалисты уходят, но их опыт остается и используется в ЭС;
  • ЭС можно использовать для обучения и тренировки. 

Необходимо ставить для человека место в системе. Поэтому ЭС наиболее часто используются как советчики, в качестве консультантов или помощников ЛПР.

Функциональные возможности ЭС определяются двумя ее главными системными частями: средой развития и средой рекомендаций. Среда развития используется разработчиком ЭС для построения компонентов и размещения знаний в БЗ. Среда рекомендаций используется неэкспертами для получения экспертных знаний и советов.

Три главных компонента, которые проявляются виртуально в каждой ЭС — это БЗ, механизм вывода и пользовательский интерфейс. Обычно, большинство ЭС не содержат подсистему верификации знаний. Существует также большие колебания в содержании и способностях каждой компоненты.

1.Извлечение знаний представляет собой накопление, передачу и преобразование экспертиз решения задачи от экспертов или документированных источников знаний компьютерной программой для конструирования или расширения БЗ. Потенциальные источники знаний включают экспертов, учебники, справочники, мультимедийные документы, базы данных (общественные или частные), специальные исследовательские отчеты и информацию, доступную через Интернет.

Извлечение знаний из экспертов является сложной задачей, которая часто создает узкое место при построении ЭС.

Современные условия требуют от инженера знаний и способностей взаимодействовать с одним или более людьми-экспертами при построении БЗ. Инженер знаний помогает эксперту структурировать проблемную область путем интерпретации и объединения ответов человека на вопросы, проводя аналогии, предлагая контрпримеры и выявляя концептуальные трудности.

2.База знаний содержит знания, необходимые для понимания, формулирования и решения задач. Она включает два основных элемента: факты, такие как проблемная ситуация и теоретические знания о проблемной области, и специальные эвристики или правила, которые направляют использование знаний при решении специфических задач в отдельной области. Кроме того, механизм вывода, тесно связанный с БЗ, содержит стандартные правила решения задач и принятия решений. Эвристики выражают неформальные знания, мнения и суждения в прикладной области. Глобальные стратегии, которые могут быть как эвристиками, так и частью теории проблемной области, обычно включаются в БЗ. Знания, а не просто факты, являются первоначальным необработанным материалом экспертных систем. Информация и знания в БЗ представлены и включены в компьютерную программу путем реализации процесса, называемого представление знаний

3.Механизм вывода является мозгом ЭС, его также называют управляющая структура или интерпретатор правил (в ЭС, основанных на правилах).

Эта компонента является в основном компьютерной программой, которая обеспечивает методологию для рассуждения об информации в БЗ и в рабочей области, а также для формулирования заключений. Она обеспечивает указания о том, как использовать знания системы при реализации агенды (расписания запланированных действий в рабочей области), которая организует и управляет шагами, предпринимаемыми для решения задачи.

Механизм вывода имеет два главных элемента: интерпретатор, который выполняет выбранные позиции агенды, используя соответствующие правила БЗ; планировщик, который поддерживает управление агендой. Он оценивает результаты используемых правил вывода в свете их приоритетов или других критериев в агенде.

4.Пользовательский интерфейс ЭС содержат языковой процессор для дружественного, проблемно-ориентированного общения между пользователем и компьютером. Общение наилучшим образом выполняется на естественном языке. Иногда оно дополняется меню и графикой.

5.Рабочая область — это область, расположенная отдельно для описания текущей задачи, как определено входными данными. Она также исг пользуется для запоминания промежуточных результатов. В рабочей области запоминаются промежуточные гипотезы и решения. 90

Могут быть запомнены три типа решений: план (как атаковать задачу), агенда (потенциальные действия, ожидающие выполнения) и решение (гипотезы — кандидаты и альтернативные направления действий, которые система сгенерировала до сих пор).

6.Подсистема объяснения. Способность отслеживать ответственность и соответствие заключений их источникам является решающей и при проведении экспертизы, и при решении задачи. Подсистема объяснения мо-кет отслеживать такую ответственность и объяснять поведение эксперт-рой системы интерактивно отвечая на вопросы.

7.Подсистема верификации и совершенствования знаний. Эксперты обладают способностями верифицировать и совершенствовать знания. То есть, они могут анализировать свои собственные знания и их использование, обучаться от них и улучшать их для будущих консультаций. Аналогично, такая эволюция необходима в компьютеризованном обучении, так, чтобы программа могла анализировать рассуждения под углом зрения их успеха или неудачи. Это может привести к улучшениям, и как результату, более точным БЗ и более эффективному рассуждению. Такой составляющей в настоящее время пока нет в коммерческих ЭС, но она разрабатывается в экспериментальных ЭС.

существующих процессов, ввод новых технологий. Основное отличие от уровня 4 заключается в том, что технология создания и сопровождения программных продуктов планомерно и последовательно совершенствуется. Каждый уровень СММ характеризуется областью ключевых процессов (ОКП), причем считается, что каждый последующий уровень включает в себя все характеристики предыдущих уровней. Иначе говоря, для 3-го уровня зрелости рассматриваются ОКП 3-го уровня, ОКП 2-го уровня и ОКП 1-го уровня. Область ключевых процессов образуют процессы, которые при совместном выполнении приводят к достижению определенного набора целей. Например, ОКП 5-го уровня образуют процессы:

  • предотвращения дефектов;
  • управления изменениями технологии;
  • управления изменениями процесса.

Если все цели ОКП достигнуты, компании присваивается сертификат данного уровня зрелости. Если хотя бы одна цель не достигнута, то компания не может соответствовать данному уровню СММ.

Планирование. В модели MRP/ERP предусматривается сквозное планирование, согласование и оперативная корректировка планов и действий снабженческих, производственных и сбытовых звеньев предприятия.

Подсистема планирования реализует следующие функции:

  • Product Line Planning (PLP) – финансовое планирование товарно-номенклатурных групп (ТНГ);
  • Master Scheduling Planning (MSP) – главный календарный график или объемно календарное планирование;
  • Distribution Resource Planning (DRP) – планирование распределения ресурсов (RCP);
  • Materials Requirements Planning (MRP) – планирование потребности материалов;
  • Capacity Requirements Planning (CRP)– планирование потребления мощностей.

Эту функциональность можно условно отнеси к трем уровням планирования, отражающим иерархию планов в ERP-модели.

Управление сервисным обслуживанием. Эта подсистема активно используется компаниями, которые не только производят и продают свою продукцию, но и обеспечивают послепродажное техническое обслуживание и техническую поддержку своей продукции. Подсистема обеспечивается полный спектр необходимых функций: от создания графика технического обслуживания, заказа комплектующих, учета контрактов на обслуживание и формирования счетов до учета прибыли, получаемой от  послепродажного обслуживания.

Управление цепочками поставок. Эта подсистема предназначена для обеспечения эффективного управления материальными и соответствующими им информационными потоками: от поставщика через производство к потребителю. Реализованная в подсистеме идеология «управления глобальными цепочками поставок» дает промышленным предприятиям возможность представлять свою деятельность в виде так называемых эффективных цепочек логистики: от поставщиков сырья и комплектующих до продажи готовых изделий конечному потребителю. При этом обеспечиваются широкие возможности управления транснациональными компаниями, координации распределенного между многими дочерними компаниями производства.

Управление финансами. В соответствии с идеологией MRP/ERP эта подсистема полностью интегрирована со всеми остальными и позволяет оперативно получать информацию о финансовых потоках, связанных с потоками материальными, о текущем финансовом состоянии компании, и помогает находить оптимальные финансово – экономические решения. Сквозное управление материальными потоками находит свое отражение в управлении финансовыми потоками (движении денежных средств).

В подсистеме реализована функциональность:

  • General Ledger – главная бухгалтерская книга, предназначенная для отражения финансовых транзакций и ведения бухгалтерского учета;
  • Multiple Currency – мультивалютность, для ведения учета в разных валютах;
  • Accounts Receivable — дебиторская задолженность;
  • Accounts Payable — кредиторская задолженность;
  • Payroll — заработная плата;
  • Cost Management — управление себестоимостью;
  • Cash Management — управление платежами;
  • Fixed Assets — учет основных средств.

Модель MRP/ERP реализована в ряде информационных систем (ERP –систем) корпоративного уровня. Согласно статистическим данным, полученным при анализе использования ERP-систем в США, результатом внедрения таких систем на предприятиях является сокращение объемов запасов в среднем на 17 %, уменьшение затрат за закупку сырья и материалов на 7 %, повышение рентабельность производства в среднем на 30% и качества выпускаемой продукции на 60%.

21. Модели представления знания в интеллектуальных информационных системах

В общем виде модели представления знаний могут быть условно разделены на концептуальные и эмпирические.

Концептуальная модель дает эвристический метод для решения некоторой проблемы. Метод эвристичен, поскольку концептуальное описание не дает гарантии того, что он может быть применен во всех соответствующих практических ситуациях. Концептуальная модель делает возможным распознавание проблемы, позволяет уменьшать время для ее предварительного анализа.

Практическое использование концептуальной модели влечет за собой необходимость преобразования ее в эмпирическую. Знания могут быть накоплены в виде эмпирических моделей, как правило, описательного характера. Эти модели могут варьировать от простого набора правил до полного описания того, как ЛПР (лицо принимающее решения) решает задачу.

Модели представления знаний можно условно разделить на декларативные и процедурные.

Декларативная модель представления знаний основывается на предположении, что проблема представления некоей предметной области решается независимо от того, как эти знания потом будут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода, оперирующего этими структурами и практически независимого от их содержательного наполнения. При этом в какой-то степени оказываются раздельными синтаксические и семантические аспекты знания, что является определенным достоинством указанных форм представления из-за возможности достижения их определенной универсальности.

В декларативных моделях не содержатся в явном виде описания выполняемых процедур. Эти модели представляют собой обычно множество утверждений. Предметная область представляется в виде синтаксического описания ее состояния (по возможности полного). Вывод решений основывается в основном на процедурах поиска в пространстве состояний.

В процедурном представлении знания содержатся в процедурах — небольших программах, которые определяют, как выполнять специфичные действия (как поступать в специфичных ситуациях). При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состояния и процедуры, генерирующие необходимые описания ситуаций и действий.

При процедурном представлении знаний семантика непосредственно заложена в описание элементов базы знаний, за счет чего повышается эффективность поиска решений. По сравнению с процедурной частью статическая база знаний у них мала. Она содержит не «неизменные аксиомы, а лишь так называемые «утверждения», которые приемлемы в данный момент, но могут быть изменены или удалены в любое время. Общие знания и правила вывода представлены в виде специальных целенаправленных процедур, активизирующихся по мере надобности.

Процедуры могут активизировать друг друга, их выполнение может прерываться, а затем возобновляться. Возможно использование процедур — «демонов», активизирующихся при выполнении операций введения, изменения или удаления данных.

Средством повышения эффективности генерации вывода в процедурных моделях является добавление в систему знаний о применении, т.е., знаний о том, каким образом использовать накопленные знания для решения конкретной задачи. Эти знания, как правило, тоже представляются в процедурной форме.

Главное преимущество процедурных моделей представления знаний заключается в большей эффективности механизмов вывода за счет введения дополнительных знаний о применении, что однако снижает их общность. Другое важное преимущество заключено в выразительной силе. Процедурные системы способны смоделировать практически любую модель представления знаний. 

Необходимо отметить, что деление моделей представления знаний на декларативные и процедурные весьма условно, так как в реальных системах представления знаний используются в равной мере элементы и сочетания всех указанных выше форм моделей представления знаний.

  1. Хранилища данных. Основные свойства и структуры хранилищ данных в системах поддержки принятия решений

В основе концепции ХД лежит идея разделения данных, используемых для оперативной обработки и для решения задач анализа. Такое разделение позволяет оптимизировать как структуры данных оперативного хранения (оперативные БД, файлы, электронные таблицы и т.п.) для выполнения операций ввода, модификации, удаления и поиска, так и структуры данных, используемые для анализа (для выполнения аналитических запросов). В СППР (система поддержки принятия решений) эти два типа данных называются соответственно оперативными источниками данных (ОИД) и хранилищем данных.

Хранилище данных – предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки принятия решений

Свойства ХД: 1.Предметная ориентация – является фундаментальным отличием ХД от ОИД. Разные ОИД могут содержать данные, описывающие одну и ту же предметную область с разных точек зрения (например, с точки зрения бухгалтерского учета, складского учета, планового отдела и т. п.). Решение, принятое на основе только одной точки зрения, может быть неэффективным или даже неверным. ХД позволяют интегрировать информацию, отражающую разные точки зрения на одну предметную область.

2.Интеграция – ОИД, как правило, разрабатываются в разное время несколькими коллективами с собственным инструментарием. Эго приводит к тому, что данные, отражающие один и тот же объект реального мира в разных системах, описывают его по-разному. Обязательная интеграция данных в ХД позволяет решить эту проблему, приведя данные к единому формату.

3.Поддержка хронологии – данные в ОИД необходимы для выполнения над ними операций в текущий момент времени. Поэтому они могут не иметь привязки ко времени. Для анализа данных часто важно иметь возможность отслеживать хронологию изменений показателей предметной области. Поэтому все данные, хранящиеся в ХД, должны соответствовать последовательным интервалам времени.

4.Неизменяемость – требования к ОИД накладывают ограничения на время хранения в них данных. Те данные, которые не нужны для оперативной обработки, как правило, удаляются из ОИД для уменьшения занимаемых ресурсов. Для анализа, наоборот, требуются данные за максимально больший период времени. Поэтому, в отличие от ОИД, данные в ХД после загрузки только читаются. Это позволяет существенно повысить скорость доступа к данным, как за счет возможной избыточности хранящейся информации, так и за счет исключения операций модификации. При реализации в СППР (системах поддержки принятия решений) концепции ХД данные из разных ОИД копируются в единое хранилище. Собранные данные приводятся к единому формату, согласовываются и обобщаются. Аналитические запросы адресуются к ХД. Такая модель неизбежно приводит к дублированию информации в ОИД и в ХД. Однако избыточность данных, хранящихся в СППР, как правило, не превышает 1 %. 

  1. Многомерная модель данных. Основные понятия и модели

В процессе анализа данных, поиска решений часто возникает необходимость в построении зависимостей между различными параметрами. Кроме того, число таких параметров может варьироваться в широких пределах. Как уже отмечалось, традиционные средства анализа, оперирующие данными, которые представлены в виде таблиц реляционной БД, не могут в полной мере удовлетворять таким требованиям. В 1993г. Э. Ф. Кодд – основоположник реляционной модели БД – рассмотрел ее недостатки, указав в первую очередь на невозможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений, т е. самым понятным для аналитиков способом».

Измерение – это последовательность значений одного из анализируемых параметров. Например, для параметра «время» это последовательность календарных дней, для параметра «регион» это, например, список городов.

Множественность измерений предполагает представление данных в виде многомерной модели. По измерениям в многомерной модели откладывают параметры, относящиеся к анализируемой предметной области.

Основными составляющими структуры хранилищ данных являются таблица фактов (fact table) и таблицы измерений (dimension tables). 

Таблица фактов является основной таблицей хранилища данных. Как правило, она содержит сведения об объектах или событиях, совокупность которых будет в дальнейшем анализироваться. Если проводить аналогию с многомерной моделью, то строка таблицы фактов соответствует ячейке гиперкуба. Обычно говорят о четырех наиболее часто встречающихся типах фактов. К ним относятся: 

  • факты, связанные с транзакциями (Transaction facts). Они основаны на отдельных событиях (типичными примерами которых являются телефонный звонок или снятие денег со счета с помощью банкомата); 
  • факты, связанные с «моментальными снимками» (Snapshot facts). Основаны на состоянии объекта (например, банковского счета) в определенные моменты времени, например на конец дня или месяца. Типичными примерами таких фактов являются объем продаж за день или дневная выручка; 
  • факты, связанные с элементами документа (Line-item facts). Основаны на том или ином документе (например, счете за товар или услуги) и содержат подробную информацию об элементах этого документа (например, количестве, цене, проценте скидки); 
  • факты, связанные с событиями или состоянием объекта (Event or state facts). Представляют возникновение события без подробностей о нем (например, просто факт продажи или факт отсутствия таковой без иных подробностей). 

Таблица фактов индексируется по сложному ключу, составленному из ключей отдельных изменений. При этом как ключевые, так и некоторые неключевые поля таблицы фактов должны соответствовать будущим измерениям OLAP-куба. Помимо этого таблица фактов содержит одно или несколько числовых полей, на основании которых в дальнейшем будут получены агрегатные данные. 

Замечания.

  1. Для многомерного анализа пригодны таблицы фактов, содержащие как можно более подробные данные, то есть соответствующие членам нижних уровней иерархии соответствующих измерений. 
  2. В таблице фактов отсутствуют какие-либо сведения о том, как группировать записи при вычислении агрегатных данных. 

Таблица измерений содержит неизменяемые или редко изменяемые данные. В каждой таблице измерений перечислены возможные значения одного из измерений гиперкуба. В подавляющем большинстве случаев эти данные представляют собой по одной записи для каждого члена нижнего уровня иерархии в измерении. Таблицы измерений также содержат как минимум одно описательное поле (обычно с именем члена измерения) и, как правило, целочисленное ключевое поле (обычно это суррогатный ключ) для однозначной идентификации члена измерения. Каждая таблица измерений должна находиться в отношении «один ко многим» с таблицей фактов.

По Кодду, многомерное концептуальное представление (multi-dimensional conceptual view) – это множественная перспектива, состоящая из нескольких независимых измерений, вдоль которых могут быть проанализированы определенные совокупности данных. Одновременный анализ по нескольким измерениям определяется как многомерный анализ.

Каждое измерение может быть представлено в виде иерархической структуры. Например, измерение «Исполнитель» может иметь следующие иерархические уровни: «предприятие–подразделение–отдел–служащий». Более того, некоторые измерения могут иметь несколько видов 

  1. Технология оперативной аналитической обработки данных – OLAP. Основные понятия, требования к OLAP, способы реализации

С концепцией многомерного анализа данных тесно связывают оперативный анализ, который выполняется средствами OLAP-систем. OLAP (On-Line Analytical Processing) – технология оперативной аналитической обработки данных, использующая методы и средства для сбора, хранения и анализа многомерных данных в целях поддержки процессов принятия решений.

Основное назначение OLAP-систем – поддержка аналитической деятельности, произвольных (часто используется термин ad-hoc) запросов пользователей – аналитиков. Цель OLAP-анализа – проверка возникающих гипотез

Ниже перечислены 12 правил, изложенных Коддом и определяющих OLAP.

1. Многомерность – OLAP-система на концептуальном  уровне должна представлять данные в виде многомерной модели, что упрощает процессы анализа и восприятия информации.

2. Прозрачность – OLAP-система должна скрывать от пользователя реальную реализацию многомерной модели, способ организации, источники, средства обработки и хранения.

3. Доступность – OLAP-система должна предоставлять пользователю единую, согласованную и целостную модель данных, обеспечивая доступ к данным независимо от того, как и где они хранятся.

4. Постоянная производительность при разработке отчетов – производительность OLAP-систем не должна значительно уменьшаться при увеличении количества измерений, по которым выполняется анализ.

5. Клиент-серверная архитектура – OLAP-система должна быть способна работать в среде «клиент-сервер», т.к. большинство данных, которые сегодня требуется подвергать оперативной аналитической обработке, хранятся распределено. 

6. Равноправие измерений – OLAP-система должна поддерживать многомерную модель, в которой все измерения равноправны. При необходимости дополнительные характеристики могут быть предоставлены отдельным измерениям, но такая возможность должна быть предоставлена любому измерению.

7. Динамическое управление разреженными матрицами – OLAP-система должна обеспечивать оптимальную обработку разреженных матриц. Скорость доступа должна сохраняться вне зависимости от расположения ячеек данных и быть постоянной величиной для моделей, имеющих разное число измерений и различную степень разреженности данных.

8. Поддержка многопользовательского режима – OLAP-система должна предоставлять возможность работать нескольким пользователям совместно с одной аналитической моделью или создавать для них различные модели из единых данных. При этом возможны как чтение, так и запись данных, поэтому система должна обеспечивать их целостность и безопасность.

9. Неограниченные перекрестные операции – OLAP-система должна обеспечивать сохранение функциональных отношений, описанных с помощью определенного формального языка между ячейками гиперкуба при выполнении любых операций среза, вращения, консолидации или детализации Система должна самостоятельно (автоматически) выполнять преобразование установленных отношений, не требуя от пользователя их переопределения.

10. Интуитивная манипуляция данными – OLAP-система должна предоставлять способ выполнения операций среза, вращения, консолидации и детализации над гиперкубом без необходимости пользователю совершать множество действий с интерфейсом. Измерения, определенные в аналитической модели, должны содержать всю необходимую информацию для выполнения вышеуказанных операций.

11. Гибкие возможности получения отчетов – OLAP-система должна поддерживать различные способы визуализации данных, т.е. отчеты должны представляться в любой возможной ориентации. 

12. Неограниченная размерность и число уровней агрегации – исследование о возможном числе необходимых измерений, требующихся в аналитической модели, показало, что одновременно может использоваться до 19 измерений. Отсюда вытекает настоятельная рекомендация, чтобы аналитический инструмент мог одновременно предоставить хотя бы 15, а предпочтительно – 20 измерений. Более того, каждое из общих измерений не должно быть ограничено по числу определяемых пользователем-аналитиком уровней агрегации и путей консолидации.

Дополнительные правила Кодда. Набор этих требований, послуживших де-факто определением OLAP, достаточно часто вызывает различные нарекания, например, правила 1, 2, 3, 6 являются требованиями, а правила 10, 11 –неформализованными пожеланиями. Таким образом, перечисленные 12 требований Кодда не позволяют точно определить OLAP. В 1995г. Кодд к приведенному перечню добавил еще шесть правил:

13. Пакетное извлечение против интерпретации – OLAP-система должна в равной степени эффективно обеспечивать доступ, как к собственным, так и к внешним данным.

14. Поддержка всех моделей OLAP-анализа – OLAP-система должна поддерживать все четыре модели анализа данных, определенные Коддом: категориальную, толковательную, умозрительную и стереотипную.

15. Обработка ненормализованных данных – OLAP-система должна быть интегрирована с ненормализованными источниками данных. Модификации данных, выполненные в среде OLAP, не должны приводить к изменениям данных, хранимых в исходных внешних системах.

16. Сохранение результатов OLAP: хранение их отдельно от исходных данных – OLAP-система, работающая в режиме чтения-записи, после модификации исходных данных должна результаты сохранять отдельно. Иными словами, обеспечивается безопасность исходных данных.

17. Исключение отсутствующих значений – OLAP-система, представляя данные пользователю, должна отбрасывать все отсутствующие значения. Другими словами, отсутствующие значения должны отличаться от нулевых значений.

18. Обработка отсутствующих значений –OLAP-система должна игнорировать все отсутствующие значения без учета их источника. Эта особенность связана с 17-м правилом.

Три основных способа реализации:

MOLAP–для реализации многомерной модели используют многомерные БД. При этом данные хранятся в виде упорядоченных многомерных массивов. Такие массивы подразделяются на гиперкубы и поликубы.

ROLAP –для реализации многомерной модели используют реляционные БД;

HOLAP –для реализации многомерной модели используют и многомерные и реляционные БД. используют гибридную архитектуру, которая объединяет технологии ROLAP и MOLAP. В отличие от MOLAP, которая работает лучше, когда данные более-менее плотные, серверы ROLAP показывают лучшие параметры в тех случаях, когда данные довольно разрежены. Серверы HOLAP применяют подход ROLAP для разреженных областей многомерного пространства и подход MOLAP – для плотных областей. Серверы HOLAP разделяют запрос на несколько подзапросов, направляют их к соответствующим фрагментам данных, комбинируют результаты, а затем предоставляют результат пользователю.

иерархического представления. Например, измерение «время» может включать две иерархии со следующими уровнями: «год – квартал – месяц – день» и «неделя – день».

На пересечениях осей измерений (Dimensions) располагаются данные, количественно характеризующие анализируемые факты, – меры (Measures). Это могут быть объемы продаж, выраженные в единицах продукции или в денежном выражении, остатки на складе, издержки и т. п.

Таким образом, многомерную модель данных можно представить как гиперкуб Ребрами такого гиперкуба являются измерения, а ячейками – меры. Над таким гиперкубом могут выполняться следующие операции:

1.Срез (Slice) – формируется подмножество многомерного массива данных, соответствующее единственному значению одного или нескольких элементов измерений, не входящих в это подмножество.

 

2.Вращение (Rotate) – изменение расположения измерений, представленных в отчете или на отображаемой странице.

 

3.Консолидация (Drill Up) и детализация (Drill Down) – операции, которые определяют переход вверх по направлению от детального (down) представления данных к агрегированному (up) и наоборот, соответственно. Направление детализации (обобщения) может быть задано как по иерархии отдельных измерений, так и согласно прочим отношениям, установленным в рамках измерений или между измерениями.

 

 

Примеры реализации Хранилищ данных (ХД + ОИД + Витрина данных)

 

Рис. 2.1. Структура СППР с физическим ХД.

 

Рис. 2.2. Структура СППР с виртуальным ХД.

 

Рис. 2.3. Структура СППР с самостоятельными ВД

 

Рис. 2.4. Структура СППР с ХД и ВД

25. Интеллектуальный анализ данных Задачи Data Mining

Классификация (Classification)

Краткое описание. Наиболее простая и распространенная задача Data Mining. В результате решения задачи классификации обнаруживаются признаки, которые характеризуют группы объектов исследуемого набора данных — классы; по этим признакам новый объект можно отнести к тому или иному классу.

Методы решения. Для решения задачи классификации могут использоваться методы: ближайшего соседа (Nearest Neighbor); k-ближайшего соседа (k-Nearest Neighbor); байесовские сети (Bayesian Networks); индукция деревьев решений; нейронные сети (neural networks).

Кластеризация (Clustering)

Краткое описание. Кластеризация является логическим продолжением идеи классификации. Это задача более сложная, особенность кластеризации заключается в том, что классы объектов изначально не предопределены. Результатом кластеризации является разбиение объектов на группы.

Пример метода решения задачи кластеризации: обучение «без учителя» особого вида нейронных сетей — самоорганизующихся карт Кохонена.

Ассоциация (Associations)

Краткое описание. В ходе решения задачи поиска ассоциативных правил отыскиваются закономерности между связанными событиями в наборе данных.

Отличие ассоциации от двух предыдущих задач Data Mining: поиск закономерностей осуществляется не на основе свойств анализируемого объекта, а между несколькими событиями, которые происходят одновременно.

Наиболее известный алгоритм решения задачи поиска ассоциативных правил — алгоритм Apriori. 

Последовательность (Sequence), или последовательная ассоциация (sequential association)

Краткое описание. Последовательность позволяет найти временные закономерности между транзакциями. Задача последовательности подобна ассоциации, но ее целью является установление закономерностей не между одновременно наступающими событиями, а между событиями, связанными во времени (т.е. происходящими с некоторым определенным интервалом во времени). Другими словами, последовательность определяется высокой вероятностью цепочки связанных во времени событий. Фактически, ассоциация является частным случаем последовательности с временным лагом, равным нулю. Эту задачу Data Mining также называют задачей нахождения последовательных шаблонов (sequential pattern).

Правило последовательности: после события X через определенное время произойдет событие Y.

Пример. После покупки квартиры жильцы в 60% случаев в течение двух недель приобретают холодильник, а в течение двух месяцев в 50% случаев приобретается телевизор. Решение данной задачи широко применяется в маркетинге и менеджменте, например, при управлении циклом работы с клиентом (Customer Lifecycle Management).

Прогнозирование (Forecasting)

Краткое описание. В результате решения задачи прогнозирования на основе особенностей исторических данных оцениваются пропущенные или же будущие значения целевых численных показателей. 

Для решения таких задач широко применяются методы математической статистики, нейронные сети и др.

Определение отклонений или выбросов (Deviation Detection), анализ отклонений или выбросов

Краткое описание. Цель решения данной задачи — обнаружение и анализ данных, наиболее отличающихся от общего множества данных, выявление так называемых нехарактерных шаблонов.

Оценивание (Estimation)

Задача оценивания сводится к предсказанию непрерывных значений признака. 

Анализ связей (Link Analysis) — задача нахождения зависимостей в наборе данных.

Визуализация (Visualization, Graph Mining)

В результате визуализации создается графический образ анализируемых данных. Для решения задачи визуализации используются графические методы, показывающие наличие закономерностей в данных.

Пример методов визуализации — представление данных в 2-D и 3-D измерениях. 

Подведение итогов (Summarization) — задача, цель которой — описание конкретных групп объектов из анализируемого набора данных.

Была ли полезна данная статья?
Да
61.19%
Нет
38.81%
Проголосовало: 1108

или напишите нам прямо сейчас:

⚠️ Пожалуйста, пишите в MAX или заполните форму выше.
В России Telegram и WhatsApp блокируют - сообщения могут не дойти.
Написать в MAXНаписать в TelegramНаписать в WhatsApp