Пакеты программ для статистического анализа данных мониторинга
Методы статистического анализа реализованы в пакетах прикладных программ, различающихся как по объему и качеству методов, так и по назначению. Их можно разделить на три группы — пакеты базовой статистики, пакеты углубленного статистического анализа и экспертные статистические системы.
Пакеты базовой статистики ориентированы на пользователей, не являющихся специалистами в области статистического анализа. Такие пакеты включают в основном классические методы анализа — расчет простых оценок (например, среднего арифметического), критерии, основанные на статистике Стьюдента (t-тесты), однофакторный дисперсионный анализ и др. В документации приводится подробное описание используемых методов, а пользовательский интерфейс основан на системе меню с максимально возможными подсказками и пояснениями.
Пакеты углубленного статистического анализа ориентированы на специалистов по математической статистике. Такие пакеты (STATISTICA, Systat, SAS, Statgraphics и др.) содержат мощное математическое обеспечение, включающее методы разведочного анализа, факторный и регрессионный анализ, анализ временных рядов и многое другое. Как правило, такие пакеты имеют собственный язык, позволяющий вызывать имеющиеся в пакете статистические процедуры и даже программировать новые. Кроме того, пакеты углубленного статистического анализа имеют очень широкие возможности по визуализации результатов анализа в виде графиков, гистограмм.
Рассмотрим свойства пакета углубленного статистического анализа на примере пакета STATISTICA фирмы StatSoft Inc. (США). Этот пакет достаточно широко распространен в России.
На рис. 6.11 представлен пример обработки данных, которые использовались для тестирования функций и оценки параметров простой линейной регрессии. В левом верхнем окне видны исходные данные. В правом верхнем окне на графике отображены на графике эти данные и зависимость y = 10.259 + 0.187*x.
В нижнем окне показаны результаты обработки с помощью модуля множественной регрессии пакета STATISTICA, которые во многом совпадают с аналогичными результатами, полученными в пакете Excel.
Рис. 6.11. Общий вид экрана при работе с пакетом STATISTICA
STATISTICA представляет собой интегрированную систему статистического анализа и обработки данных. Система состоит из следующих основных компонент:
- подсистемы для работы с данными, которая включает в себя электронные таблицы для ввода и задания исходных данных, а также специальных таблиц для вывода численных результатов анализа и модуля управления данными. Для статистической обработки чрезвычайно больших массивов данных имеется специальный инструмент Менеджер мегафайлов, который может быть использован и для предварительной обработки данных перед вводом их непосредственно в электронную таблицу STATISTICA;
- мощной графической системы для визуализации данных и результатов статистического анализа;
- набора статистических модулей, в которых собраны группы логически связанных между собой статистических процедур. В любом конкретном модуле можно выполнить определенный способ статистической обработки, не обращаясь к процедурам из других модулей;
- подсистемы подготовки отчетов. При помощи текстового редактора, встроенного в систему, можно готовить полноценные отчеты. В STATISTICA также имеется возможность автоматического создания отчетов;
- встроенных языков SCL и STATISTICA BASIC, которые позволяют автоматизировать рутинные процессы обработки данных в системе.
Пакет STATISTICA включает следующие основные модули:
- модуль основных статистик и таблиц, включающий процедуры для описательные статистики, группировки, разведочного анализа, оценки корреляции и т.п.,
- модули «Множественная регрессия», «Дисперсионный анализ», «Дискриминантный анализ», «Непараметрическая статистика»,
«Факторный анализ», «Многомерное шкалирование», «Анализ надежности», «Кластерный анализ», «Логлинейный анализ», «Нелинейное
оценивание» и др.
Формальное применение статистических методов без тщательного анализа их пригодности для обработки конкретного типа данных приводит к неверным результатам. Это обусловлено сложностью задач обработки данных при исследовании природной среды.
Первое поколение статистических экспертных систем было ориентировано на подготовленного пользователя. Многие из методов, отработанных при создании таких систем, широко используются в разрабатываемых в последнее время проблемно-ориентированных пакетах (специализированных пакетов для статистического анализа). Особенность таких пакетов в том, что они используют терминологию и критерии, принятые в какой-либо конкретной области знания. Такие пакеты помогают пользователю уточнить цель исследования, выбрать наиболее подходящий метод обработки, подобрать математическую модель.
6.4.
Еще по теме Пакеты программ для статистического анализа данных мониторинга:
- Ковалева Г.Д., Ростовцев П.С.. Анализ социологических данных с применением статистического пакета SPSS, 2002
- Статистические экспертные системы для обработки данных экологического мониторинга
- Некоторые виды статистического анализа в пакете STATISTICA
- Анализ данных в информационной системе мониторинга государственных услуг
- 6.4. Прогнозирование на основе временных рядов с использованием пакета программ для персональных ЭВМ
- Статья 1296. Программы для ЭВМ и базы данных, созданные по заказу
- НЕКОТОРЫЕ АСПЕКТЫ СУДЕБНОЙ ЗАЩИТЫ ПРАВ АВТОРОВ ПРОГРАММ ДЛЯ ЭВМ И БАЗ ДАННЫХ В РОССИИ
- Статистические программы
- Статистическая обработка данных
- Важность ввода хороших данных для анализа
- Ведение базы данных и статистическая обработка материала
- 3.5.1. Планирование размещения пакетов прикладных программ
- Обработка данных экологического мониторинга
- Разработка программы мониторинга
- Изучение статистических данных
- 2.3 Программа статистического моделирования «REGMOD»