Приветствие


Проект WebToolGallery представляет собой галерею доступных инструментов для любого человека, который ведет свои блог в сети Интернет. Мы предоставляем, как интересные обзоры шаблонов для Blogger.com и Вордпресс, как и практические советы для любителей Интернет творчества.

суббота, 25 мая 2013 г.

Особенности использования технологий анализа данных

Роль ЭВМ в процессе анализа данных характеризуется двумя аспектами: она служит инструментом для быстрого счета и аккумулятором знаний, потому что компьютерные программы дают возможность использовать знания и умения других людей.

Поэтому использование ЭВМ - это фактически использование накопленного опыта специалистов по анализу данных, умноженного на скорость выполнения рутинной работы. В связи с этим, при построении информационных технологий, знания пользователем методов и приемов анализа данных является чрезвычайно важным.

Анализ данных - это совокупность методов и средств получения из определенным образом организованных данных информации для принятия решений. На сегодняшний день данные, ЭВМ и пользователь лежат в основе анализа данных.

Применение формальных методов анализа данных (или прикладной статистики) не дает должного результата, если не разобраться с тем, как и какие данные можно и нужно вводить в обработку, для чего нужен результат и с ним можно, а чего нельзя делать.

Сегодня можно говорить о новом этапе развития прикладных статистических методов, направленных на исследование природы обрабатываемых данных с позиций определения их реальности и системности.

Реальность предполагает использование предпосылок и сравнение результатов, всегда ориентируясь на единственный критерий истинности. Системность предполагает всестороннее рассмотрение не только самих реальных данных, но и неформальных знаний специалиста предметной области и специалиста по анализу данных, учет внешних факторов и связей объекта исследований и т. д. Таким образом, в настоящее время предпринимаются попытки ликвидировать разрыв между данным формальными и данными реальными с помощью наведения дополнительных связей между действительностью и формализмом машинной обработки.

Дадим краткую характеристику каждого из основных этапов технологии анализа данных.

Первый этап - постановка задачи, является определяющим этапом, от которого зависит весь ход анализа. Начинается он со стадии формулирования цели всего исследования, ради достижения которой и начинается сбор и обработка данных.

Второй этап - является этап, на котором поставленная ​​задача решается на качественном уровне. При качественном анализе объектом исследования является структура данных, а результатом, как правило, - информация о классе моделей, которыми можно описать явление. Поэтому задача состоит в построении проекций данных на различные пары признаков; исследование отдельных признаков и обзор программ для выбора подходящего обеспечения.

Третий этап - этап количественного описания, на котором ведется поиск параметров моделей.

Аппаратом проверки гипотезы, является вычислительный эксперимент с данными.

Вычислительный эксперимент дает возможность испытать различные варианты моделей. Сравнительный анализ помогает отобрать лучшие варианты, имеющие право на существование как формальные результаты экспериментирования, так и содержательно значимая информация о предметной области.

Каждый алгоритм обработки дает один из возможных результатов:

1) все возможные результаты совпадают. Как следует, решение задачи можно считать достигнутым в силу получения единого результата.

2) возможные результаты частично совпадают. В этом случае возможен достоверный результат, то есть общая часть, которую можно анализировать с постепенной интерпретацией в терминах соответствующей предметной области;

3) возможные результаты противоречат друг другу. Это означает, что задача была сформулирована некорректно, ее нужно откорректировать с возможными изменениями как в экспериментальном материале, так и в совокупности алгоритмов, которые при этом используются.

Итак, зафиксированные данные об исследуемом объекте, явлении представляют собой тот первичный фактический материал, требует соответствующей обработки. Тактикой вычислительного эксперимента можно считать сопоставление результатов применения различных алгоритмов обработки.

Информация об авторе не найдена.

Комментариев нет:

Отправить комментарий