Несмотря на то, что сам процесс анализа данных преимущественно технический, доля человеческой деятельности в нем все же присутствует, играя при этом не последнюю роль.
Несмотря на то, что сам процесс анализа данных преимущественно технический, доля человеческой деятельности в нем все же присутствует, играя при этом не последнюю роль.
Анализ информации – это цикличный поток событий. Начинается он с непосредственного изучения потребностей в той области, которая рассматривается. После этого происходит сбор данных из первичных и вторичных источников, их анализ и подготовка отчета.
В результате совершенствования технологий сбора и хранения различных данных, на людей обрушились потоки информации. Теперь, деятельность каждого предприятия, вне зависимости от того коммерческое оно производственное или научное, обязательно сопровождается регистрацией и подробной записью его работы. Поэтому возникла острая необходимость в переработке сырых данных. Современные требования к подобной переработке следующие:
- объем информации неограничен;
- данные разнородны (текстовые, количественные и качественные);
- результаты должны быть понятны и предельно конкретны;
- инструменты для обработки информационных потоков должны быть просто в использовании.
Поскольку традиционная математическая статистика уже давно устарела, все большую популярность стала приобретать такая технология, как Data Mining, которая расшифровывается как «добыча или раскопка данных». В ее основе лежит концепция шаблонов, которые отражают фрагменты многоаспектных взаимоотношений данных. Такие шаблоны являются закономерностями, свойственные подвыборкам, и могут быть вполне компактно выражены в доступной для человека форме. Их поиск осуществляется методами, не имеющими никаких ограничений в виде априорных предложений о структуре выборке, а также виде, в котором будут представлены значения проанализированных показателей.
Больше детальной информации на эту тему можно найти на http://data4people.ru/press_center/stati/segmentaciya-klientov-keys-rfm.