logo
Информационные технологии для менеджеров - Грабауров В

Формализованные данные

Если информация представлена в виде чисел, то, казалось бы, все достаточно просто: нужно ввести данные в компьютер, выбрать соответствующую программу, и пусть компьютер считает. Но нужных данных в чистом виде практически никогда не бывает.

Полезную информацию приходится вылавливать из громадного количества ненужной. Поэтому не случайно, что появившееся новое направление переработки данных в англоязычной литературе называется Data Mining, что означает переработку руды данных.

Полезная информация может быть настолько глубоко спрятана, что возникает опасность так называемых смещенных оценок, когда на исследуемый объект оказывал влияние совсем не тот фактор, на который обращалось внимание. Рассмотрим пример из медицинской области. Известно, что сердечно-сосудистые заболевания связаны с содержанием в организме человека холестерина, наличие которого зависит от количества потребляемых жиров. Но при проведении обследования в одном из небольших американских городов исследователи обнаружили, что население потребляет (по традиции своих европейских предков) больше жиров, чем среднестатистический американец, а сердечно-сосудистых заболеваний у них было значительно меньше. Тщательное обследование показало, что большее влияние на здоровье этих жителей оказывало отсутствие стрессов, присущих жителям крупных городов и оказывающих большее негативное влияние, чем жирная пища.

Информация часто бывает зашумлена, т.е. на исследуемый объект, помимо известных факторов, почти всегда действует ряд неизвестных. Классическим является часто приводимый пример из биологии. В процессе проведения эксперимента исследовалось влияние препарата на поведение подопытных крыс. Дозировка ежедневно менялась, и все условия тщательно фиксировались. В один из дней реакция далеко выходила за прогнозируемые пределы. При повторной проверке она не подтвердилась. И только после длительного расследования удалось установить, что в тот день реакция животных была обусловлена не дозой препарата, а тем, что лаборантка поссорилась со своим кавалером.

Ошибочные прогнозы очень часто встречаются не только в экономике, но и в политике, и в других областях. Не случайно, что у статистики, которая занимается обработкой данных, помимо классического определения "наука о наблюдениях", есть еще два полярных: "бог, который знает все" и "особая форма лжи". Истина где-то посередине, и хотелось бы, чтобы менеджер, с одной стороны, знал о возможностях статистической обработки данных, с другой стороны, понимал, что существует опасность ошибки.

Серьезной проблемой также считается выявление, какая именно информация является полезной.

При наличии достаточно достоверных формализованных данных появляется возможность применения оптимизационных методов нахождения решений с помощью компьютеров.