- Морские вести России

Совершенствование методов классификации регионов по показателям структуры инвестиций в основной капитал (на примере центральной России)

Транспортное дело России №02 (2008)

С.А. Марков, аспирант ГОУ ДПО ГАСИС

В.А. Титов, к. т. н., доцент РЭА им. Г.В. Плеханова

В нашей публикации [1] был выполнен анализ основных методологических принципов исследования региональных аспектов социально-экономического развития, а также приведены некоторые результаты статистического анализа показателей социально-экономического развития ведущего российского макрорегиона – Центрального Федерального округа. В последующей публикации [2] отмечалось, что в исследовании региональных инвестиционных процессов важное место занимает методы многомерного статистического анализа, в том числе такие эффективные методы многомерной классификации, как различные виды кластерного анализа – иерархического, итеративного. Однако формальное использование многомерных статистических методов в ряде случаев приводит к недостаточно высокому качеству классификации, что выражается в значительной вариабельности показателей кластеризации по выделенным групп (кластерам), которые должны быть достаточно однородными.

Учитывая важность проблемы качества классификации, настоящая публикация посвящена вопросам совершенствования методов многомерной классификации статистических объектов, на примере классификации регионов Центральной России по показателям структуры инвестиций в основной капитал. Такой выбор обусловлен несколькими причинами. Во-первых, ролью инвестиций в основной капитал в развитии региональной экономики. Во-вторых, показатели структуры являются более устойчивыми во временном плане, чем, например, их абсолютные объемы. В-третьих, регионы Центрального Федерального округа более однородны по структуре инвестиций, чем, например, регионы Приволжского или Уральского Федерального округа. Еще одной причиной выбора регионов Центральной России является их число – 18 субъектов Федерации – больше, чем в каком-либо ином макрорегионе.

Существует противоречие между числом групп классифицируемых объектов и степенью однородности классифицируемых объектов внутри групп. Понятно, что с ростом числа групп растет и однородность классифицируемых объектов внутри этих групп. Крайний случай – число групп равно числу объектов – тривиален и представляет собой пример «абсурда» в решении задачи классификации. Другой крайний случай, тоже относящийся к области «абсурда» в решении этой задачи – вся выборка составляет один класс, но этот класс весьма неоднороден. Таким образом, требуется найти компромиссное решение следующей задачи: число групп должно быть как можно меньшим при условии достаточной однородности классифицируемых объектов внутри групп.

Обратимся теперь к вопросу измерения однородности классифицируемых объектов внутри групп, что фактически и определяет качество классификации. В работе [2] предложен следующий критерий однородности кластеров, основанный на известном в статистике правиле «трех сигм»: уровень коэффициента вариации каждого их информативных показателей не должен превышать 33,3%, иначе ставится под вопрос нормальность распределения данного информативного показателя. Поскольку в многомерном случае число информативных показателей больше единицы, показателем качества будет суммарная частость встречаемости однородных кластеров по каждому из информативных показателей.

Другой характеристикой качества классификации является ее устойчивость. Собственно, этим и отличается классификация от многомерной группировки – первая является отражением объективных статистических свойств выборки, вторая всегда более субъективна. Как правило, объективная классификация предполагает применение для этой цели кластерного анализа. Устойчивым является кластерное решение, т.е. число кластеров и отнесение к ним статистических объектов, которое не изменяется при использовании различных методов кластерного анализа [3]. Чаще всего для проверки устойчивости кластерного решения используют два метода кластерного анализа – иерархический и итеративный. С помощью первого метода устанавливается число кластеров и отнесение статистических объектов к кластерам, т.е. получают кластерное решение, которое затем подлежит верификации с помощью итеративного кластерного анализа по методу k-средних, где число кластеров k принимается по результатам иерархического кластерного анализа.

Если отвлечься от вопроса числа групп, то показателем устойчивости кластерного решения, а, следовательно, и качества классификации, будет частость (доля) совпадения отнесения статистических объектов к кластерам по обоим методам.

Приведем пример из области исследования региональных инвестиционных процессов. В работе [4] по результатам иерархического кластерного анализа 33 регионов Центральной России (регионы по данным за 2005 и 2006 годы рассматривались как самостоятельные статистические единицы) получено девятикластерное решение, в котором регионы внутри кластеров различаются по комплексу главных факторов структуры инвестиций в основной капитал не более чем на 20% (аналог правила Парето). Однако по результатам итеративного кластерного анализа выявлено, что некоторые регионы принадлежат различным кластерам, при этом частость совпадения классификаций оказалась недостаточно высокой – 63,6%. Оценка качества классификации по другому показателю – суммарной частости встречаемости однородных кластеров по каждому из информативных показателей – показала, что величина этого показателя однородности также недостаточна: 62,5%, т.е. менее 2/3 кластеров можно считать однородными по правилу «трех сигм».

Как следует из приведенного выше примера, задача совершенствования методики классификации регионов в сфере анализа региональных инвестиционных процессов является весьма актуальной.

Выделим проблемы, общие для задач классификации в региональных исследованиях.

Первое – это объем выборки, который в региональных исследованиях сильно ограничен. Очевидно, что чем больше выборка, тем точнее принимаемые по ней статистические выводы. Определенный шаг в направлении увеличения объема выборки за счет временного фактора реализован в работе [5] – в факторном анализе использовались данные не за один, а за два года. Тем самым выборка регионов Центральной России принципиально ограниченного объема (18 регионов) была увеличена почти в два раза (33 региона с учетом временного фактора), и в связи с этим удалось корректно выполнить факторный анализ достаточно большого числа (двенадцати) исходных компонентов структуры инвестиций (условием корректности факторного анализа является отношение числа статистических объектов к числу исходных показателей не менее двух).

Логичным представляется и следующий шаг – учитывая результаты факторного анализа, кластерный анализ выполнить по новому набору главных факторов, сгруппировав исходные компоненты структуры инвестиций в основной капитал в математически и экономически обоснованные комплексы. Поясним последнее. Одним из результатов факторного анализа, приведенных в работе [5], явилось выявление корреляций главных компонент с исходными компонентами структуры инвестиций в основной капитал. В частности, выявлено, что главная компонента, принятая в качестве первого главного фактора, положительно коррелирует не с одним «главенствующим», а с несколькими исходными компонентами структуры инвестиций – инвестициями в образование; сельское  хозяйство; здравоохранение и предоставление социальных услуг; государственное управление, обеспечение военной безопасности, обязательное социальное обеспечение. Это дает основание считать данный главный фактор «фактором государственного регулирования инвестиций». Представляется, что логичным шагом будет объединение инвестиций в эти коррелирующие между собой виды экономической деятельности.

Следующим логичным шагом представляется включение в измененный набор информативных показателей структуры инвестиций тех исходных компонент, которые в наибольшей мере коррелируют с главными факторами. Информационной базой при этом являются корреляции главных факторов с исходными компонентами отраслевой структуры инвестиций в основной капитал. Для второго главного фактора это – «Финансовая  деятельность», для третьего – «Строительство» и «Транспорт и связь», для четвертого – «Предоставление прочих коммунальных, социальных и персональных услуг» и для пятого – «Операции с недвижимым имуществом, аренда и предоставление услуг» и «Производство и распределение электроэнергии, газа и воды».   

Таким образом, мы приходим к измененному набору исходных компонент структуры инвестиций, в который, наряду с «чистыми» компонентами «Производство и распределение электроэнергии, газа и воды», «Строительство», «Транспорт  и связь», «Финансовая деятельность», «Операции с недвижимым имуществом, аренда и предоставление услуг» и «Предоставление прочих коммунальных, социальных и персональных услуг», включена комплексная «компонента» – «Фактор государственного регулирования инвестиций» – всего семь информативных компонент структуры инвестиций в основной капитал.

Дальнейший анализ проводится по традиционной схеме: вначале осуществляется корреляционный анализ набора из семи информативных компонент структуры инвестиций, затем – факторный анализ для выделения нового набора главных факторов, и в заключение – кластерный анализ.

Поскольку специфические допущения, характерные именно для рассмотренного примера, отсутствуют, полученные на этом примере выводы можно распространить на более широкий круг объектов и рекомендовать следующую блок-схему методики классификации статистических объектов (рис. 1).

Практическая реализация данной блок-схемы к решению задачи классификации регионов Центральной России по комплексу показателей отраслевой структуры показала эффективность предлагаемых усовершенствований. Не вдаваясь в детали проведенного исследования, приведем результаты.

1. Число исходных компонентов структуры инвестиций в основной капитал удалось снизить с 12 исходных до 7 информативных. Это инвестиции в производство и распределение электроэнергии, газа и воды; строительство; транспорт  и связь; финансовую деятельность; операции с недвижимым имуществом, аренду и предоставление услуг; предоставление прочих коммунальных, социальных и персональных услуг, а также комплексная «компонента» – фактор государственного регулирования инвестиций.

2. Удалось снизить размерность признакового пространства: вместо пяти главных факторов, выделенных по результатам факторного анализа, отраслевую структуру отражают четыре главных фактора в составе: фактор государственного регулирования инвестиций; фактор инвестиций в производство и распределение электроэнергии, газа и воды; фактор инвестиций в операции с недвижимым имуществом, аренду и предоставление услуг; фактор инвестиций в предоставление коммунальных и прочих услуг.

3. В результате иерархического кластерного анализа выделены кластеры примерно равных размеров, причем все 10 кластеров включают более одного региона (в среднем по три региона).

4. Хотя в кластерных решениях по иерархическому и итеративному кластерному анализу по-прежнему имеются некоторые отличия, идентичными оказались 23 отнесения из 33 случаев, т.е. надежность отнесения регионов к кластерам, выделенным по предлагаемой методике многомерной классификации, повысилась до 69,7%.

5. В случае многомерной классификации по усовершенствованной методике доля неоднородных кластеров уменьшилась до 35,7%, т.е. налицо улучшение качества классификации регионов Центрального Федерального округа не только по надежности кластерного решения, но и по критерию доли однородных кластеров.

В заключение отметим, что реализация методики не требует специального программного обеспечения и дополнительной подготовки специалистов: все необходимые расчеты и графические построения проводятся с помощью пакета анализа данных SPSS Base, а для выполнения статистических процедур достаточно обладать знаниями информационных технологий и математической статистики в объеме программ высшего экономического образования.

 

Литература:

1. Титов В.А., Марков С.А. Методологические принципы исследования региональных аспектов развития российской экономики // Наука и образование. Новые технологии. Межвуз. сб. науч. трудов. Вып.4 «Общество и экономика». М.: ИИЦ МГУДТ, 2005. С.67-78.

2. Титов В.А., Марков С.А. Методы многомерного анализа в исследовании региональных инвестиционных процессов // Наука и образование. Межвуз. сб. науч. трудов. Вып.№4 «Общество и экономика». М.: ИИЦ МГУДТ, 2006.

3. Олдендерфер М.С., Блэшфилд Р.К. Кластерный анализ // Факторный, дискриминантный и кластерный анализ. М.: Финансы и статистика, 1989.

4. Марков С.А. Инвестиционные процессы в регионах Центральной России: динамика и типология // Вестник Московского экономического института. М.: ИИЦ МЭИ, 2007.

5. Марков С.А. Анализ взаимосвязи показателей структуры инвестиций в основной капитал (на примере регионов Центральной России) // Вестник Московского экономического института. М.: ИИЦ МЭИ, 2008.

 

 


Вернуться к разделу Транспортное дело России №02 (2008)