Совокупность однородная. Комплексный анализ статистических данных о предприятиях автомобильного транспорта тюменской области Генеральная совокупность и выборка из нее

Статистическая совокупность - это множество единиц, обладающих массовостью, однородностью, определенной целостностью, взаимозависимостью состояния отдельных единиц и наличием вариации. Например, в качестве особых объектов статистического исследования, т. е. статистических совокупностей, может выступать множество коммерческих банков, зарегистрированных на территории РФ, множество акционерных обществ, множество граждан какой-либо страны и т. д. Важно помнить, что статистическая совокупность состоит из реально существующих материальных объектов. Каждый отдельно взятый элемент данного множества называется единицей статистической совокупности. Единицы статистической совокупности характеризуются общими свойствами, именуемыми в статистике признаками, т. е. под качественной однородностью совокупности понимается сходство единиц (объектов, явлений, процессов) по каким-либо существенным признакам,но различие по каким-либо другим признакам.

2. Признаки и их классификация. Признак – это объективная характеристика единицы статистической совокупности, характерная черта или свойство, которое может быть определено или измерено. Признаки подразделяются на количественные и качественные, а последние, в свою очередь, на альтернативные, атрибутивные и порядковые.

Количественным является признак, отдельные варианты которого имеют числовое выражение и отражают размеры, масштабы изучаемого объекта или явления. Альтернативным называется признак, имеющий только два варианта значений. В отличие от альтернативного атрибутивный признак имеет более двух вариантов, которые при этом выражаются в виде понятий или наименований. Порядковые признаки отличаются от атрибутивных тем, что они имеют несколько ранжированных, т.е. упорядоченных по возрастанию или убыванию, качественных вариантов.

5. Метод статистики. Статистика как наука выработала приемы и способы изучения массовых общественных явлений,зависящие от особенностей ее предмета и задач, которые ставятся при его изучении. Приемы и способы, с помощью которых статистика изучает свой предмет, образуют, статистическую методологию. Под статистической методологией понимается система приемов, способов и методов, направленных на изучение количественных закономерностей, проявляющихся в структуре, динамике и взаимосвязях социально-экономических явлений.

3.Статистический показатель представляет собой количественную характеристикусоциально-экономических явлений и процессов в условиях качественной определенности.

Система статистических показателей – это совокупность взаимосвязанных показателей, имеющая одноуровневую или многоуровневую структуру и нацеленная на решение конкретной статистической задачи. В отличие от признака статистический показатель получается расчетным путем.

Конкретный статистический показатель характеризует размер, величину изучаемого явления или процесса в данном месте и в данное время

Показатель-категория отражает сущность, общие отличительные свойства конкретных статистических показателей одного и того же вида без указания места, времени и числового значения. Все статистические показатели по охвату единиц совокупности разделяются на индивидуальные и сводные, а по форме выражения – на абсолютные, относительные и средние.

Индивидуальные показатели характеризуют отдельный объект или отдельную единицу совокупности – предприятие, фирму, банк, домохозяйство и т. п. Сводные показатели в отличие от индивидуальных характеризуют группу единиц,представляющую собой часть статистической совокупности или всю совокупность в целом. Эти показатели, в свою очередь, подразделяются на объемные и расчетные.Объемные показатели получают путем сложения значений признака отдельных единиц совокупности. Расчетные показатели , вычисляемые по различным формулам, служат для решения отдельных статистических задач анализа – измерения вариации, характеристики структурных сдвигов, оценки взаимосвязи и т. д. В зависимости от принадлежности к одному или двум объектам изучения различают однообъектные и межобъектные показатели . С точки зрения пространственной определенности статистические показатели подразделяются на общетерриториальные , характеризующие изучаемый объект или явление в целом по стране, региональные и местные (локальные) , относящиеся к какой-либо части территории или отдельному объекту.

4. Статистическая закономерность. Закон больших чисел. Статистическая закономерность - это форма проявления причинной связи, выражающаяся в последовательности,регулярности,повторяемости событий с достаточно высокой степенью вероятности, если причины (условия), порождающие события, не изменяются или изменяются незначительно.Статистическая закономерность устанавливаемая на основе анализа массовых данных возникает в результате действия объективных законов, выражая каузальные отношения.Так как статистическая закономерность обнаруживается в итоге массового статистического наблюдения, это обусловливает ее взаимосвязь с законом больших чисел. Сущность закона больших чисел заключается в том, что в числах, суммирующих результат массовых наблюдений, выступают определенные правильности, которые не могут быть обнаружены на небольшом числе факторов.Закон больших чисел порожден свойствами массовых явлений. Важно помнить, что тенденции и закономерности, вскрытые с помощью закона больших чисел, имеют силу лишь как массовые тенденции, но не как законы для каждого отдельного, индивидуального случая.

9. Формы статистического наблюдения выделяются на основе их наиболее общих организационных особенностей. В отечественной статистике по этому признаку выделяют три основные формы наблюдения: отчетность, специальное (специально организованное) наблюдение и регистры.

Виды статистического наблюдения классифицируются чаще всего по следующим трем признакам:

а) охвату наблюдением единиц совокупности, подлежащих статистическому исследованию; б) систематичности наблюдения;

в) источнику сведений, на основании которого устанавливаются факты, подлежащие регистрации в процессе наблюдения.

По первому признаку выделяют сплошное наблюдение, когда наблюдению подвергаются все без исключения единицы совокупности, и несплошное, при юмором сведения собирают не о всех единицах совокупности, а только некоторой части их, отобранной определенным образом. Несплошное наблюдение, в свою очередь, подразделяют на выборочное, основного массива, монографическое. Различие между этими видами заключается в способе отбора тех единиц, которые должны быть подвергнуты наблюдению. По признаку систематичности наблюдения различают непрерывное, или текущее, и прерывное наблюдение, Последнее подразделяют на периодическое и единовременное. Текущее - это наблюдение, которое проводится постоянно; факты, подлежащие регистрации, фиксируются по мере их возникновения (например, регистрация браков и разводов). Прерывное проводится с перерывами, время от времени. Если оно проводится строго регулярно, т. е. через равные промежутки времени, оно называется периодическим, если же такой регулярности нет, то оно называется единовременным.

По источнику сведений различают наблюдение непосредственное, когда факты, подлежащие регистрации, устанавливаются лицами, проводящими наблюдение (путем замера, подсчета числа каких-либо предметов и т. п.), документированное, при котором необходимые сведения берутся из соответствующих документов, и опрос, особенность которого состоит в том, что сведения фиксируются со слов опрашиваемого.

10.Программно-методологически вопросы. Каждый объект состоит, как правило, из многих элементов или единиц, его составляющих. Тот элемент объекта, который является носителем признаков, подлежащих регистрации, называется единицей наблюдения. Определяя единицу конкретного статистического наблюдения, нужно как можно точнее ее охарактеризовать, указав специфические черты, которые позволили бы легче отличить ее от близких к ней по виду единиц других объектов, например при демографических обследованиях единицей наблюдения может быть человек, но может быть и семья; при бюджетном обследовании - семья или домашнее хозяйство.

Программа наблюдения получает свое воплощение в перечне вопросов, ответы на которые нужно получить в процессе наблюдения. Вопросы программы наблюдения фиксируются в

формуляре (бланке) наблюдения. Очень важно, чтобы вопросы были сформулированы ясно и по возможности наиболее кратко. Для этого при выполнении упражнения нужно привести различные возможные формулировки вопроса. Целесообразно ознакомиться с формулировками вопросов в формулярах, в которых собирают сведения наши статистические учреждения (бланки форм отчетности переписей и т. п.).

Конструируя формуляр наблюдения по условиям нижеприводимых задач, следует обосновать выбор той или иной его формы. При этом надо учитывать объем программы наблюдения, способ проведения наблюдения и способ обработки данных, записанных в формулярах в процессе наблюдения. Формуляры могут предназначаться для записи данных об одной единице наблюдения (индивидуальная форма, иначе бланк-карточка) или нескольких (списочная форма, бланк-список). Надо помнить, что применение списочной формы бланка возможно лишь при относительно небольшой программе и только при экспедиционном способ наблюдения.

11. Погрешности, появляющиеся в процессе наблюдения, называются ошибками наблюдения. Все погрешности, возникающие при сплошном наблюдении, называются ошибками регистрации.

В программе наблюдения могут быть поставлены контрольные вопросы, ответы на которые разрабатываться не будут. В процессе регистрации такие вопросы помогают уточнить ответы на другие вопросы, а в последующем с их помощью произвести проверку данных наблюдения.При несплошном наблюдении, в частности выборочном, могут возникать специфические ошибки, называемые ошибками репрезентативности. Они появляются в силу того, что наблюдение является несплошным. После получения статистических формуляров следует провести проверку полноты и качеств собранных данных. Контроль полноты - это проверка того, насколько полно охвачен объект наблюдением, иначе говоря, о всех ли единицах наблюдения собраны сведения. Контроль качества материала осуществляется с помощью логического и арифметического контроля.

13.Сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. По глубине и точности обработки материала различают сводки простую и сложную. Простая сводка - это операция по подсчету общих итогов по совокупности единиц наблюдения. Сложная сводка - это комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц. Группировкой называется разделение единиц изучаемой совокупности на однородные группы по определенным, существенным для них признакам. Типологическая группировка - это разделение качественно неоднородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений. Таким образом, основная задача такой группировки - это идентификация типов социально-экономических явлений, поэтому важное значение при ее построении должно уделяться выбору группировочного признака.

Структурная группировка - это выявление закономерностей распределения единиц однородной совокупности по варьирующим значениям исследуемого признака. Она позволяет изучить структуру совокупности и происходящих в ней сдвигов. Надобность в таких группировках возникает потому, что однородность однокачественных явлений, элементов, входящих в статистическую совокупность, отнюдь не означает их тождественности. Структурные группировки отличаются от типологических не столько по внешнему виду, сколько по целям, т. е. отличаются по уровню качественных различий между группами.Аналитическая группировка - это исследование взаимосвязей варьирующих признаков в пределах однородной совокупности. При ее построении можно установить взаимосвязи между двумя признаками и более. При этом один признак будет результативным, а другой (другие) факторным.

14.Группировкой называется разделение единиц изучаемой совокупности на однородные группы по определенным, существенным для них признакам. Группировка в статистическом анализе выполняет следующие определенные функции:

Выделение социально-экономических типов явлений;

Изучение структуры и структурных сдвигов, происходящих в социально-экономических явлениях;

Анализ взаимосвязей между явлениями.

15. Ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку.

Атрибутивным называют ряд распределения, построенный по качественным признакам, не имеющим числового выражения. Вариационным рядом называют ряд распределения, построенный по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, т. е. конкретное значение варьирующего признака. Частотами называются численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу.В зависимости от характера вариации признака различают дискретные и интервальные ряды.

16. Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Полигон используется при изображении дискретных вариационных рядов. Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот. Полученные на пересечении абсцисс и ординат точки соединяют прямыми линиями и получают ломаную линию, называемую полигоном частот. Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенными на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам. В результате мы получим на графике гистограмму, где ряд распределения изображен виде смежных друг с другом столбиков.Если середины верхних сторон прямоугольников соединить прямыми, то гистограмма может быть преобразована в полигон распределения. Для графического изображения вариационных рядов может использоваться также кумулятивная кривая. При построении кумулятивной кривой по интервальному вариационному ряду на оси абсцисс откладываются варианты ряда, а на оси ординат - накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, т. е. кумулятивную кривую.

17. Статистической называется таблица , которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа. Статистическая таблица содержит три вида заголовков: общий, верхние и боковые. Общий заголовок отражает содержание всей таблицы (к какому месту и времени она относится), располагается над макетом таблицы по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) – строк. Они являются внутренними заголовками. Остов таблицы, заполненный заголовками, образует макет таблицы; если на пересечении граф и строк записать цифры, то получается полная статистическая таблица. Подлежащим статистической таблицы называется объект, который характеризуется цифрами. Это может быть одна или несколько совокупностей, отдельные единицы совокупности в порядке их перечня или сгруппированные по каким-либо признакам, территориальные единицы и так далее. Обычно подлежащее таблицы дается в левой части, в наименовании строк.

Сказуемое статистической таблицы образует система показателей, которыми характеризуется объект изучения, то есть подлежащее таблицы. Сказуемое формирует верхние заголовки и составляет содержание граф с логически последовательным расположением показателей слева направо.

18. Разработка подлеж и сказ. Подлежащим статистической таблицы называется объект, который характеризуется цифрами. Это может быть одна или несколько совокупностей, отдельные единицы совокупности в порядке их перечня или сгруппированные по каким-либо признакам, территориальные единицы и так далее. Обычно подлежащее таблицы дается в левой части, в наименовании строк. Сказуемое статистической таблицы образует система показателей, которыми характеризуется объект изучения, то есть подлежащее таблицы. Сказуемое формирует верхние заголовки и составляет содержание граф с логически последовательным расположением показателей слева направо.При простой разработке сказуемого показатель, определяющий его, не подразделяется на подгруппы и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно, независимо друг от друга. Сложная разработка сказуемого предполагает деление признака, формирующегоего, на подгруппы. При этом получается более полная и подробная характеристика объекта. Здесь оба признака сказуемого тесно связаны друг с другом. То есть, при сложной разработке сказуемого явление или объект могут быть охарактеризованы различной комбинацией признаков, формирующих их.

19. Групповыми называются статистические таблицы , подлежащее которых содержит группировку единиц совокупности по одному количественному или атрибутивному признаку. Простейшим видом групповых таблиц являются ряды распределения. Групповая таблица может быть более сложной, если в сказуемом дополнительно приводятся ряд показателей, характеризующих группы подлежащего. Комбинационными называются статистические таблицы, подлежащее которых содержит группировку единиц совокупности одновременно по двум и более признакам: каждая из групп, построенная по одному признаку, разбивается, в свою очередь, на подгруппы по какому-либо другому признаку и так далее.

1. Таблица должна быть компактной и содержать только те данные, которые непосредственно отражают исследуемое явление в статике и динамике и необходимы для познания его сущности. Цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху вниз;

2. Заголовок таблицы и названия граф и строк должны быть четкими, краткими. Названия таблицы, граф и строк пишутся полностью, без сокращений.

3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой.

4. Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то необходимо им присвоить объединяющий заголовок.

5. Графы и строки полезно нумеровать.

6. Взаимосвязанные данные, характеризующие одну из сторон анализируемого явления целесообразно располагать в соседних друг с другом графах.

7. Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям.

8. Числа целесообразно, по возможности, округлять.

9. Отсутствие данных об анализируемом социально-экономическом явлении может быть обусловлено различными причинами и это по-разному отмечается: а) если данная позиция вообще не подлежит заполнению, то ставится знак «Х»;б) если по какой-либо причине отсутствуют сведения, то ставится многоточие «...» или «нет свед.»; в) если явление отсутствует полностью, то клетка заполняется тире (–)г) для отображения очень малых чисел используют обозначения (0,0) или (0,00).

10. В случае необходимости дополнительной информации – разъяснений к таблице, могут даваться примечания.

20. Графический образ (основа графика) – это геометрические знаки, то есть сово-

купность точек, линий, фигур, с помощью которых изображаются статистические показа-

тели. Важно правильно выбрать графический образ, который должен соответствовать це-

ли графика и способствовать наибольшей выразительности изображаемых статистических

данных. Экспликация графика – словесное описание его содержания. Оно включает в се-

бя общий заголовок графика, подписи вдоль масштабных шкал и пояснения к отдельным

частям графика.

Заголовок графика должен в краткой и ясной форме отражать основное содержание

(тему) данных, изображенных на графике. Пространственные ориентиры графика задаются в виде системы координатных

сеток. Системы координат бывают прямолинейные (декартовые) и криволинейные. Для

построения графиков используется обычно только первый и, изредка, первый и четвертый

квадранты.

Масштаб статистического графика – это мера перевода чи-

словой величины в графическую. Масштабы выбирают так, чтобы на графике ясно выступало различие изображаемых

величин, но в то же время не терялась возможность их сравнения. Масштабной шкалой называется линия, отдельные точки которой могут быть прочита-

ны как определённые числа. Поле графика – то пространство, в котором размещаются образующие график

геометрические знаки. Например, лист бумаги, на котором располагается график, должен быть пропор-

циональным.

21. Наиболее распростра-

нённым видом таких диаграмм являются столбиковые диаграммы. Они представляют

собой график, в котором различные величины представлены расположенными в высоту

прямоугольниками («столбиками») одинаковой или разной высоты. Если прямоугольники, изображающие показатели, расположить не по вертикали, а

по горизонтали, то диаграмма получит название ленточной.

Иногда разница между наименьшими и наибольшими значениями сравниваемых

данных настолько велика, что установление подходящего масштаба для столбиков или

полос оказывается затруднительным. В этих случаях вместо столбиковой (полосовой)

диаграммы целесообразно применить плоскостную (двухмерную) диаграмму – квадрат-

ную или круговую. Принцип построения этих диаграмм заключается в том, что величины

сравниваемых данных изображаются площадями квадратов или кругов. Диаграммы, предназначенные для популяризации, иногда строятся в виде стан-

дартных фигур-рисунков, характерных для изображаемых статистических данных, что де-

лает диаграмму более выразительной, привлекает к ней внимание. Такие диаграммы на-

зываются фигурными или изобразительными. Для графического изображения трех взаимосвязанных показателей, один из кото-

рых равен произведению двух других, российский статистик проф. В.Е.Варзар предложил

использовать прямоугольную диаграмму, названную им «статистическим знаком». В на-

стоящее время такие диаграммы часто называют знаком Варзара. Вторую большую группу показательных графиков составляют структурные диа-

граммы. Это такие диаграммы, в которых отдельные статистические совокупности сопос-

тавляются по их структуре, характеризующейся соотношением разных параметров сово-

купности или ее отдельных частей. Секторные диаграммы удобно строить следующим образом: вся величина явле-

ния принимается за сто процентов, рассчитываются доли отдельных частей в процентах.

Круг разбивается на секторы пропорционально частям изображаемого целого. Другим видом структурных статистических диаграмм являются диаграммы удель-

ных весов, отражающие структуры сравниваемых совокупностей по процентному соот-

ношению в них отдельных частей, выделяемых по тому или иному количественному или

атрибутивному признаку. Для изображения и внесения суждений о развитии явления во времени строятся

диаграммы динамики. В рядах динамики используются для наглядного изображения явле-

ний многие диаграммы: столбиковые, ленточные, квадратные, круговые, линейные, ради-

альные и другие. Выбор вида диаграмм зависит в основном от особенностей исходных

данных, от цели исследования. Карты статистические представляют собой вид графических изображений стати-

стических данных на схематичной географической карте, характеризующих уровень или

степень распространения того или иного явления на определенной территории. Картограмма – это схематическая географическая карта, на которой штриховкой

различной густоты, точками или окраской различной степени насыщенности показывается

сравнительная интенсивность какого-либо показателя в пределах каждой единицы нане-

сенного на карту территориального деления (например, плотность населения по областям

или республикам, распределение районов по урожайности зерновых культур и т.п.). Кар-

тограммы делятся на фоновые и точечные.

Картограмма фоновая – вид картограммы, на которой штриховкой различной

густоты или окраской различной степени насыщенности показывают интенсивность како-

го-либо показателя в пределах территориальной единицы. Картограмма точечная – вид

картограммы, где уровень какого-либо явления изображается с помощью точек. Точка

изображает одну единицу совокупности или некоторое их количество, чтобы показать на

географической карте плотность или частоту появления определенного признака.

23. Сред ариф величина-такое значение признака на единицу совокупности при вычислении которого,общий V признаков совокупности остается неизменным.

Средняя гармоническая взвешенная используется, когда известен числитель ис-

ходного соотношения средней, но неизвестен его знаменатель.

Средняя геометрическая. Наиболее широкое применение этот вид средней получил в анализе динамики для

определения среднего темпа роста

Средняя квадратическая. Наиболее широко этот вид средней используется при расчете показателей вариации.

Среднее линейное отклонение вычисляется,чтобы учесть различие всех единиц исследуемой совокупности:

22. Индивидуальные абсолютные показатели , как правило, получают непосредственно

в процессе статистического наблюдения как результат замера, взвешивания, подсчета и

оценки интересующего количественного признака. Сводные абсолютные показатели , характеризующие объем признака или объем

совокупности как в целом по изучаемому объекту, так и по какой-либо его части, получа-

ют в результате сводки и группировки индивидуальных значений. зависимости от социально-экономической сущности исследуемых явлений, их

физических свойств они выражаются в натуральных, стоимостных или трудовых еди-

ницах измерения. Относительный показатель представляет собой результат деления одного абсолют-

ного показателя на другой и выражает соотношение между количественными характери-

стиками социально-экономических процессов и явлений. Поэтому, по отношению к абсо-

лютным показателям, относительные показатели или показатели в форме относительных

величин являются производными, вторичными. Относительные показатели могут выражаться в коэффициентах, процентах, про-

милле, продецимилле или быть именованными числами. Относительный показатель динамики (ОПД) представляет собой отношение

уровня исследуемого процесса или явления за данный период времени (по состоянию на

данный момент времени) к уровню этого же процесса или явления в прошлом:

Различают относительные показатели динамики с постоянной и переменной базой

сравнения. Относительные показатели плана и реализации плана. Первый из этих показателей характеризует относительную высоту планового уров-

ня, т.е. во сколько раз намечаемый объемный показатель превысит достигнутый уровень

или сколько процентов от этого уровня составит. Второй показатель отражает фактиче-

ский объем производства или реализации в процентах или коэффициентах по сравнению с

плановым уровнем.

Относительный показатель структуры представляет собой соотношение струк-

турных частей изучаемого объекта и их целого:

Относительный показатель координации представляет собой отношение одной

части совокупности к другой части этой же совокупности:

Относительный показатель интенсивности характеризует степень распростра-

нения изучаемого процесса или явления и представляет собой отношение исследуемого

показателя к размеру присущей ему среды:

Относительный показатель сравнения представляет собой соотношение одно-

именных абсолютных показателей, характеризующих разные объекты

24. Мода представляет собой значение изучаемого признака,

повторяющееся с наибольшей частотой. Медианой называется значение признака, прихо-

дящееся на середину ранжированной (упорядоченной) совокупности.

По несгруппированным данным: Мода – наиболее часто встречающееся значение;Медиана – нумеруем значения от 0 до N,то медиана при четном N – между х с номерами 0,5N и 0,5N+1,при нечетн N,медиана соответ х с номером 0,5(N+1).

по сгруппированным данным:

номер медианной единицы ряда:

Хо - нижняя граница модального интервала (модальным назы-

вается интервал, имеющий наибольшую частоту);

i - величина модального интервала;

fМо - частота модального интервала;

fМо-1 - частота интервала, предшествующего модальному;

fМо+1 - частота интервала, следующего за модальным.

Хо - нижняя граница медианного интервала (медианным назы-

вается первый интервал, накопленная частота которого

превышает половину общей суммы частот);

i - величина медианного интервала:

Sme-1 - накопленная частота интервала, предшествующего

медианному;

fMe - частота медианного интервала.

25. размах вариации. Он представляет собой разность максимального и минималь-

ного значений признака:

R = X max – X min

дисперсия, рассчитываемый как

средний квадрат отклонений значений признака от их средней величины.

Для сравнения разных совокупностей с точки зрения устойчивости ка-

кого-либо одного признака или для определения однородности совокупности рассчиты-

вают относительные показатели.

Коэффициент осцилляции:

Линейный коэффициент вариации (d V ):

Наиболее распространенным показателем является коэффициент вариации:

26. Общая дисперсия характеризует вариацию признака по всей совокупности как ре-

зультат влияния всех факторов, определяющих индивидуальные различия единиц сово-

купности.

Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием

фактора, положенного в основу группировки.

Средняя из внутригрупповых дисперсий отражает ту часть вариации результа-

тивного признака, которая обусловлена действием всех прочих неучтенных факторов,

кроме фактора, по которому осуществлялась группировка.

Взаимосвязь между тремя видами дисперсий получила название правила сложения

дисперсий.

27. Теснота связи между факторным и результативным признаками оценивается на ос-

нове эмпирического корреляционного отношения:

мера ассиметричности: коэф ассиметрии Пирсона

Ка=0 – ряд распределения симметричен,Ка>0 скошенность ряда правостроняя,Ка<0 – левостроняя.

При оценке крутизны рассчитывается коэф эксцесса:

28. Выборочным наблюдением называется такое несплошное обследование, при ко-

тором признаки регистрируются у отдельных единиц изучаемой статистической совокуп-

ности, отобранных с использованием специальных методов, а полученные в процессе об-

следования результаты с определенным уровнем вероятности распространяются на всю

исходную совокупность. Генеральной совокупностью называется вся исходная изучаемая статистическая

совокупность, из которой на основе отбора единиц или групп единиц формируется сово-

купность выборочная. Поэтому генеральную совокупность также называют основой вы-

ральную. Систематические ошибки репрезентативности связаны с нарушением принци-

пов формирования выборочной совокупности. Случайные ошибки репрезентативности обусловлены действием случайных

факторов, не содержащих каких-либо элементов системности в направлении воздействия

на рассчитываемые выборочные характеристики. Отбор единиц из генеральной совокупности может быть комбинированным, много-

ступенчатым и многофазным.

Комбинированный отбор предполагает объединение нескольких видов выборки. Многоступенчатым называется отбор, при котором из генеральной совокупности

сначала извлекаются укрупненные группы, потом – более мелкие и так до тех пор, пока не

будут отобраны те единицы, которые подвергаются обследованию.

Многофазная выборка, в отличие от многоступенчатой, предполагает сохранение

одной и той же единицы отбора на всех этапах его проведения; при этом отобранные на

каждой стадии единицы подвергаются обследованию, каждый раз – по более расширенной

программе. Собственно-случайная выборка заключается в отборе единиц из генеральной сово-

купности в целом, без разделения ее на группы, подгруппы или серии отдельных единиц.

При этом единицы отбираются в случайном порядке, не зависящем ни от последователь-

ности расположения единиц в совокупности, ни от значений их признаков. Механическая выборка может быть применена в тех случаях, когда генеральная

совокупность каким-либо образом упорядочена, т.е. имеется определенная последова-

тельность в расположении единиц (табельные номера работников, списки избирателей,

телефонные номера респондентов, номера домов и квартир и т.п.). Типический отбор целесообразно использовать в тех случаях, когда все единицы

генеральной совокупности объединены в несколько крупных типических групп. Сущность серийной выборки заключается в собственно-случайном либо механиче-

ском отборе групп единиц (серий), внутри которых производится сплошное обследование.

29. Ошибки репрезентативности обусловлены тем обстоятельством, что выборочная

совокупность не может по всем параметрам в точности воспроизвести совокупность гене-

ральную. Получаемые расхождения или ошибки репрезентативности позволяют заклю-

чить, в какой степени попавшие в выборку единицы могут представлять всю генеральную

совокупность. При этом следует различать систематические и случайные ошибки репре-

зентативности. Систематические ошибки репрезентативн

Для которой характерны принадлежность составных ее элементов к одному и тому же типу явления и сходство между элементами по существенным для данного исследования признакам.

Словарь бизнес-терминов. Академик.ру . 2001 .

Смотреть что такое "Совокупность Однородная" в других словарях:

СОВОКУПНОСТЬ, ОДНОРОДНАЯ - статистическая совокупность, для которой характерно принадлежность составных ее элементов к одному и тому же типу явления и сходство между элементами по существенным для данного исследования признакам. Статистическая совокупность может быть по… … Большой экономический словарь

Совокупность объектов или явлений общественной жизни, объединённых общей связью, но различающихся по ряду варьирующих признаков. Эти объекты или явления представляют собой элементы (единицы) С. с. Так, С. с. будет население, элементами… … Большая советская энциклопедия

однородная совокупность - (напр. ядерных энергетических установок) [А.С.Гольдберг. Англо русский энергетический словарь. 2006 г.] Тематики энергетика в целом EN homogeneous population … Справочник технического переводчика

Относительно однородная группа объектов или явлений, характеризующаяся наличием некоторых общих признаков и подвергающаяся изучению путем сбора количественных данных, их обработки и анализа … Большой медицинский словарь

множество - ▲ , совокупность однородный множество совокупность объектов, имеющих к л. общую характеристику; однородная совокупность; совокупность видов; неупорядоченная совокупность однородных попарно различных элементов; оно включает все такие элементы;… … Идеографический словарь русского языка

Слово «статистика» имеет латинское происхождение (от status , что означает «определенное положение вещей» – состояние). В средние века оно использовалось для характеристики политического состояния государства и употреблялось в значении слова «государствоведение», (Готфрид Ахенваль, XVIII в., Германия). Как наука статистика возникла только в XVII в., когда правительства различных западноевропейских стран стали заниматься сбором разного рода информации о своих гражданах. Однако статистический учет существовал уже в глубокой древности, упоминания о статистических обследованиях встречаются и в библейские времена.

Еще за 5 тыс. лет до н.э. проводились переписи населения в Китае, велся учет имущества граждан в Древнем Риме, использование средней было хорошо известно еще при жизни Пифагора. В средние века осуществлялось сравнение военного потенциала разных стран, численности их населения, домашнего имущества, земель.

У истоков статистической науки стояли две школы – немецкая описательная и английская школа политических арифметиков.

Представители описательной школы (Г. Конринг (1606-1661), Г. Ахенваль (1719-1772), А. Бюшинг (1724-1793) и др. считали, что задачей статистики является описание достопримечательностей государства: территории, населения, климата, вероисповедания, ведения хозяйства и т. п. – только в словесной форме, без цифр и вне динамики, т. е. без отражения особенностей развития государств в те или иные периоды, а только лишь на момент наблюдения. Они были «политические арифметики», которые ставили целью изучать общественные явления с помощью числовых характеристик – меры веса и числа. Политические арифметики видели основное назначение статистики в изучении массовых общественных явлений, осознавали необходимость учета в статистическом исследовании требований закона больших чисел, поскольку закономерность может проявиться лишь при достаточно большом объеме анализируемой совокупности. Виднейшим представителем и основателем этого направления был В. Петти (1623-1687). Именно школа политических арифметиков стала основообразующей в развитии современной статистики.

В XIX в. получило развитие учение бельгийского статистика Адольфа Кетле (1796-1874), который первым применил современные методы сбора данных, его считают основоположником учения о средних величинах. Математическое направление в статистике развивалось в работах англичан – сэра Фрэнсиса Гальтона (1822-1911) и Карла Пирсона (1857-1936), Рональда Фишера, которые внесли значительный вклад в развитие теории корреляции и оказали существенное воздействие на современную статистику. * Примечание. Знаком (*) отмечены издания, на основании которых составлен тематический обзор.

Прогрессу статистической методологии способствовали труды российских статистиков – А.А. Чупрова (1874-1926), B.C. Немчинова (1894-1964), С.Г. Струмилина (1877 – 1974), В.Н. Старовского (1905-1975) и др.

Развитие статистической науки, расширение сферы практической статистической работы привели к изменению содержания самого понятия «статистика». В настоящее время данный термин употребляется в трех значениях:

Во-первых , под статистикой понимают отрасль практической деятельности, которая имеет своей целью сбор, обработку, анализ и публикацию массовых данных о различных явлениях общественной жизни. Осуществляется сбор данных в каждом регионе и по стране в целом о численности и составе населения, ведется подсчет предприятий и организаций, собираются данные об объемах производства и объемах продаж и т.д. Эту деятельность на профессиональном уровне осуществляет Федеральная служба государственной статистики (Госкомстат РФ) и система ее учреждений, организованных, по административно-территориальному признаку, например, Ростовский областной комитет государственной статистики или Таганрогский межрайоннный отдел государственной статистики и т. д.

Во-вторых , статистикой называют цифровые материалы, служащие для характеристики какой-либо области общественных явлений или территориального распределения какого-то показателя, публикуемые в периодической прессе, справочниках, сборниках. Например, динамика цены на бензин в Ростовской области представленная за летние месяцы текущего года.

В-третьих , статистикой называется отрасль знания, особая научная дисциплина, которая в широком понимании разрабатывает методы сбора, систематизации, анализа, интерпретации и отображения результатов наблюдений массовых случайных явлений и процессов целью выявления существующих в них закономерностей. Например, исследования взаимосвязи между качеством трудовых ресурсов и экономическим ростом в регионах РФ.

Итак, статистика – это вид научно-практической деятельности, направленной на получение, обработку, анализ и хранение информации, характеризующей количественные закономерности жизни общества во всём ее многообразии в неразрывной связи с её качественным содержанием.

Если рассматривать статистику как инструмент изучения социально-экономических явлений и процессов, то предмет статистики состоит в изучении размеров и количественных соотношений массовых общественных явлений в конкретных условиях места и времени, а так же числовое выражение проявляющихся в них закономерностей.

Свой предмет статистика изучает при помощи определенных категорий, т.е. понятий, которые отражают наиболее общие и существенные свойства, признаки, связи и отношения предметов и явлений объективного мира. Закономерность, выявленная на основе массового наблюдения, то есть проявляющаяся лишь в большой массе явлений через преодоление свойственной её единичным элементам случайности, называется статистической закономерностью .

Свойство статистических закономерностей проявляться лишь в массе явлений при обобщении данных по достаточно большому числу единиц, находит свое отражение в законе больших чисел, сущность которого состоит в том, что по мере увеличения числа наблюдений влияние случайных факторов взаимопогашается и на поверхность выступает действие основных факторов, которые и определяют закономерность. Например, характеристика экологической ситуации предполагает изучение закономерности динамики выбросов загрязняющих веществ в атмосферный воздух регионов от динамики физического объема валового регионального продукта.

Познание закономерностей возможно только в том случае, если изучаются не отдельные явления, а совокупности явлений. То есть объектом статистического изучения является статистическая совокупность – множество единиц изучаемого явления, объединенных качественной однородностью, определенной целостностью, взаимозависимостью состояний отдельных единиц и наличием вариации. Таковы, например, совокупность домохозяйств, совокупность предприятий и фирм, совокупность нефтяных месторождений, совокупность регионов и т. п.

Однородная совокупность – это вид совокупности, в которой один или несколько научаемых существенных признаков являются общими для всех единиц. Например, принадлежность предприятий к одной и той же отрасли – заводы металлургического комплекса или регионы, относящиеся к одной природно-климатической зоне.

Разнородная совокупность – это вид совокупности, в которую входят явления разного типа. Совокупность может быть однородна в одном отношении и разнородна в другом. Регионы, включенные в одну группу по природно-климатическим характеристикам, различаются по уровню социально-экономического развития. Заводы, входящие в металлургический комплекс России, различаются по своей специализации – выделяются группы заводов по производству труб, или по производству листового проката и т.п. В каждом отдельном случае однородность совокупности устанавливается путем проведения качественного анализа, выяснения содержания изучаемого общественного явления.

Статистическая совокупность состоит из единиц совокупности. Единицы статистической совокупности представляют собой качественно однородные первичные элементы этой совокупности. Каждая единица совокупности представляет собой частный случай проявления изучаемой закономерности. Решение вопроса о единице и границах изучаемой совокупности определяется целью исследования. Это связано со сложной природой социально-экономических явлений. В каждом отдельном явлении одновременно реализуются различные процессы. Например, при изучении совокупности работников, каждый работник может рассматриваться как член определенной социально-профессиональной группы, как работник предприятия, как житель города поселка и т.д., то есть единица совокупности – это предел дробления объекта исследования, при котором сохраняются все свойства изучаемого процесса.

Единицы совокупности обладают определенными свойствами, качествами, которые принято называть признаками. Признак – качественная особенность единицы совокупности. Например, признаки человека: возраст, пол, образование, вес, семейное положение и т. д. Признаки предприятия: форма собственности, отрасль, численность работников, величина уставного фонда и т.д. Статистика изучает явления через их признаки: чем более однородна совокупность, тем больше общих признаков имеют ее единицы, тем меньше варьируют её значения.

По характеру отображения свойств единиц изучаемой совокупности признаки делятся на две основные группы:

■ признаки, имеющие непосредственное количественное выражение, например, площадь территории, численность жителей города и т. д. Они могут быть дискретно или непрерывно варьируемыми. Дискретно варьируемые признаки – это признаки, отдельные значения которых отличаются друг от друга на некоторую конечную величину (обычно целое число). Так, дискретные признаки мы используем, когда проводится группировка, например, магазинов по числу в них отделов или касс. В магазинах может быть один, два, три и т.д. отдела, но не может быть полтора или два с половиной отдела. Существует множество признаков, значения которых отличаются друг от друга на сколько угодно малую величину и могут принимать любые значения на некотором интервале. Такие признаки называют непрерывно варьирующими или непрерывными признаками. К ним относятся индексы экономического состояния, среднедушевые доходы, весовые и объемные характеристики товаров;

■ признаки, не имеющие непосредственного количественного выражения. В этом случае отдельные единицы совокупности различаются своим содержанием, например, отраслевая специализация предприятий и организаций; деление природных ресурсов по их происхождению: минеральные, водные, земельные или деление населения по полу – мужчины и женщины и т.д. Такие признаки обычно называют атрибутивными (в философии «атрибут» – неотъемлемое свойство предмета). В случае, когда имеются противоположные по значению варианты признака, говорят об альтернативном признаке (да, нет). Например, продукция может быть годной или бракованной (не годной); каждое лицо может состоять в браке или нет и т. д.

Особенностью статистического исследования является, то, что в нем изучаются только варьирующие признаки, т.е. признаки, принимающие различные значения (для атрибутивных, альтернативных признаков) или имеющие различные количественные уровни у отдельных единиц совокупности.

Поскольку статистика, как уже сказано, изучает количественную сторону массовых явлений, то возникает необходимость в обобщающих характеристиках статистической совокупности. Эту роль выполняет статистический показатель, являющийся количественной характеристикой какого-то свойства совокупности.

Статистический показатель – это количественная оценка свойства изучаемого явления. Статистические показатели можно подразделить на два основных вида. Первый вид - это учетно-оценочные показатели, которые показывают размеры, объемы, уровни изучаемого явления, например, объем промышленной продукции в РФ в 2003 г, составил 8498,0 млрд. рублей или оборот розничной торговли – 4483,5 млрд. рублей. Второй вид показателей – аналитические, которые показывают, как развивается изучаемое явление, из каких частей состоит целое, т.е. в каком соотношении находятся части целого между собой и как распространяется явление в пространстве. Так, в составе Северо-Кавказского экономического района территория Ростовской области составляет 28,4%, а Республики Адыгея – 2,1 %. К аналитическим относят относительные и средние величины, показатели вариации и т.д. Например, среднедушевые денежные доходы населения в 2003 г. в РФ составляли 5129 рублей в месяц.

Одной из отличительных черт бурного развития науки является широкое применение статистических методов и вычислительной техники в освоении информации. В настоящее время невозможно представить себе дисциплину, которая не пользовалась бы в процессе познания методами численного выражения закономерностей, связей, зависимости, измерения тенденции и т. д. Это, в частности, относится и к экономическим наукам.

В статистической литературе большое внимание уделяется изучению и применению отдельных статистических методов и приемов, но совсем недостаточно освещены вопросы целесообразности и последовательности использования того или иного статистического метода, их комплексного применения, сочетания различных методов. Абсолютизация того или иного метода исследования ничего, кроме вреда, не приносит. Только сочетание различных методов может дать заметный эффект. Именно с этих позиций и нужно оценивать роль и место статистического моделирования в системе познания различных процессов и явлений. В данной работе предпринята попытка систематизировать методику комплексного применения статистических методов в экономических исследованиях, рассмотрена целесообразность и последовательность использования статических методов и приемов при анализе статических и динамических процессов.

Первым этапом исследования является накопление (сбор) необходимых сведений об изучаемом объекте. Если наблюдений не очень много, то можно провести упорядочение, расположив их в порядке возрастания или убывания, т. е. построить ранжированные ряды. Если же наблюдений много, то приходится прибегать к их группировке. Статистические ряды носят самый разнообразный характер, имеют различное назначение и в разных целях могут использоваться в экономическом анализе. Одни статистические ряды являются вариационными рядами распределения. Эти ряды показывают распределение единиц изучаемой совокупности по отдельным группам, выделенным по какому-либо признаку. Другой разновидностью статистических рядов является последовательность чисел, отражающих величину того или иного показателя во времени. Это так называемые ряды динамики. Они позволяют анализировать изменение любых явлений во времени, об этом речь пойдет позже. Не умаляя значения временных рядов, следует отметить, что вариационным рядам распределения в статистическом анализе принадлежит особое место, ибо только при помощи распределения сложных совокупностей на качественно однородные группы можно изучать их структуру, соотношение между частями целого и т. п., без чего немыслим никакой экономический анализ. Ряды распределения могут строиться по качественным (атрибутивным) и по количественным признакам, по одному признаку и по нескольким, предоставляя тем самым широкие возможности исследователям при изучении сложных экономических явлений. Ряды распределения могут быть представлены либо в табличной форме, либо в геометрической, т. е. графической. Статистическая совокупность, представленная в виде ранжированного ряда распределения, графически изображается в виде огивы. Она строится так: на оси абсцисс наносятся номера элементов совокупности по ранжиру, а на оси ординат откладываются значения признака. Огива наглядно показывает интенсивность изменения изучаемого признака. Вариационные ряды распределения изображаются графически в виде полигонов и гистограмм. В виде полигонов обычно изображаются дискретные вариационные ряды распределения. При этом значения признака откладывают на оси абсцисс, а частоты (или частости) – на оси ординат. Вершины ординат соединяют прямыми линиями, в результате чего получают полигон (многоугольник). В виде полигона можно представить и интервальные вариационные ряды. Для этого за отдельные значения признака принимаются средние значения интервалов. Интервальные же вариационные ряды чаще всего изображают в виде гистограммы, в которой частоты выражают в виде прямоугольников соответствующей длины, а основания прямоугольников, опирающиеся на ось абсцисс, соответствуют интервалу значения признака (рис. 1).

Рис. 1. Гистограмма и полигон распределения

Различают одновершинные и многовершинные распределения. Многовершинность распределения, как правило, является признаком неоднородности изучаемой совокупности. Из разнообразия форм одновершинных кривых распределений можно выделить следующие наиболее характерные типы: симметричные, умеренно асимметричные, крайне асимметричные.

В практике обычно редко встречаются идеально симметричные распределения, чаще умеренно асимметричные, в которых частоты с одной стороны от центра рассеивания уменьшаются заметно быстрее, чем с другой. Асимметричное распределение в пределе становится крайне асимметричным – в этом случае наибольшая частота расположена на одном из концов распределения.

При решении некоторых вопросов удобнее пользоваться накопленными частотами распределения. Кривая накопленных частот распределения носит название «кумулята распределения». При построении кумуляты на оси абсцисс откладываются значения признака, на оси ординат – накопленные частоты. Построение вариационного ряда распределения и его графическое изображение позволяют получить первое представление о его наиболее характерных общих чертах. В то же время статистическое изучение совокупности не может ограничиться лишь простым упорядочением наблюдаемых величин. К тому же ряды распределения и их графики бывают довольно громоздкими, так как включают в себя всю исходную информацию. Поэтому наиболее рациональным путем статистического описания распределения будет вычисление определенных числовых характеристик, отражающих реальные свойства совокупности. К таким характеристикам прежде всего относятся характеристики центральной тенденции ряда распределения, т. е. нахождение его центрального значения; рассеивания значений признака относительно центра распределения; асимметрии и островершинности распределения. Изучение статистических характеристик распределений целесообразно начать с рассмотрения наиболее простых и в то же время чаще всего используемых в статистическом анализе, т. е. с изучения средних величин; затем научиться измерять вариацию, изучить меры скошенности и островершинности. Все эти показатели тех или иных особенностей распределения составляют единую систему статистических характеристик.

Однако применение тех или иных статистических методов предполагает прежде всего однородность изучаемой совокупности: нельзя, например, анализировать совокупность, состоящую из разных категорий хозяйств, включающую предприятия разной специализации и т. д. Для успешного решения задач необходимо глубокое понимание сущности изучаемого процесса или явления. Учитывая сложность, неоднородность экономических явлений и процессов, необходимо производить анализ таким образом, чтобы наиболее существенные различия между отдельными группами явлений не затушевывались, а выделялись для более успешного их изучения. В то же время объединение в группы сходных однотипных явлений помогает выявить их черты и особенности, которые при изучении каждого явления отдельно могут оставаться незамеченными. Выделение в каждой совокупности общественно/экономических типов явлений – главное условие ее научного анализа. А это можно осуществить, только применяя метод типологических группировок.

Массовые явления хозяйственной деятельности предприятий, являющиеся объектом статистического изучения, имеют сложный характер, обладают качественной общностью, свойственной данному явлению, но в то же время имеют и различия. Так, производством какой-либо продукции занимаются сельскохозяйственные предприятия и фермерские хозяйства и т. д. Стало быть, при характеристике производства данного вида продукции в регионе следует исходить из учета качественных особенностей предприятий, производящих эту продукцию, – в противном случае выводы будут неточными, а принимаемые на основании таких выводов решения – неэффективными.

Типологическая группировка данных – основной прием изучения экономических явлений, обеспечивающий качественную сопоставимость единиц совокупности и дающий возможность получения обобщенного количественного значения признака.

1.2. Методы измерения обобщающих характеристик совокупности

Метод группировок позволяет изучить состояние и взаимосвязи экономических явлений, если группы будут охарактеризованы показателями, раскрывающими наиболее существенные стороны изучаемого явления.

При анализе и планировании необходимо опираться не на случайные факты, а на показатели, выражающие основное, типичное, коренное. Такую характеристику дают различные виды средних величин, а также мода и медиана.

Вопрос об однородности совокупности не должен решаться формально по форме ее распределения. Его, как и вопрос о типичной средней, нужно решать, исходя из причин и условий, формирующих совокупность. Однородной является такая совокупность, единицы которой формируются под воздействием общих главных причин и условий, определяющих общий уровень данного признака, характерный для всей совокупности.

Согласно теории типологических группировок, решающее значение в оценке однородности совокупности принадлежит не форме распределения, а размеру вариации и условиям ее формирования. Для качественно однородной совокупности характерна вариация в определенных пределах, после чего начинается новое качество. Вместе с тем к этим границам для оценки качественной однородности совокупности надо подходить с точки зрения существа дела, а не формально, так как одно и то же количество в разных условиях выражает новое качество. Например, при одной и той же численности рабочих предприятия одних отраслей промышленности являются крупными, а других – мелкими.

Для всестороннего и углубленного изучения явлений, для объективной характеристики типов явлений, их взаимоотношений и процессов, обусловленных развитием системы как целого, необходимо сочетать групповые средние с общими средними. Сочетание таких средних и является одним из основных элементов анализа сложных систем. Это сочетание связывает в одно целое два органически дополняющих друг друга статистических метода: метод средних величин и метод группировки. При расчете средней индивидуальные варьирующие по группе значения заменяются одним средним значением. При этом случайные отклонения значения признака по отдельным единицам в сторону увеличения или уменьшения взаимно уравновешиваются и погашают друг друга, а в величине средней проявляется типичный размер признака, свойственный данной группе. Средняя величина служит характеристикой совокупности и в то же время относится к отдельному ее элементу – носителю качественных особенностей явления. Значение средней вполне конкретно, но одновременно и абстрактно; оно получено путем абстрагирования от случайного индивидуального по каждой единице с целью выявления того общего, типичного, что свойственно всем единицам и что формирует данную совокупность. При расчете средней величины численность единиц совокупности должна быть достаточно большой. Величина средней определяется как отношение общего объема явлений к числу единиц совокупности в группе. Для несгруппированных данных это будет средняя арифметическая простая:

а для сгруппированных данных, где каждое значение признака имеет свою частоту, – средняя арифметическая взвешенная:

где X i – значение признака; f i – частота этих значений признака.

Поскольку средняя арифметическая рассчитывается как отношение суммы значений признака к общей численности, она никогда не выходит за пределы этих значений. Средняя арифметическая обладает рядом свойств, которые широко используются в целях упорядочения расчетов.

1. Сумма отклонений индивидуальных значений признака от средней величины всегда равна нулю:

Доказательство. n

Разделив левую и правую часть на

2. Если значения признака (X i) изменить в k раз, то средняя арифметическая также изменится в x раз.

Доказательство.

Среднюю арифметическую из новых значений признака обозначим X, тогда:

Постоянную величину 1/k можно вынести за знак суммы, и тогда получим:

3. Если из всех значений признака X i вычесть или прибавить одно и то же постоянное число, то средняя арифметическая уменьшится или увеличится на эту величину.

Доказательство.

Средняя из отклонений значений признака от постоянного числа будет равна:

Точно так же доказывается это и в случае прибавления постоянного числа.

4. Если частоты всех значений признака уменьшить или увеличить в n раз, то средняя не изменится:

При наличии данных об общем объеме и известных значениях признака, но неизвестных частотах для определения среднего показателя используют формулу среднеарифметической взвешенной.

Например, имеются данные о ценах реализации капусты и общей выручке за различные сроки реализации (табл. 1).

Таблица 1.

Цена реализации капусты и общая выручка за различные сроки реализации

Так как средняя цена представляет отношение общей выручки к общему объему реализованной капусты, то вначале следует определить количество реализованной капусты по разным срокам реализации как отношение выручки к цене, а затем уже определить среднюю цену реализованной капусты.

В нашем примере средняя цена будет:

Если рассчитать в данном случае среднюю цену реализации по средней арифметической простой, то получим иной результат, который исказит истинное положение и завысит среднюю цену реализации, так как не будет учтен тот факт, что большая доля в реализации приходится на позднюю капусту с более низкой ценой.

Иногда требуется определить среднюю величину, когда значения признака даются в виде дробных чисел, т. е. обратных целым числам (например, при изучении производительности труда через обратный его показатель, трудоемкость). В таких случаях целесообразно использовать формулу средней гармонической:

Так, среднее время, необходимое для изготовления единицы продукции, есть средняя гармоническая. Если Х 1 = 1/4 часа, Х 2 = 1/2 часа, Х 3 = 1/3 часа, то средняя гармоническая этих чисел есть:

Для расчета средней величины из отношений двух одноименных показателей, например темпов роста, применяется средняя геометрическая, рассчитанная по формуле:

где Х 1 ? Х 2 … ? … Х 4 – отношение двух одноименных величин, например цепных темпов роста; n – численность совокупности отношений темпов роста.

Рассмотренные средние величины обладают свойством маорантности:

Пусть, например, имеем следующие значения Х (20; 40), тогда рассмотренные ранее виды средних величин будут равны:

При изучении состава совокупности о типичном размере признака можно судить по так называемым структурным средним – моде и медиане.

Модой называется наиболее часто встречающееся значение признака в совокупности. В интервальных вариационных рядах сначала находят модальный интервал. В найденном модальном интервале мода рассчитывается по формуле:

где Х 0 – нижняя граница модального интервала; d – величина интервала; f 1 , f 2 , f 3 – частоты предмодального, модального и послемодаль-ного интервалов.

Значение моды в интервальном ряду довольно просто можно отыскать на основе графика. Для этого в самом высоком столбце гистограммы от границ двух смежных столбцов проводят две линии. Из точки пересечения этих линий опускают перпендикуляр на ось абсцисс. Значение признака на оси абсцисс и будет модой (рис. 2).

Рис. 2

Для решения практических задач наибольший интерес представляет обычно мода, выраженная в виде интервала, а не дискретным числом. Объясняется это назначением моды, которая должна выявить наиболее распространенные размеры явления.

Средняя – величина, типичная для всех единиц однородной совокупности. Мода – тоже типичная величина, но она определяет непосредственно размер признака, свойственный хотя и значительной части, но все же не всей совокупности. Она имеет большое значение для решения некоторых задач, например для прогнозирования того, какие размеры обуви, одежды должны быть предназначены для массового производства, и т. д.

Медиана – значение признака, находящееся посредине ранжированного ряда. Она указывает на центр распределения единиц совокупности и делит ее на две равные части.

Медиана является лучшей характеристикой центральной тенденции, когда границы крайних интервалов открыты. Медиана является более приемлемой характеристикой уровня распределения и в том случае, если в ряду распределения имеются чрезмерно большие или чрезмерно малые значения, которые оказывают сильное влияние на среднюю величину, а на медиану – нет. Медиана, кроме того, обладает свойством линейного минимума: сумма абсолютных значений отклонений величины признака у всех единиц совокупности от медианы минимальная, т. е.

Это свойство имеет большое значение для решения некоторых практических задач – например, для расчета самого короткого из всех возможных расстояний для разных видов транспорта, для размещения станций техобслуживания таким образом, чтобы расстояние до всех обслуживаемых данной станцией машин было минимальным, и т. п.

При отыскании медианы сначала определяется ее порядковый номер в ряду распределения:

Далее, соответственно порядковому номеру, по накопленным частотам ряда находят саму медиану. В дискретном ряду – без всякого расчета, а в интервальном ряду, зная порядковый номер медианы, по накопленным частотам отыскивается медианный интервал, в котором путем простейшего приема интерполяции определяется уже значение медианы. Расчет медианы осуществляется по формуле:

где Х 0 – нижняя граница медианного интервала; d – величина интервала; f _ 1 – частота, накопленная до медианного интервала; f – частота медианного интервала.

Рассчитаем среднюю величину, моду и медиану на примере интервального распределения. Данные приведены в табл. 2.

Таким образом, в качестве центра распределения могут быть использованы различные показатели: средняя величина, мода и медиана,

и каждая из этих характеристик имеет свои особенности. Так, для средней величины характерно то, что все отклонения от нее отдельных значений признака взаимно погашаются, т. е.

Для медианы характерно то, что сумма отклонений индивидуальных значений признака от нее (без учета знаков) является минимальной. Мода же характеризует наиболее часто встречающееся значение признака. Поэтому в зависимости от того, какая из особенностей интересует исследователя, и должна выбираться одна из рассмотренных характеристик. В отдельных случаях рассчитываются все характеристики.

Их сравнение и выявление соотношений между ними помогает выяснить особенности распределения того или иного вариационного ряда. Так, в симметричных рядах, как в нашем случае, все три характеристики (средняя, мода и медиана) примерно совпадают. Чем больше расхождение между модой и средней величиной, тем более асимметричен ряд. Установлено, что для умеренно асимметричных рядов разность между модой и средней арифметической примерно в три раза превышает разность между медианой и средней арифметической:

Это соотношение можно использовать для определения одного показателя по двум известным. Из этого следует, что сочетание моды, медианы и средней важно и для характеристики типа распределения.

1.3. Методы исследования вариации и формы распределения признаков в однородной совокупности

Статистическое описание совокупности было бы неполным, если ограничиться лишь показателями центральной тенденции, т. е. средними величинами, модой и медианой, которые являются равнодействующими ряда изменяющихся значений признака. В одних случаях значение признака концентрируется возле некоторого центра очень тесно, в других случаях наблюдается значительное рассеивание, хотя средняя величина может быть одинаковой. В связи с этим средняя величина как показатель центральной тенденции не дает исчерпывающей характеристики изучаемой совокупности. Возникает необходимость изучения характера рассеивания признака. Хотя отклонения от средней и регулируются общими для всех единиц совокупности причинами, формирующими среднюю, но в то же время они обусловлены и индивидуальными причинами. Например, отклонения производительности труда отдельных рабочих, работающих в одной бригаде, а стало быть, находящихся в одинаковых условиях труда, вызваны не общими условиями и причинами, а индивидуальными обстоятельствами рабочих и их квалификацией, состоянием здоровья, настроением, сообразительностью и т. д. Поэтому изучение отклонений от средней их размеров и закономерности распределения представляет большой интерес для исследователя. Это важно прежде всего для оценки однородности совокупности, которую характеризует данная средняя величина, так как для качественно однородной совокупности характерна вариация в определенных границах. Стало быть, чем меньше вариация, тем качественно однороднее совокупность, тем типичнее и объективнее средняя величина, характеризующая ее.

Измерение вариации имеет большое значение и для изучения устойчивости изучаемых экономических явлений и процессов. Так, для сельского хозяйства очень важно не только получить среднюю урожайность сельскохозяйственных культур, но и обеспечить ее устойчивость во времени и пространстве, а для этого надо научиться рассчитывать показатели устойчивости, научиться измерять вариацию изучаемых явлений? ? 1,25а .

Для оценки вариации признака статистика знает и использует несколько показателей. Простейшим из них является размах вариации, рассчитываемый по формуле: X max – X min , т. е. как разность между максимальным и минимальным значением признака. Однако этот показатель далеко не совершенен, так как при его построении участвуют лишь крайние значения признака, которые могут быть случайными.

Более точно можно определить вариацию признака при помощи показателя, учитывающего отклонения всех значений признака от средней. Это так называемые абсолютные показатели: среднее линейное отклонение а и среднее квадратическое отклонение?. Среднее линейное отклонение – это средняя арифметическая из абсолютных значений отклонений отдельных значений признака от средней величины. Но сумма отклонений от средней

всегда равна нулю (одно из свойств средней величины), поэтому для расчета среднего линейного отклонения суммируют абсолютные отклонения без учета его знака:

Среднее квадратическое отклонение также может быть простое и взвешенное:

Среднее квадратическое отклонение является наиболее распространенным показателем вариации, оно несколько больше среднего линейного отклонения. Установлено, что в симметричных или умеренно асимметричных распределениях соотношение между ними можно записать в виде:

1,25а .

Следует иметь также в виду, что среднее линейное отклонение будет минимальным, если оно рассчитано от медианы, т. е.:

Среднее квадратическое отклонение минимально при вычислении его от средней арифметической, это же относится и к дисперсии, которая представляет собой квадрат среднего квадратического отклонения.

Дисперсия

широко применяется в дисперсионном анализе, но не как мера вариации, так как ее размерность не соответствует размерности признака.

Рассмотрим вычисление среднего линейного и среднего квадрати-ческого отклонения на примере данных, приведенных в табл. 3.

Таблица 3.

Анализ времени обработки деталей рабочими двух бригад

Средняя величина времени обработки детали составляет в обеих бригадах 124 мин. Для первой бригады Х 1 =992/8 = 124ми н. и для второй – Х 2 = 1240/10 = 124 мин.

Медианные значения также одинаковы в обеих бригадах. Так, для первой бригады Хме = (116+132)/2 = 124 мин. Для второй бригады – Хме = (122+126)/2 + 124 мин

Модальные значения в данном случае не могут быть определены, так как каждое из значений признаков не повторяется.

Исходя из полученных результатов, можно сделать вывод, что обе совокупности характеризуются одинаковыми показателями центра распределения, но они могут отличаться по характеру рассеяния отдельных значений признака вокруг этих центров.

Для характеристики рассеяния рассчитаем среднее линейное отклонение. Для первой бригады:

Сопоставление среднего линейного и среднего квадратического отклонений говорит о том, что вариации времени обработки деталей в первой бригаде значительно выше, чем во второй бригаде.

Следует также отметить, что среднее квадратическое отклонение в обоих случаях несколько больше, чем среднее линейное отклонение:

1 = 1,22а 1 ;

2 = 1,20а 2 .

Это говорит о том, что мы имеем дело с умеренно асимметричным распределением.

Рассмотренные показатели вариации (размах вариации, среднее линейное отклонение, среднее квадратическое отклонение) дают возможность сравнить степень однородности нескольких совокупностей, но в отношении лишь одного признака, поскольку это именованные величины, имеющие единицы измерения те же, что и сам признак.

Однако часто исследователю приходится сравнивать вариации различных признаков, а стало быть, эти показатели вариации не могут быть использованы.

Для характеристики вариации различных признаков рассчитывают относительные показатели вариации, приведенные к одному основанию, т. е. выраженные в процентах (доли размаха вариации, среднего линейного отклонения и среднего квадратического отклонения) от средней величины изучаемого признака.

Это так называемые коэффициент осцилляции, относительное отклонение и коэффициент вариации.

Коэффициент осцилляции рассчитывается по формуле:

В нашем примере эти показатели составляют:

Все рассчитанные относительные показатели вариации свидетельствуют также о более сильной вариации времени обработки деталей рабочими первой бригады по сравнению со второй, где среднее время обработки является более объективной, более типичной характеристикой работы данной бригады в целом, т. е. вторая бригада как совокупность более однородна.

Относительные показатели вариации, как уже было отмечено, позволяют сравнивать степень вариации признаков, имеющих одинаковые единицы измерения, но разные уровни средних. Например, урожайность зерновых культур и картофеля хотя и имеют одинаковые единицы измерения, но по абсолютным показателям вариации этих признаков сравнивать было бы неправильно, так как сами уровни урожайности зерновых и картофеля резко отличаются. Так, например, в регионе среднеквадратическое отклонение составило: по урожайности ржи – 5 центнеров с гектара (ц/га) и по урожайности картофеля – 20 ц/га, а сама урожайность ржи составила 25 ц/га, а картофеля – 200 ц/га. Коэффициент же вариации соответственно равен:

Это означает, что по урожайности картофеля совокупность хозяйств данной области более однородна, чем по урожайности ржи, т. е. урожайность картофеля более устойчива, чем урожайность ржи.

Сравнение абсолютных показателей вариации одного и того же признака разных совокупностей иногда приводит к иному выводу, чем при сопоставлении относительных показателей вариации.

Так, если в одной совокупности абсолютный показатель вариации больше, чем в другой, и средний уровень изучаемого признака в ней также значительно больше, чем в другой, то относительный показатель вариации может быть ниже.

Так, например, если среднее квадратическое отклонение урожайности ржи в одном районе составило 5 ц, в другом – 3 ц, а сама средняя урожайность, соответственно, составила 25 и 10 ц/га, то относительные показатели вариации приводят к иному выводу.

Следовательно, рост урожайности, связанный с некоторым повышением абсолютного показателя вариации, может и не снизить ее устойчивости.

Относительные показатели вариации необходимы также и для сравнения вариации различных признаков, имеющих разные единицы измерения, поскольку абсолютные показатели вариации в этом случае не могут быть использованы как мера вариации.

Например, при сравнении вариации урожайности и себестоимости той или иной культуры нельзя использовать абсолютные показатели вариации, так как они будут иметь разные единицы измерения: ц/га и руб. за 1 т. В этом случае целесообразно среднее квадратическое отклонение использовать для расчета так называемого нормированного отклонения:

характеризующее отклонение индивидуальных значений признака от средней (Xi ?X ) и приходящееся на единицу среднего квадратического отклонения. Нормированное отклонение позволяет сопоставлять между собой отклонения, выраженные в различных единицах измерения. Практически нормированные отклонения изменяются в пределах от 0 до 3.

Однако в совокупности могут встречаться отдельные единицы, у которых t > 3. Это будет свидетельствовать о неоднородности совокупности, и такие единицы совокупности целесообразно исключить как аномальные, нетипичные для данной совокупности.

Если совокупность мала (3 ? n ? 8), то однородность совокупности, т. е. проверку годности первичных данных, можно осуществить следующим образом. Вычисляют показатель, характеризующий отношение разности между сомнительным и соседним значениями ранжированного в порядке возрастания ряда к разности между крайними значениями, т. е.:

если вызывает сомнение первое в ряду значение признака, и:

если вызывает сомнение последнее в ряду значение признака.

Вычисленную величину Q сопоставляют с табличным ее значением для данного числа наблюдений и уровня вероятности. Если Q ф > Q табл, то сомнительное значение следует исключить из обработки. Если же Q ф < Q табл, то сомнительное значение не отбрасывается. Рассмотрим эту методику на примере.

Допустим, получены следующие результаты содержания золы в образцах корма в процентах: 2,25; 2,19; 2,11; 2,38; 2,32 и 3,21.

Располагаем данные анализа в порядке возрастания их значений: 2,11; 2,19; 2,25; 2,32; 2,38; 3,21.

Вычисляем:

Таблица 4. Значения Q в зависимости от степени надежности (p)

и общего числа значений признака (n)

Величина Q табл = 0,70. Следовательно, значение 3,21 должно быть исключено как нетипичное для данной совокупности.

При числе значений признака больше трех (и больше восьми) можно использовать другую методику определения пригодности первичных данных. По всем значениям признака в совокупности сначала рассчитывают среднюю величину (Х) и среднее квадратическое отклонение (?), затем на основании разницы (без учета знака) между максимально отклоняющимся значением (X max) и средней величиной находят величину критерия R max по формуле:

Значение R max сопоставляют с табличным его значением при данном числе значений признака для вероятности p = 0,99 (табл. 5).

Если R max > R табл, то сомнительное значение (X) следует исключить, если же R max < R табл, то значение (X max) следует принимать в расчет.

При n > 20 показатель R max ? 3 и условие пригодности имеет вид:

Таблица 5. Значения R max для степени надежности p = 0,99 в зависимости

от числа единиц совокупности n

Обратимся к предыдущему примеру и вычислим:

При расчете средней величины и среднего квадратического отклонения используют все значения признака. Затем рассчитываем:

Для n = 6, R табл _ 2,13; так как 2,22 > 2,13, то сомнительное значение 3,21 необходимо отбросить из статистической обработки. Если сомнение вызывает не одно, а несколько значений, то сначала производят указанные выше расчеты только для одного из них (наиболее отклоняющегося). После его исключения повторяют расчет для следующего сомнительного значения, вычисляя заново X и?.

При проверке годности данных с использованием любой методики может быть исключено не более одной трети единиц совокупности.

Если исключению подлежит более одной трети всех единиц совокупности, то данная совокупность считается неоднородной.

При изучении экономических явлений статистика встречается с разнообразной вариацией признаков, характеризующих отдельные единицы совокупностей. Величины признаков варьируют под воздействием различных причин и условий. Чем разнообразнее условия, влияющие на размер признака, тем больше его вариация.

Рассмотренные показатели центральной тенденции и показатели вариации представляют собой частные случаи некоторой единой системы статистических характеристик распределения. Такая единая система характеристик может быть представлена моментами статистического распределения. Если при вычислении моментов за произвольную постоянную принимается средняя арифметическая, то такие моменты называются центральными.

Общая формула центральных моментов k-го порядка имеет вид:

Иначе говоря, центральные моменты k-го порядка представляют собой среднюю арифметическую из k – x степеней отклонений значений признака от средней арифметической.

1. Центральный момент нулевого порядка равен единице при k = 0:

2. Центральный момент первого порядка равен нулю при k = 1:

3. Центральный момент второго порядка представляет собой дисперсию данного распределения при k = 2:

4. Центральный момент третьего порядка имеет вид:

Если распределение симметричное, то нетрудно видеть, что центральный момент третьего порядка равен нулю, так как минусовые отклонения (X i – X ) 3 в левой ветви распределения будут уравновешиваться положительными отклонениями в правой части. Такое взаимное погашение отклонений в симметричных рядах распределения сохраняет силу для всех нечетных центральных моментов.