Бакалавриат
2024/2025





Анализ данных
Статус:
Курс обязательный (Иностранные языки и межкультурная бизнес-коммуникация)
Направление:
45.03.02. Лингвистика
Кто читает:
Кафедра фундаментальной математики
Где читается:
Факультет гуманитарных наук (Нижний Новгород)
Когда читается:
3-й курс, 3 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Преподаватели:
Николаева Татьяна Павловна
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Содержание дисциплины охватывает основные разделы статистики и включает знакомство с основными типами и особенностями статистических данных, освоение простейших методов их группировки и визуализации, изучение базовых инструментов предварительного анализа данных и способов выявления взаимосвязей. В результате освоения дисциплины студент должен понимать и использовать терминологию, принятую в анализе данных, применять релевантные статистические методы и инструменты при работе с данными в конкретных ситуациях, уметь интерпретировать полученные результаты и формулировать выводы на их основе.
Итоговая оценка по дисциплине (оценка по промежуточной аттестации) рассчитывается на основе оценок по всем элементам контроля. Перечень элементов контроля и правила выставления итоговой оценки определены Программой дисциплины, размещенной в открытом доступе на корпоративном сайте (портале) НИУ ВШЭ.
Цель освоения дисциплины
- Целями освоения дисциплины являются формирование у студентов навыков обработки и анализа данных с использованием основных статистических методов и релевантных средств программного обеспечения
Планируемые результаты обучения
- Демонстрирует знание основных понятий, включенных в Тему 1, и умение ими оперировать. Ориентируется в основных источниках официальной статистической информации.
- Демонстрирует знание основных понятий, включенных в Тему 2, и умение ими оперировать. Ориентируется в актуальных требованиях к предоставлению статистической отчетности.
- Демонстрирует знание основных понятий, включенных в Тему 3, и умение ими оперировать. Решает задачи на нахождение различных типов средних величин,
- Демонстрирует знание основных понятий, включенных в Тему 4, и умение ими оперировать. Решает задачи на вычисление и анализ показателей вариации.
- Демонстрирует знание основных понятий, включенных в Тему 5, и умение ими оперировать. Решает задачи на определение ошибок выборки и ее необходимой численности.
- Демонстрирует знание основных понятий, включенных в Тему 6, и умение ими оперировать. Решает задачи на выявление, определение тесноты и нахождение аналитического выражения корреляционной связи.
- Демонстрирует знание основных понятий, включенных в Тему 7, и умение ими оперировать. Решает задачи на определение показателей динамики, выявление тенденций, сглаживание рядов динамики.
- Демонстрирует знание основных понятий, включенных в Тему 8, и умение ими оперировать. Решает задачи на нахождение различных видов индексов.
- Использует принятую терминологию
- Выделяет отличительные особенности основных типов данных
- Применяет релевантные методы для визуализации данных
- Выбирает релевантные способы группировки данных
- Использует подходящие методы для визуализации распределения данных
- Рассчитывает основные меры центральной тенденции
- Интерпретирует показатели центральной тенденции применительно к конкретным наборам данных
- Рассчитывает основные меры вариативности
- Интерпретирует показатели вариативности применительно к конкретным наборам данных
- Использует способ z-оценки для получения стандартизированного распределения
- Определяет выбросы в данных различными способами и использует подходящие способы их представления и обработки
- Выявляет наличие пропусков в данных и использует подходящие методы их обработки
- Анализирует данные на наличие корреляционных связей
- Рассчитывает показатели корреляции и интерпретирует полученные результаты
- Определяет параметры линейной регрессии
- Оценивает качество полученных результатов регрессии
- Интерпретирует результаты регрессионного анализа
Содержание учебной дисциплины
- Сущность статистики как науки и как практической отрасли
- Статистические данные, их особенности и основные способы представления
- Генеральная совокупность и выборка
- Сгруппированные данные, их особенности и способы представления
- Меры центральной тенденции
- Меры вариативности
- Выбросы в данных, способы их определения и обработки
- Пропуски в данных и способы их обработки
- Корреляция, ее измерение и интерпретация
- Линейная регрессия и метод наименьших квадратов
Элементы контроля
- Мини-тестыЭлемент контроля представляет собой тесты (планируемое количество 3 может быть незначительно изменено и, в зависимости от фактических условий реализации дисциплины, может составить от 2 до 4). Тесты проводятся во время лекций и выполняются в Smart LMS. Каждый тест может включать материал как изученных ранее тем, так и текущей лекции. Приблизительная длительность каждого теста 15 минут и может варьироваться в зависимости от объема и уровня сложности конкретного теста и типов вопросов. Точная длительность каждого теста объявляется студентам до его начала. Правила выполнения тестов размещаются в курсе на платформе Smart LMS.
- Контрольная работаКонтрольная работа выполняется онлайн в Smart LMS и подразумевает работу с набором данных. Средства обработки данных - Excel или Python - студент выбирает самостоятельно. Правила выполнения контрольной работы заблаговременно размещаются в курсе на платформе Smart LMS. Ориентировочная длительность работы 60 минут, точная длительность указывается в Правилах. О дате и времени проведения контрольной работы студенты информируются заблаговременно, не позднее недели, предшествующей написанию работы.
- Тесты в онлайн-курсе
- ЭкзаменЭкзаменационная работа выполняется на компьютере в аудитории, в присутствии преподавателя и предполагает работу с набором данных. Средства обработки данных - Excel или Python - студент выбирает самостоятельно. Работа содержит задания, аналогичные заданиям, входившим в мини-тесты и контрольную работу. Возможно получение итоговой оценки "автоматом" без экзамена, список таких студентов заранее объявляется преподавателем. Для студентов, не получающих "автомат", экзамен является обязательным.
Промежуточная аттестация
- 2024/2025 3rd module0.4 * Контрольная работа + 0.2 * Мини-тесты + 0.1 * Тесты в онлайн-курсе + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2020. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: http://biblio-online.ru/bcode/450166 (дата обращения: 31.08.2020).
- Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2024. — 448 с. — (Высшее образование). — ISBN 978-5-534-19964-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/557384 (дата обращения: 27.08.2024).
- Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2024. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/536007 (дата обращения: 27.08.2024).
Рекомендуемая дополнительная литература
- Бизнес-статистика : учебник и практикум для вузов / И. И. Елисеева [и др.] ; под редакцией И. И. Елисеевой. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2024. — 444 с. — (Высшее образование). — ISBN 978-5-534-14822-0. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/537150 (дата обращения: 27.08.2024).
- Козлов, А. Ю. Статистический анализ данных в MS Excel : учебное пособие / А.Ю. Козлов, В.С. Мхитарян, В.Ф. Шишов. — Москва : ИНФРА-М, 2023. — 320 с. — (Высшее образование: Бакалавриат). — DOI 10.12737/2842. - ISBN 978-5-16-004579-5. - Текст : электронный. - URL: https://znanium.com/catalog/product/1907518
- Теория статистики : учебник / под ред. проф. Г.Л. Громыко. — 4-е изд., перераб. и доп. — Москва : ИНФРА-М, 2024. — 465 с. — (Высшее образование). - ISBN 978-5-16-019084-6. - Текст : электронный. - URL: https://znanium.com/catalog/product/2084150
- Федоров, Д. Ю. Программирование на python : учебное пособие для вузов / Д. Ю. Федоров. — 6-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2025. — 187 с. — (Высшее образование). — ISBN 978-5-534-19666-5. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/556864 (дата обращения: 27.08.2024).