Бакалавриат
2024/2025
Анализ данных с использованием Python
Статус:
Курс обязательный (Клеточная и молекулярная биотехнология)
Направление:
06.03.01. Биология
Кто читает:
Базовая кафедра Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН
Где читается:
Факультет биологии и биотехнологии
Когда читается:
2-й курс, 1, 2 модуль
Формат изучения:
без онлайн-курса
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
3
Программа дисциплины
Аннотация
Курс «Анализ данных с использованием Python» имеет целью обучить студентов не только работе в Python, но и основам программирования вообще, поскольку наиболее базовые принципы являются схожими почти во всех языках программированияю При решении ряда задач исследователи часто сталкиваются с необходимостью работать с большими массивами данных. Характер данных может быть очень разным: последовательности нуклеиновых кислот (ДНК, РНК), аминокислот (белки). Для того чтобы эффективно работать с разными типами данных, необходимо знать основы программирования, так как именно навыки программирования позволяют автоматически собирать необходимую информацию за достаточно быстрое время. В качестве языка программирования в данном курсе используется Python. Язык Python на данный момент является очень популярным, в том числе в исследованиях в рамках естественных наук. Дисциплина подразделяется на два блока. Первый блок посвящен основам программирования и включает необходимые для дальнейшей работы в Python темы: переменные и типы данных, списки и кортежи, множества, словари, условные конструкции, циклы и функции. Второй блок посвящен решению прикладных задач в Python и включает темы, связанные со сбором и анализом данных: выгрузка данных с сайтов, парсинг веб-страниц, работа с таблицами, визуализация и разведывательный анализ данных, а также эффективная работа с текстом, поскольку именно с таким форматом данных студентам придется работать больше всего в дальнейшем, и использования машинного обучения. Базовые навыки программирования позволят работать с биологическими данными различного уровня и размеров эффективнее и уже сегодня являются достаточно востребованными навыками у специалистов естественнонаучного профиля.
Цель освоения дисциплины
- Овладение навыками программирования на языке Python
- Овладение методами сбора и обработки данных для решения задач анализа биологических последовательностей и биологической статистики
Планируемые результаты обучения
- Знает этапы предварительной обработки текста и умеет реализовывать их на практике
- Умеет выполнять операции с массивами NumPy
- Знает особенности изменяемых и неизменяемых типов данных; умеет создавать разные структуры данных
- Умеет выполнять базовые операции с табличными данными средствами Python
- Умеет загружать файлы с данными разных форматов и экспортировать их
- Умеет писать функции на Python, тестировать их, обрабатывать ошибки
- Умеет работать в среде Jupyter Notebook, умеет создавать переменные разных типов, принимать информацию от пользователя и выводить информацию на экран
- Умеет решать прикладные задачи с применением условных конструкций и циклов
- Знает особенности типов и структур данных в Python: int, float, bool, str, list, tuple, set, dict, вложенные структуры
- Умеет визуализировать результаты исследований с помощью Matplotlib, seaborn
- Умеет выгружать данные с веб-страниц
Содержание учебной дисциплины
- Начало работы в Python
- Структуры данных в Python
- Управляющие конструкции и циклы в Python
- Функции и работа с файлами в Python
- Работа с текстами
- Массивы NumPy и таблицы pandas
- Визуализация при помощи Matplotlib, seaborn
- Работа с html-файлами
Промежуточная аттестация
- 2024/2025 1st module0.3 * Контрольная работа + 0.35 * Семинарские домашние задания + 0.2 * Тесты + 0.15 * Участие в лайв-кодинге
- 2024/2025 2nd module0.35 * Семинарские домашние задания + 0.2 * Тесты + 0.15 * Участие в лайв-кодинге + 0.3 * Экзамен
Список литературы
Рекомендуемая основная литература
- Nelli, F. (2018). Python Data Analytics : With Pandas, NumPy, and Matplotlib (Vol. Second edition). New York, NY: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1905344
- Федоров, Д. Ю. Программирование на языке высокого уровня Python : учебное пособие для среднего профессионального образования / Д. Ю. Федоров. — 4-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2023. — 214 с. — (Профессиональное образование). — ISBN 978-5-534-15731-4. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/510042 (дата обращения: 27.08.2024).
Рекомендуемая дополнительная литература
- G. Nair, V. (2014). Getting Started with Beautiful Soup. Birmingham, UK: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=691839