Бакалавриат
2024/2025
Обработка и анализ данных физического эксперимента
Статус:
Курс обязательный (Физика)
Направление:
03.03.02. Физика
Кто читает:
Факультет физики
Где читается:
Факультет физики
Когда читается:
2-й курс, 3, 4 модуль
Формат изучения:
с онлайн-курсом
Онлайн-часы:
20
Охват аудитории:
для своего кампуса
Язык:
русский
Кредиты:
4
Программа дисциплины
Аннотация
Курс «Обработка и анализ данных физического эксперимента» посвящен основным методам и подходам, применяемым в современной физике для обработки и анализа данных экспериментов. В рамках курса, изучаемые методы и подходы реализуются в виде программ для ЭВМ с использованием языка Python, что позволяет сформировать практические навыки обработки и анализа данных в современном эксперименте, обладающим высокой степенью автоматизации. Результатом освоения курса является формирование базовых представлений об основных методах обработки экспериментальных данных, базовых навыков построения математических моделей для анализа данных экспериментов, навыков использования языка Python и библиотек numpy, scipy, sklearn, базовых навыков применения машинного обучения для для анализа данных физического эксперимента. Курс предполагает базовые знания основных физических законов и явлений, теории вероятности и статистики, и начальные навыки программирования на языке Python. Курс предназначен для студентов бакалавриата образовательной программы Физика.
Цель освоения дисциплины
- формирование у студентов базовых знаний об основных методах обработки экспериментальных физических данных;
- формирование у студентов знаний по теоретическим основам статистических методов обработки и анализа данных;
- формирование у студентов навыков применения методов машинного обучения для анализа данных физического эксперимента;
- формирование навыков работы с научными библиотеками языка Python: numpy, scipy, sklearn.
Планируемые результаты обучения
- знает и умеет применять : хранение данных в виде текстовых файлов. Хранение данных в виде бинарных файлов. Системы контроля версий. Git и основы работы с ним
- знает и умеет применять линейный и нелинейный метод наименьших квадратов.
- знает принцип максимального правдоподобия. Оценка функции правдоподобия в моделях со скрытыми параметрами, EM-алгоритм
- имеет навыки моделирование методом Монте-Карло с помощью Марковских цепей (MCMC).
- умеет обрабатывать шумовые сигналы
- умеет оценивать параметры статистического распределения из набора экспериментальных данных
- умеет применять детерминистические методы оптимизации и метод крыловских подпространств: метод сопряженных градиентов и его модификации.
- умеет применять методы машинного обучения для решения задач обработки научных данных
- умеет применять оптимизация с ограничениями, метод множителей Лагранжа, линейное программирование, симплекс-метод.
- умеет работать с системами с общей памятью.
Содержание учебной дисциплины
- Обзор форматов научных данных и основных способов хранения данных
- Распределенная обработка данных
- Применение методов оптимизации к анализу экспериментальных данных
- Обработка экспериментальных данных
- Работа со статистическими распределениями.
- Применение методов машинного обучения для анализа физических данных
Элементы контроля
- Контрольные работы на занятияхКонтрольные работы проводятся на практических занятиях и состоят в написании программного кода на языке Python, который реализует те или иные методы обработки и анализа данных. Код должен быть написан в течение проведения контрольной и загружен в систему GitHub Classroom, или другую систему по указанию преподавателя.
- ЭкзаменУстный экзамен по теории проводится в сессию после 4го модуля.
- Домашнее заданиеИндивидуальное домашнее задание состоит в написании программ на языке Python, реализующих те или иные методы обработки и анализа данных, изучаемые в курсе.
Промежуточная аттестация
- 2024/2025 4th moduleИтоговая оценка по курсу рассчитывается по формуле: И = max { 0.3 * Э + 0.7 * Н, min {Н, 5} }, где max {X, Y} и min {X, Y} обозначают, соответственно, максимальное и минимальное среди двух аргументов, И — итоговая оценка, Э — оценка за экзамен, Н — накопленная оценка, которая в свою очередь рассчитывается по формуле: Н = 15/70 * КР + 55/70 * ДЗ, где Н — накопленная оценка, КР — оценка за контрольные работы, ДЗ — оценка за домашние задания, которая в свою очередь рассчитывается как средняя оценка всех домашних работ, за исключением той одной из них, которая была оценена на минимальную оценку. Не выполненные и не сданные вовремя домашние работы учитываются с оценкой 0.
Список литературы
Рекомендуемая основная литература
- Andrew Bird, Dr Lau Cher Han, Mario Corchero Jiménez, Graham Lee, & Corey Wade. (2019). The Python Workshop : A New, Interactive Approach to Learning Python. Birmingham: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2291496
- S.L. Hamilton. (2019). Pythons. [N.p.]: A&D Xtreme. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1729879
- Toby Donaldson. (2013). Python : Visual QuickStart Guide. [N.p.]: Peachpit Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1600205
- Сухарев, А. Г. Курс методов оптимизации : учебное пособие / А. Г. Сухарев, А. В. Тимохов, В. В. Федоров. — 2-е изд. — Москва : ФИЗМАТЛИТ, 2011. — 384 с. — ISBN 978-5-9221-0559-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/2330 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
Рекомендуемая дополнительная литература
- 9781785284571 - Romano, Fabrizio - Learning Python - 2015 - Packt Publishing - http://search.ebscohost.com/login.aspx?direct=true&db=nlebk&AN=1133614 - nlebk - 1133614
- Фролов А.Н. - Краткий курс теории вероятностей и математической статистики - Издательство "Лань" - 2017 - 304с. - ISBN: 978-5-8114-2460-3 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/93706