Адаптационный курс «Теория баз данных»
Один из основных методологических принципов развития информационных технологий – абстракция – естественным образом привёл исследователей и технологов к выделению предметной области под названием «базы данных» (БД). Она включает в себя теории, методы и технологии: 1) формализации концептуальных, логических и физических моделей данных; 2) построения систем управления базами данных (СУБД); 3) оптимального доступа к данным с использованием СУБД. 4) нереляционная форма хранения данных. 5) Современные технологии доступа к данным. Данный курс предоставляет введение в теорию баз данных, предлагает обзор современных технологий хранения и извлечения данных.
Литература:
- Дейт К. Введение в системы баз данных, 8-е издание. – Вильямс, 2006.
- Д. Кренке. Теория и практика построения баз данных. – Питер, 2005.
- Скотт В. Эмблер, Прамодкумар Дж. Садаладж Рефакторинг баз данных. Эволюционное проектирование. – Вильямс, 2007.
Адаптационный курс «Макроэкономика»
Финансовые рынки являются важнейшим элементом современной экономики, поскольку обеспечивают превращение сбережений населения в производственные инвестиции, необходимые для роста. В данном курсе обсуждается, как должна работать финансовая система, и почему она может давать сбои, как определяется денежная масса в экономике и к чему приводят ее колебания. Также данный курс посвящен политике государства по предотвращению или смягчению экономических спадов, основным типам политики (денежной и бюджетной) и обсуждению основных инструментов, механизмов и принципов их действия. Обсуждаются проблемы, с которыми чаще всего сталкиваются развивающиеся экономики – стабилизация инфляции, валютные кризисы, внезапное изменение направления потоков капитала.
Литература:
- Blanchard O. Macroeconomics, Third Edition, University Prentice Hall. 2003. Ch.1-5.
- Мэнкью Г. Макроэкономика. М., 1994.
- Romer, D. Advanced Macroeconomics. 4th ed. McGrow Hill Book Company: London. 2012
- Дорнбуш Р., Фишер С. Макроэкономика М., 1998.
- Сакс Дж., Ларрен Ф. Макроэкономика. Глобальный подход. М., 1996.
Адаптационный курс «Эконометрика»
Цель данного курса – введение в эконометрику. Предполагается, что слушатель обладает знаниями в области дисциплин линейной алгебры, теории вероятностей и математической статистики. В данном курсе рассматриваются классические разделы эконометрики: линейные регрессионные модели (метод наименьших квадратов, статистические свойства оценок коэффициентов регрессии, коэффициент детерминации, проверка гипотезы о линейных ограничениях, использование дамми-переменных), проблемы, которые могут возникать в линейных моделях (мультиколлинеарность, гетероскедастичность, автокорреляция, эндогенность, мнимая регрессия), будут рассмотрены аспекты анализа временных рядов (ARMA и GARCH модели, причинность по Грейнджеру, тест на стационарность). Обучающиеся смогут проводить тесты для проверки гипотез о значимости коэффициентов регрессии, о корректной спецификации модели, об устойчивости модели, тесты на наличие пропущенных переменных. В качестве методов борьбы с нарушением предпосылок линейной регрессии будут рассмотрены метод инструментальных переменных, поправки в форме Уайта, Прайса-Винстена, ридж и LASSO регрессии. Также будут рассмотрены и модели качественного выбора: метод максимального правдоподобия, логит-модель, пробит-модель, порядковые регрессии, методы оценки качества моделей (ROC-кривая, TPR/FPR), тесты на значимость коэффициентов регрессии. Дополнительно будут рассмотрены квантильные регрессии, проблема цензурированных данных, tobit-регрессия, регрессия Хекмана.
Литература:
- J.M.Wooldridge. Introductory Econometrics. A modern approach. 5th edition, 2013.
- Econometric Views User's Guide. Quantitative Micro Software, LLC.
- Greene W.H. Econometric Analysis. Prentice Hall int. 7th ed., 2011.
- Kennedy P. A Guide to Econometrics. Blackwell Publishers, 6th edition, 2008.
- Verbeek, M. A Guide to Modern Econometrics. Wiley, 4rd edition, 2012.
Адаптационный курс «Машинное обучение»
Задача курса — научить слушателей находить скрытые закономерности в данных с помощью методов машинного обучения. На лекциях разбираются все основные модели (линейные, логические, метрические, байесовские) и постановки задач машинного обучения. Большое внимание уделяется прикладным аспектам анализа данных: метрикам качества, оцениванию обобщающей способности, подготовке данных и работе со сложными типами признаков. В курсе изучаются современные технологии и библиотеки, используемые в анализе данных. Все темы сопровождаются практическими заданиями на языке Python и соревнованиями по анализу данных.
Литература:
- Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
- Hastie, T., Tibshirani, R., Friedman, J. The Elements of Statistical Learning, 2nd edition. —Springer, 2009
Современные методы анализа данных: глубинное обучение
Глубинное обучение - стремительно развивающаяся область машинного обучения по большим объемам данных. В задачах, где объем обучающей выборки достаточно велик, методы глубинного обучения не просто значительно опережают все известные подходы, но и приближаются к возможностям человеческого интеллекта. Несмотря на то, что теория глубинных нейронных сетей еще не построена, они уже успешно применяются на практике. В этом курсе будут рассмотрены самые современные подходы к построению, обучению и применению глубинных нейронных сетей для решения различных индустриальных задач.
Литература:
- LeCun, Yann, Yoshua Bengio, and Geoffrey Hinton. “Deep learning.” Nature 521, no. 7553 (2015): 436-444.
- ImageNet Classification with Deep Convolutional Neural Networks, Alex Krizhevsky, Ilya Sutskever, Geoffrey E Hinton, NIPS 2012
- Li Deng, Dong Yu, Deep Learning: Methods and Applications, Foundations and trends in signal processing, Now Publishers, 2014
Современные методы принятия решений: алгоритмы обработки больших данных
В рамках курса студенты познакомятся с методами работы с большими массивами данных разного вида, включая тексты и изображения. Студенты научатся применять их в реальных задачах, с которыми сегодня сталкиваются специалисты по анализу данных. Будут рассмотрены как способы распараллеливания и ускорения работы известных методов, так и новые подходы, основанные на наличии большой обучающей выборки. В курсе изучаются современные подходы к обработке больших данных на языке Python с использованием таких инструментов как IPython, Apache Spark, vowpal wabbit, xgboost, word2vec и TensorFlow.
Литература:
- Холден Карау, Энди Конвински, «Изучаем Spark. Молниеносный анализ данных», O’REILLY , 2015
- Francesco Pierfederici, Distributed Computing with Python, PACKT, 2016.
- Aurélien Géron, Hands-On Machine Learning with Scikit-Learn and TensorFlow: Techniques and Tools to Build, O'Reilly Media, Inc., 2017
Финансы банка
В курсе рассматриваются бизнес модели коммерческих банков, задачи управления активами и пассивами банка, источники доходов и расходов, капитал банка, среда функционирования банков, а также банковские кризисы. Данный курс также дает введение в основы корпоративных финансов, подчеркивая их применение к широкому спектру реальных задач, охватывающих личные финансы, принятие корпоративных решений и финансовое посредничество. Ключевые концепции и приложения включают в себя: временную стоимость денег, риск-доходность, стоимость капитала, процентные ставки, пенсионные сбережения, ипотечное финансирование, оценку активов, построение дисконтированных денежных потоков (DCF), внутренняя норма доходности, NPV, срок окупаемости.
Литература:
- Волков Д., Цехомский Н., Щербакова О. и др. Финансы банка. М.: Корпоративный университет Сбербанка, 2015.
- Агуреев Е., Щербакова О., Шибанов О. и др. Кейсы по программам Школы финансов. М.: Корпоративный университет Сбербанка, 2016.
Финансовые технологии
В данном курсе рассматривается конкурентный ландшафт современных финансовых организаций: стратегия экосистемы, новые fintech-маркетплейсы, с использованием disruptive технологий, цифровой фронт-офис, кастомизация на основе применения когнитивных технологий для обработки внутренних и внешних данных, сокращения сроков проведения изменений (agile), многоканального обслуживания клиентов, on-demand услуги с быстро изменяющимся ценностным предложением, различными ценами для разных категорий клиентов, а также безопасные операции, снижающие риски мошенничества посредством использования технологии блокчейн.
Литература:
- Susanne Chishti, Janos Barberis, The FINTECH Book: The Financial Technology Handbook for Investors, Wiley, 2016
- Paolo Sironi, FinTech Innovation: From Robo-Advisors to Goal Based Investing and Gamification, Wiley, 2016
- John Waupsh, Bankruption: How Community Banking Can Survive Fintech, Wiley, 2016
Байесовские методы в анализе данных
Курс посвящен т.н. байесовским методам решения задач машинного обучения, которые в настоящее время активно развиваются в мире. Большинство современных научных публикаций по машинному обучению используют вероятностное моделирование, опирающееся на байесовский подход к теории вероятностей. Основной задачей курса является привитие студентам навыков самостоятельного построения сложных вероятностных моделей обработки данных, используя стандартные модели в качестве своеобразных "кирпичиков". Особое внимание уделяется приближенным байесовским методам, позволяющим обсчитывать сложные вероятностные модели. Будут рассмотрены сопряжённые распределения, байесовская проверка гипотез, EM-алгоритм в общем виде, ЕМ-алгоритм для задачи разделения смеси нормальных распределений, вероятностная модель главных компонент (PCA), её преимущества относительно стандартного PCA, приближение вероятностных интегралов с помощью сэмплирования из распределения, теоретические свойства марковских цепей: однородность, эргодичность, инвариантные распределения, общая схема методов MCMC, схема Гиббса, схема Метрополиса-Хастингса, тематическая модель Latent Dirichlet Allocation (LDA), обучение и вывод в модели LDA с помощью вариационного подхода, способы использования LDA.
Литература:
- Barber D. Bayesian Reasoning and Machine Learning. Cambridge University Press, 2012.
- Bishop C.M. Pattern Recognition and Machine Learning. Springer, 2006.
- Bayesian Data Analysis, Third Edition (Chapman & Hall/CRC Texts in Statistical Science) 3rd Edition by Andrew Gelman, John B. Carlin, Hal S. Stern, David B. Dunson, Aki Vehtari, Donald B. Rubin, 2013
- Mackay D.J.C. Information Theory, Inference, and Learning Algorithms. Cambridge University Press, 2003. http://www.inference.phy.cam.ac.uk/itprnn/book.html
- Ветров Д.П., Кропотов Д.А. Байесовские методы машинного обучения, учебное пособие по спецкурсу, 2007. Файлы BayesML-2007-textbook-1.pdf, BayesML-2007-textbook-2.pdf на вики-ресурсе MachineLearning.ru.
Анализ текстов. Генеративные модели
В данном курсе рассматриваются актуальные задачи обработки естественного языка (NLP) — как хорошо изученные (оценка окраса текста, определение частей речи, определение языка, анализ морфологии, обучение с учителем на текстах и другие), так и активно развивающиеся (диалоговые системы и чат-боты и т.д.). Весь материал сопровождается практическими задачами анализа интернет-данных и больших текстовых корпусов.
Литература:
- Joint Learning of Words and Meaning Representations for Open-Text Semantic Parsing, Antoine Bordes, Xavier Glorot, Jason Weston and Yoshua Bengio (2012), in: Proceedings of the 15th International Conference on Artificial Intelligence and Statistics (AISTATS)
- Oriol Vinyals, Quoc V. Le “A Neural Conversational Model” (2015) Computation and Language, Cornell University Library
- Bahdanau D., Cho K., Bengio Y. Neural machine translation by jointly learning to align and translate
- Li J. et al. A diversity-promoting objective function for neural conversation models
Основы риск-менеджмента
Цель курса – рассмотреть области применения математического моделирования и методов анализа данных в практических банковских задачах и финансовых стартапах. Рассматривается понятие риска, приводится классификация типов риска в банковской сфере (кредитный, рыночный, операционный, процентный, трансфертный, имущественный, риск ликвидности и др.), рассматривается трейд-офф между вероятностью потерь и недополученным процентным доходом, изучаются модели экономического капитала, стресс-тестирования, агрегированного риска. Задачи классификации и прогноза в задаче кредитного риска, приводится обзор классических банковских инструментов (скоринговые карты, деревья решений), производится сравнение с бенчмарками. Рассматриваются задачи клиентского оттока, максимизации NPV по маркетинговым кампаниям, соотношения риск доходность. Дополнительно рассматривается проблема выбора в условиях неопределенности и риска, рассматриваются понятия нечеткой логики и модели теорий неопределенности.
Литература:
- Кулик В., Ведяхин А., Удовиченко О. и др. Основы риск-менеджмента. 2 изд. М.: Корпоративный университет Сбербанка, 2017.
- Siddiqi, Naeem. Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring. 2005, SAS Institute Inc
- Crouhy, M, Galai D., Mark, R. The Essentials of Risk Management, McGraw-Hill, 2005
- Joël Bessis, Risk Management in Banking, 4th Edition, Wiley, 2015
- Gareth W. Peters, Pavel V. Shevchenko, Advances in Heavy Tailed Risk Modeling: A Handbook of Operational Risk, John Wiley & Sons, 2015
- Pieter Klaassen, Idzard van Eeghen, Economic Capital: How It Works, and What Every Manager Needs to Know, Elsevier, 2009
- Lyn C. Thomas, David B. Edelman, Jonathan N. Crook, Credit Scoring and Its Applications, SIAM, 2002
- Уткин Л.В., Анализ риска и принятие решений при неполной информации. - СПб.: Наука, 2007
- Timothy J. Ross, Fuzzy Logic with Engineering Applications, Third Edition, John Wiley & Sons, 2010
Банковская ИТ-инфраструктура
Цель данного курса сформировать у слушателя навык правильно ставить и реализовывать задачи по информатизации процессов Банка в целях повышения операционной эффективности и создания устойчивых конкурентных преимуществ. В курсе рассматриваются глобальные тренды ИТ в банковской индустрии, изменения банковской отрасли, диджитализация банковских услуг, организационные принципы Waterfall / Agile, парадигмы Open Source, API, облачные вычисления. Особое внимание в курсе уделяется подходам к внедрению инновационных решений с использованием ИТ в бизнесе (мобильные приложения, аналитика Big Data). Дополнительно будут затронуты проблемы банковской кибер-безопасности, основные схемы кибер-атак и методы противодействия.
Литература:
- Курс «Современная ИТ-инфраструктура» (Галинский А. и др.). Виртуальная школа Сбербанка, 2016 (sberbank-school.ru)
- Angel Berges, Mauro F. Guillen, Juan Pedro Moreno, Emilio Ontiveros, New Era in Banking: The Landscape After the Battle, 2014
- Dan Schatt, Renaud Laplanche Virtual Banking: A Guide to Innovation and Partnering, Wiley Finance, 2014
- Brett King, Bank 3.0: Why Banking Is No Longer Somewhere You Go But Something You Do Hardcover, 201
- Thomas J. Mowbray, Cybersecurity: Managing Systems, Conducting Testing, and Investigating Intrusions, Global Banking & Finance review, 2014
Рекомендательные системы и поиск закономерностей в данных
Курс посвящен активно развивающейся области интеллектуальных систем и машинного обучения – рекомендательным системам и алгоритмам. Особое внимание уделено базовым алгоритмам и моделям рекомендательных систем, а также более продвинутым алгоритмам и моделям последних лет. Рассматривается таксономия рекомендательных систем, так описаны основные области их применения по отраслям (музыка, фильмы, книги, путешествия, образование и т.п.) и по характеру моделей (контентные, коллаборативные, гибридные, учитывающие контекст, многокритериальные и т.д.), приведены примеры реальных рекомендательных систем в России и на мировой арене, дан обзор основных научных мероприятий, свободно распространяемых систем и наборов данных международных конкурсов. Особое внимание планируется уделить практическим аспектам (например, ответу на вопрос «Как построить свою рекомендательную систему?») и межпредметной связи с машинным обучением, майнингом данных и информационном поиском.
Литература:
- Melville P., Mooney R., Nagarajan R. Content-Boosted Collaborative Filtering for Improved Recommendations, University of Texas, USA, 2002
- Charu C. Aggarwal, Recommender Systems: The Textbook, Springer, 2016
- Kim Falk, Practical Recommender Systems, Manning Publications Company, 2017
- Dietmar Jannach, Markus Zanker, Alexander Felfernig, Gerhard Friedrich, Recommender Systems: An Introduction, Cambridge University Press, 2010
Технологии мобильных приложений
Цель дисциплины - ознакомить студентов с последними тенденциями разработки мобильных приложений и позволить обучающимся приобрести навыки внедрения существующих технологий в мобильные приложения, чтобы достичь цели разработки приложения – создать ценность для пользователя.
Успешное освоение курса позволит студентам:
- ознакомиться с последними версиями мобильных операционных систем и то, как они отличаются от предшествующих;
- изучить новые возможности, которые могут предоставить мобильные среды приложений;
- изучить дополнительные методы и подходы к программированию мобильных приложений;
- овладеть базовыми навыками разработки, анализа и тестирования мобильных приложений с использованием для участия в проектной работе.
Литература:
- Android Application Development in 24 Hours, Sams Teach Yourself (4th Edition) / Carmen Delessio, Lauren Darcey, Shane Conder. - SAMS, 2015
- Android Application Development All-in-One For Dummies, 2nd Edition / Barry Burd. - John Wiley & Sons Inc., 2015.
- Google Android Developer Site / Google Inc, 2016. - URL: https://developer.android.com/samples/index.html.
- Neil Smyth. iOS 9 App Development Essentials: Learn to Develop iOS 9 Apps Using Xcode 7 and Swift 2/ CreateSpace Independent Publishing Platform, 2015
Управление ИТ-проектами и командами разработчиков в сфере data science
Данный курс дает представления об инструментах, с помощью которых возможно наладить взаимодействие в проектной команде, удовлетворить требования заказчиков, определить ценных и полезных сотрудников в проектной команде. Прежде всего рассматриваются ИТ-проекты, связанные с разработкой ПО, сервисов, а также data science.
Менеджмент является неотъемлемой частью любой деятельности. Он проявляется при работе фрилансеров, тим-лидеров и старших разработчиков, при реализации более крупных проектов. Понимание общих принципов и конкретных рекомендаций по ведению проектной и процессной деятельности, построение коммуникаций и правильная мотивация команды — важная составляющая успеха любого проекта в сфере ИТ.
Курс знакомит слушателей с источниками знаний о менеджменте, а также с практическими аспектами ведения проектов, успешно применяемыми в лучших российских ИТ-компаниях.
Литература:
- Gene Kim, Kevin Behr, George Spafford, The Phoenix Project: A Novel About IT, DevOps, and Helping Your Business Win, IT Revolution Press, 2014
- Jennifer Davis, Katherine Daniels, Effective DevOps: Building a Culture of Collaboration, Affinity, and Tooling at Scale, O'Reilly Media, Inc., 2016
- Mark C. Layton, Agile Project Management For Dummies, John Wiley & Sons, 2012
Структурный анализ и визуализация сетей
Курс знакомит студентов с новыми и активно развивающимися междисциплинарными областями науки о сетях (network science). Социологи начали изучать социальные сети, привлекая внимание физиков, ученых из области компьютерных наук, экономистов, биологов, лингвистов, что привело к появлению по-настоящему междисциплинарной области исследований. Несмотря на разнообразие процессов, которые порождают сети, а также объекты и отношения, которые служат узлами и ребрами в этих сетях, все сети имеют общие статистические и структурные свойства. Взаимодействие между порядком и беспорядком создает сложные сетевые структуры, которые находятся в центре внимания исследования. В ходе курса будут рассмотрены методы статистического и структурного анализа сетей, моделей формирования и эволюции сетей и процессов, развивающихся в сети. Особое внимание будет уделено практическому анализу и визуализации реальных сетей с использованием доступных программных средств, современных языков программирования и библиотек.
Литература:
- Mark Newman. "Networks: An Introduction". Oxford University Press, 2010.
- David Easley and John Kleinberg. "Networks, Crowds, and Markets: Reasoning About a Highly Connected World." Cambridge University Press 2010.
- Albert-Laszlo Barabasi and Eric Bonabeau. Scale Free Networks. Scientific American, p 50-59, 2003
- Mark Newman. The physics of networks. Physics Today,2008
- Stanley Milgram. The Small-World Problem. Psychology Today, Vol 1, No 1, pp 61-67, 1967
- J. Travers and S. Milgram. An Experimental Study of the Small World Problem. Sociometry, vol 32, No 4, pp 425-433, 1969
- Mark Granovetter. The strengtth of weak ties, American Journal of Sociology, 78(6):1360-1380, 1973.