2023/2024
Анализ сложноструктурированных данных, сетей и текстов
Статус:
Маго-лего
Кто читает:
Департамент социологии
Когда читается:
1, 2 модуль
Охват аудитории:
для своего кампуса
Преподаватели:
Мальцева Дарья Васильевна
Язык:
русский
Кредиты:
6
Контактные часы:
40
Программа дисциплины
Аннотация
Курс по анализу сложноструктурированных данных, сетей и текстов создан с целью ознакомления студентов с методологией, методами и программным инструментарием, сформированным в вычислительных социальных науках для анализа сетевых и текстовых данных, по своей природе являющихся данными с комплексной (сложной) структурой. В курсе будут разобраны методы сбора, предобработки, анализа и визуализации сложноструктурированных данных, с акцентом на сетевом анализе текстовой информации. В первом модуле после введения в анализ неструктурированных данных слушатели познакомятся с инструментами для предобработки текста, рассмотрят особенности выявления скрытых тем, кластеризации и классификации текстов, а также рассмотрят вопросы извлечения именованных сущностей и отношений между ними, составляющих основу сетевой структуры.Во втором модуле слушатели познакомятся с базовыми понятиями анализа социальных сетей и основными метриками, применяемыми в сетевом анализе для изучения социальных структур на глобальном и локальном уровнях для выделения важных узлов, диад, триад и сплоченных подгрупп в сети. Слушатели научатся основам построения сетевых данных и их последующей обработки в программах для анализа и визуализации сетевых данных. После прохождения курса у студентов будут развиты навыки работы со сложноструктурированными данными, достаточные для проведения самостоятельного анализа текстовых данных, в т.ч. с применением методологии сетевого анализа. Слушатели будут иметь возможность применить полученные навыки для сетевого анализа сложноструктурированных текстовых данных. Для работы применяется языки программирования Python и R и программы для анализа и визуализации сетей Pajek и Gephi.
Цель освоения дисциплины
- Цель курса по анализу сложноструктурированных данных, сетей и текстов - ознакомление студентов с методологией, методами и программным инструментарием, сформированным в вычислительных социальных науках для анализа сетевых и текстовых данных, по своей природе являющихся данными с комплексной (сложной) структурой. В результате освоения дисциплины у студентов будут развиты навыки работы со сложноструктурированными данными, достаточные для проведения самостоятельного анализа текстовых данных, в т.ч. с применением методологии сетевого анализа. Слушатели будут знакомы с основными методами сбора, предобработки, анализа и визуализации сложноструктурированных данных, с акцентом на сетевом анализе текстовой информации. Слушатели будут иметь возможность применить полученные навыки на практике для сетевого анализа сложноструктурированных текстовых данных. В качестве консультантов студентам будут предложены консультанты из числа сотрудников МЛ ПСА, которые смогут дать рекомендации о применимости сетевого и иных видов анализа в различных исследовательских проектах. Для работы применяется языки программирования Python и R и программы для анализа и визуализации сетей Pajek и Gephi. Предполагается, что студенты имеют начальный уровень знаний программного обеспечения Python и R.
Планируемые результаты обучения
- Уметь интерпретировать результаты анализа данных в SPSS с учетом ограничений и возможностей используемого инструментария;
- - знать и уметь использовать возможности персонологического изучения личности, заключенные в классических аналитических теориях; - знать специфику и уметь применять техники глубинного анализа личности; - иметь навыки экзистенциально-психологического анализа личности; - иметь навык аналитической интерпретации индивидуальных жизненных случаев; - умение строить и применять персонологические модели консультирования и исследования, основанные на синтезе аналитических практик персонологии
- - Man kann über seinen Tagesablauf, seine Begegnungen sprechen - kann über seinen Arbeitsplatz, seinen Arbeitstag, über die Arbeit am Computer sprechen - kann an einem Dialog über ein Geschäftstreffen teilnehmen - kann einen Brief schreiben, einen Termin vereinbaren - man kann Substantive, possessive Pronomina , Personalpronomina, Adjektive deklinieren
- - to perceive and process, in accordance with the goal, various information in a foreign language obtained from print, audiovisual and electronic sources of information within the framework of professional, socio-political and socio-cultural spheres of communication;
- - understand the emotionally rich information in direct communication with a native speaker; - Understand public speaking, including through technical means; - extract implicit information from an oral message of a monological or dialogical nature;
- - use etiquette of written language correctly; - increase the level of educational autonomy; - independently set the goals of educational activities aimed at continuous self-education, look for effective strategies for achieving goals;
- - Ability to determine cultural influences in SEA.
- - use multiples to value equity;
- - Особенности построения и работы функциональных схем счетных триггеров. Построение функциональных схем и принцип работы триггеров T-типа, D-типа. Построение универсального JK-триггера на основе RS-триггера с устранением состояния неопределенности.
- - Построение суммирующего двоичного счетчика методом синтеза. Варианты графического изображения функциональных схем счетчиков (вертикальное и горизонтальное). Схемы делителя частоты импульсной последовательности на основе двоичных счетчиков (назначение, принцип построения и работа делителей с различными коэффициентами деления).
Содержание учебной дисциплины
- Введение в сетевой анализ
- Данные для сетевого анализа
- Программы для анализа и визуализации социальных сетей
- Глобальные сетевые характеристики (дескриптивный анализ)
- Локальные сетевые характеристики: диады и триады в сети
- Локальные сетевые характеристики: сплоченные подгруппы в сети
- Продвинутая визуализация сетевых данных
- Презентации проектов студентов
- Введение в анализ неструктурированных данных, обсуждение структуры курса и правил его прохождения
Список литературы
Рекомендуемая основная литература
- Carrington, P. J., Scott, J., & Wasserman, S. (2005). Models and Methods in Social Network Analysis. Cambridge: Cambridge University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=132264
- Kolaczyk, E. D., & Csárdi, G. (2014). Statistical Analysis of Network Data with R. New York: Springer. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=783200
- Luke, D. A. . V. (DE-588)130032344, (DE-627)488060184, (DE-576)297960504, aut. (2015). A user’s guide to network analysis in R Douglas A. Luke. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edswao&AN=edswao.454121474
- Nooy, W. de, Mrvar, A., & Batagelj, V. (2005). Exploratory Social Network Analysis with Pajek. New York: Cambridge University Press. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=138973
Рекомендуемая дополнительная литература
- Nooy, W. de, Batagelj, V., & Mrvar, A. (2011). Exploratory Social Network Analysis with Pajek: Vol. Rev. and expanded 2nd ed. Cambridge University Press.