Извличане на информация
Срок на обучение: 3 семестъра
Форма на обучение: редовна
Минимален брой ECTS кредити: 90
Ръководител на програмата: доц. д-р Иван Койчев
ФМИ, ул. Дж. Баучер 5, София 1164
Тел.: +359 2 9710400
Сайт:
E-mail: ivan.koychev AT fmi.uni-sofia.bg
"Извличането на информация" (Information Retrieval or Search Engine Technologies) е бързо развиваща се област през последното десетилетие. Основна предпоставка за това е експлозивното развитие на уеб, цифровите библиотеки и други електронни хранилища на информация. Това поражда необходимостта от разработване на методи и алгоритми за лесно и бързо намираме полезна информация в тях. В момента представената в електронен вид неструктурираната информация (текст) значително надхвърля по обем структурираната информация (данни). Системите за търсене и извличане на полезна информация в океана от неструктурирана (полу-структурирана) информация са със значително по-голям пазарен дял в настоящето.
Цел на програмата
Магистърската програма си поставя за цел да запознае студентите с основните методи и алгоритми на извличането на информация, които се опитват да отидат по-далече от търсене по ключова дума, като добавят и степен на интелигентност в разработваните системи. Студентите ще се запознаят с основните методи за обработка на естествен език и съответните езикови ресурси и ще развият умения за решаване на конкретни задачи, като комбинират успешно необходимите последователности от стъпки и преценяват ролята на необходимите ресурси и алгоритми за успешна реализации.
Обучение
Метод на преподаване
- Обучението по дисциплините в програмата се осъществява чрез комбиниране/допълване на лекции + семинарни + дискусии + индивидуални задачи. Основният материал се поднася на студентите по време на лекции, като се използва също и формата на дискусия. Студентите подготвят сами задачите за самостоятелна работа.
- Семинарните занятия включват решаване на допълнителни задачи по темата, разглеждане на варианти на задачата за самостоятелна работа с цел да се илюстрират специфични алгоритми и методи.
- Необходимите ресурси за обучение са следните: компютър и мултимедия за презентация на слайдове.
Програмата ще даде на студентите:
- Знания за основните алгоритми и методите зад уеб-търсачките, сайтовете за е-търговия, препоръчващите системи, филтрирането на имейл спам, корекцията на правописа, машинния превод и др. Методи за проектиране и разработване на софтуерни системи и услуги.
- Уменията, придобити от опита при разработване курсови проекти на реални приложения, като например: обработка на текст; създаване на машини за търсене; интелигентни инструменти за подобряване на точността на търсене; системи за филтриране на спам, категоризация и групиране на документи.
- Отворени врати към възможности за работа в компании за търсене на информация и електронна търговия.
Професионални компетенции
Завършилите обучението по учебна програма ще придобият следните основни компетенции:
- Познаване и умения за използване на алгоритми и методи, необходими за изграждане на системи за търсене и извличане на информация колекции от текстови документи и уеб като:
- ефективно индексиране на текстови документи;
- булеви, векторно пространство и статистически модели за търсене и извличане на информация;
- въпроси, свързани с оценка на ефективността на такива системи и потребителския интерфейс;
- групиране и класификация на документи; филтриране и препоръчване.
- уеб търсене, включително: обхождане и индексиране; разпределени индекси; алгоритми за оценка на основата връзка, уеб метаданни;
- Познаване и умения за използване на алгоритми и методи, необходими за обработка на естествен език за реализиране на системи, подпомагащи потребителя в работата с текст като:
- синтактично и семантично анализиране;
-
- откриване на характеризиращи термини и понятия;
-
- резюмиране и машинен превод;
-
- и "горещите" теми като автоматичен анализ на мнения и отношение по дадени теми.
- Умения за проектиране и разработване на разпределени софтуерни системи и услуги.
Професионална реализация
Магистрите ще могат да намерят реализация в сферата на: информационните технологии, като разработчици на програми за анализ на текстове и програми за извличане на информация; като създатели на платформи за обработки на големи масиви от данни; като изследователи и преподаватели в академичните институции; като експерти по ИТ към държавни или международни институции, както и към фирми за специализирани услуги, издателства, библиотеки и др.