Home
Projects
Resources
Alternatives
Blog
Sign In
Compling Nlp Hse Course
Save
Abandoned
Материалы курса по компьютерной лингвистике Школы Лингвистики НИУ ВШЭ
Overview
Reviews
Resources
Project README
Материалы курса по компьютерной лингвистике (Natural Language Processing course materials)
Jupyter-ноутбуки 2021-22
Предобработка текста (Text preprocessing)
Токенизация, лемматизация, стемминг, pymorphy, mystem, regex, razdel.
Классификация текста (мешок слов) (Bag-of-words classification)
TFIDF, CountVectorizer, LogReg, KNN, DecisionTrees, Naive Bayes, RandomForest, косинусная близость, тональность текста
Поиск и исправление опечаток (Spellchecking)
Алгоритм Норвига, расстояние Левенштейна, символьные нграммы, SymSpell.
Базовое языковое моделирование (Basic Language Modelling)
Вероятность слова, Ngram language model, перплексия, генерация текста.
Тематическое моделирование (Topic modelling)
Матричные разложения (SVD, NMF), LDA, перплексия, когерентность.
Векторные представления слов (word2vec/fastext) (Word embeddings)
CBOW, Skip-gram, negative sampling, deep learning basics, sigmoid, softmax.
WSD/WSI
Adagram, кластеризация контекстов, wordnet, алгоритм Леска.
RNN и извлечение именованных сущностей (Named Entity Recognition)
LSTM, GRU, Bidirectional RNN, IOB кодировка, sequence labelling.
Использование предобученных моделей (Fine-tuning pretrained models)
Transformer, BERT, HuggingFace, fine-tuning.
Машинный перевод (Machine Translation) - TBA
Question answering - TBA
Speech2Text - TBA
Архивные jupyter-ноутбуки
NER с помощью грамматик (yargy)
Few-shot NER (deep pavlov)
Деревья зависимостей (Dependency trees)
Тематическое моделирование в BigARTM
Keyword extraction
Определение языка
Коллокации
CNN (tf)
,
CNN (pytorch)
RNN (pytorch)
Deep learning intro (tf)
,
Deep learning intro (pytorch)
Кластеризация (Clustering)
Морфологическая дизамбигуация
Использование предобученных моделей (pytorch)
Viterbi/MEMM
Sentence tokenization
Relation extraction
Semantic Role Labelling
Jupyter-notebooks in English
Text preprocessing
Basic Language modelling
Topic modelling
Word Embeddings
Open Source Agenda is not affiliated with "Compling Nlp Hse Course" Project. README Source:
mannefedov/compling_nlp_hse_course
Stars
118
Open Issues
0
Last Commit
2 years ago
Tags
Computational Linguistics
Course
Hse
Machine Learning
Nlp
Python
Natural Language Processing
Open Source Agenda Badge
Submit Review
Review Your Favorite Project
Submit Resource
Articles, Courses, Videos
Submit Article
Submit a post to our blog
From the blog
Dec 11, 2022
How to Choose Which Programming Language to Learn First?
From the blog
Dec 11, 2022
How to Choose Which Programming Language to Learn First?
Home
Projects
Resources
Alternatives
Blog
Sign In
Sign In to OSA
I agree with
Terms of Service
and
Privacy Policy
Sign In with Github