Доведение с нуля до ОФФЕРА 💸 - https://ds-mentor.ru/
🔎 NLP секция - неотъемлемая часть получения оффера для NLP инженера. Как раз таки в этом видео я даю базу, которую спрашивают на подобных собеседованиях и объясняю на пальцах эти темы так, чтобы ты точно на них ответил.
📊 Разбираем:
- TF-IDF, BM25, плюсы-минусы
- Лемматизация, стемминг, очистка и предобработка данных
- Word2Vec (CBOW, SkipGram, Negative Sampling), FastText, Glove
- Концептуальные различия между Word2Vec и TF-IDF
💡 Проверь свои знания и подготовься к собеседованию!
Привет!
Я Дима Савелко - Ментор и Deep Learning Engineer (ClassicML, NLP/LLM) с 4-летним опытом коммерческой разработки как на СНГ сегменте, так и на зарубежном рынке. Параллельно официальной работе руковожу AI-командой для реализации проектов, решая задачи бизнеса с помощью ИИ. Также обо мне вы можете почитать в моём телеграм-канале!
Ссылки:
tg: https://t.me/ngmdite
tg-channel: https://t.me/eboutdatascience
Таймкоды:
00:00 Что такое....?
00:21 Приветствие
01:20 Что такое TF-IDF?
01:51 Объяснение TF-IDF
04:18 Какие существуют плюсы-минусы TF-IDF?
05:10 Что такое BM25? | Объяснение
06:14 Как правильно предобработать текст?
07:01 Предобработка текста | Стемминг | Лемматизация
09:46 С нуля до ОФФЕРА
10:53 Какие бывают метрики близости текста? | Объяснение
13:14 Что такое Word2Vec?
13:50 Объяснение Word2Vec на пальцах руки
18:00 Что такое Negative Sampling?
18:32 Объяснение Negative Sampling на пальцах ноги
23:29 Ссылки на вопросы с собеседования - мой ТГ-канал
23:49 Отличие между Word2Vec и TF-IDF?
24:25 В чём отличие Word2Vec, Glove, FastText?
25:39 Объяснение отличия Word2Vec, Glove, FastText
28:45 В чём отличие между эмбеддингом большой и маленькой размерности ?
29:35 Концовка и сливы вопросов со ВТОРОЙ ЧАСТИ