MENU

Fun & Interesting

#2 NLP Собеседование Middle Data Scientist 1 часть | Вопросы и глубокое объяснение| Word2Vec, TF-IDF

Dima Savelko 1,164 6 days ago
Video Not Working? Fix It Now

Доведение с нуля до ОФФЕРА 💸 - https://ds-mentor.ru/ 🔎 NLP секция - неотъемлемая часть получения оффера для NLP инженера. Как раз таки в этом видео я даю базу, которую спрашивают на подобных собеседованиях и объясняю на пальцах эти темы так, чтобы ты точно на них ответил. 📊 Разбираем: - TF-IDF, BM25, плюсы-минусы - Лемматизация, стемминг, очистка и предобработка данных - Word2Vec (CBOW, SkipGram, Negative Sampling), FastText, Glove - Концептуальные различия между Word2Vec и TF-IDF 💡 Проверь свои знания и подготовься к собеседованию! Привет! Я Дима Савелко - Ментор и Deep Learning Engineer (ClassicML, NLP/LLM) с 4-летним опытом коммерческой разработки как на СНГ сегменте, так и на зарубежном рынке. Параллельно официальной работе руковожу AI-командой для реализации проектов, решая задачи бизнеса с помощью ИИ. Также обо мне вы можете почитать в моём телеграм-канале! Ссылки: tg: https://t.me/ngmdite tg-channel: https://t.me/eboutdatascience Таймкоды: 00:00 Что такое....? 00:21 Приветствие 01:20 Что такое TF-IDF? 01:51 Объяснение TF-IDF 04:18 Какие существуют плюсы-минусы TF-IDF? 05:10 Что такое BM25? | Объяснение 06:14 Как правильно предобработать текст? 07:01 Предобработка текста | Стемминг | Лемматизация 09:46 С нуля до ОФФЕРА 10:53 Какие бывают метрики близости текста? | Объяснение 13:14 Что такое Word2Vec? 13:50 Объяснение Word2Vec на пальцах руки 18:00 Что такое Negative Sampling? 18:32 Объяснение Negative Sampling на пальцах ноги 23:29 Ссылки на вопросы с собеседования - мой ТГ-канал 23:49 Отличие между Word2Vec и TF-IDF? 24:25 В чём отличие Word2Vec, Glove, FastText? 25:39 Объяснение отличия Word2Vec, Glove, FastText 28:45 В чём отличие между эмбеддингом большой и маленькой размерности ? 29:35 Концовка и сливы вопросов со ВТОРОЙ ЧАСТИ

Comment