در دو سال گذشته کلی خبر داشتیم که «وای این مدل جدید هوش مصنوعی رو دیدین؟» ولی خبر «وای دیپ سیک رو دیدین؟» کمی فرق داره! این مدل جدید چند قدم جلوتر از راهی است که تا الان اومدیم چون:
۱. آزاده
۲. با منابع بسیار کمتری درست شده
۳. با منابع بسیار کمتری قابل استفاده است
توی این ویدئو نگاهی می کنم به اینکه چطوری به اینجا رسیدن و چه فرصتهایی برای ما درست کردن؛ و البته یادمون نره که مدل چینی بخصوص برای ما یه گیرهای حادتری هم ممکنه داشته باشه.
لینکهای مرتبط:
- رادیوی ۱۴۷ در مورد جی پی تی: https://www.youtube.com/watch?v=3VULmrB7qTU
- شیوه ران کردن مدل ها در سیستم خودتون: https://www.youtube.com/watch?v=FRRndyC3kyM
- دیپ سیک در گیتهاب: https://github.com/deepseek-ai
نکته مهم: در این ویدئو چند باری اصطلاح توکن به جای پارامتر استفاده می شه. متاسفانه (: مثلا مدل فلان ۶۰ میلیون پارامتر داره ولی من اشتباهی می گم توکن. توکن اون چیزی است که موقع وروردی و خروجی گرفتن می بینیم. مثلا یه کلمه یا عبارت یا ریشه اش.
برای حمایت:
پتریان: https://www.patreon.com/jadijadi
یوتیوب: https://www.youtube.com/channel/UCgKePkWtPuF36bJy0n2cEMQ/join
بقیه لینکها: https://linktr.ee/jadijadi