@dsproglib - تمام پست های تلگرام کانال Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение

The service is also available in your language. For translation, pressEnglish

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение

دسته بندی

زبان جغرافیایی و کانال

Все самое полезное для дата сайентиста в одном канале. Список наших каналов: https://t.me/proglibrary/8353 Учиться у нас: https://proglib.io/w/907158ab Обратная связь: @proglibrary_feedback_bot По рекламе: @proglib_adv Прайс: @proglib_adv ertising

نمایش توضیحات

18 363⁺⁹

~3 579

20.67%

رتبه کلی تلگرام

در جهان

42 302جایی

از 78 777

در کشور, روسیه

5 597جایی

از 8 625

دسته بندی

884جایی

از 1 396

همه انتشارات

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۸ اردیبهشت, ۱۸:۰۲

18.4k3.6k20.67%

کپی شد!

✍️ Правила внедрения машинного обучения от Google У Google есть целый документ, в котором перечислены лучшие практики для специалистов по машинному обучению. Мы приведём избранные правила. ✅ Не бойтесь запускать продукт без машинного обучения Для машинного обучения всегда нужны данные. Если с этим есть проблема, то стоит попробовать использовать для своего продукта нечто другое, какую-нибудь простую эвристику. Иными словами, если ML не является абсолютно необходимым для вашего продукта, не применяйте его, пока у вас не будет достаточно данных. ✅ Сначала придумайте метрики Прежде чем определиться, что будет делать ваша система машинного обучения, попробуйте отследить как можно больше показателей в вашей текущей системе. ✅ Между сложной эвристикой и машинным обучением выбирайте второе Простая эвристика может помочь быстро запустить продукт. Сложную эвристику трудно поддерживать. Как только у вас появятся данные и базовое представление о том, чего вы пытаетесь достичь, переходите к машинному обучению. ✅ Сделайте первую модель простой и правильно настройте инфраструктуру Прежде чем кто-либо сможет использовать вашу новую продвинутую систему машинного обучения, вам необходимо будет определить: - Как давать примеры на вход алгоритму. - Что такое «хорошо» и «плохо» для вашей системы. - Как интегрировать модель в ваше приложение. Специалисты Google также советуют выбирать простые признаки для модели. ✅ Постарайтесь обнаружить проблемы перед экспортом моделей В частности, убедитесь, что производительность модели на отложенных данных находится на разумном уровне. Если у вас остаются опасения по поводу данных, не экспортируйте модель. ✅ Не зацикливайтесь на выборе оптимизируемой цели На ранних этапах процесса машинного обучения можно заметить, что улучшаются все показатели, даже те, которые вы не оптимизируете напрямую. Например, вам важно количество кликов и время, проведённое на сайте. Если вы оптимизируете количество кликов, скорее всего, вы увидите и увеличение времени на сайте. Старайтесь сохранять процесс простым и не перегружайте себя размышлениями о балансе различных метрик. ✅ Выберите простую метрику для вашей первой цели Проще всего моделировать поведение пользователя, которое можно наблюдать непосредственно. Например, факт клика по ссылке, оценки чего-либо и т.д. Избегайте моделирования косвенных эффектов вначале: не стоит пытаться отследить посетил ли пользователь сайт на следующий день и как долго он находился на сайте. Наконец, не нужно пытаться заставить машинное обучение выяснить, счастлив ли пользователь. ✅ Логируйте Стоит сохранять набор признаков, используемых во время применения модели, а затем использовать их во время обучения. Даже если вы не можете сделать это для каждого примера, сделайте хотя бы для небольшой части. ✅ Не тратьте время на новые признаки, если проблемой стали несогласованные цели Если цели, поставленные перед алгоритмом или системой машинного обучения, не соответствуют общим целям продукта или бизнеса, то не стоит пытаться решить их примитивным добавлением новых признаков.

ادامه مطلب ...

621

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۸ اردیبهشت, ۰۷:۰۷

18.4k3.6k20.67%

کپی شد!

🤖 Машинное обучение для людей: Разбираемся простыми словами Этот блогпост представляет собой большое введение для тех, кто хочет разобраться в машинном обучении без формул и теорем. Автор даёт много примеров реальных задач и их решений, а также старается писать об этом простым языком. Вот темы, которые охватывает блогпост: 🔹составляющие машинного обучения; 🔹алгоритмы обучения с учителем; 🔹алгоритмы обучения без учителя; 🔹уменьшение размерности; 🔹обучение с подкреплением; 🔹ансамбли; 🔹глубокое обучение и нейросети. 🔗 Ссылка на материал

ادامه مطلب ...

Машинное обучение для людей

None

1 113

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۷ اردیبهشت, ۱۸:۰۶

18.4k3.6k20.67%

کپی شد!

🤖🖼️ Как работают визуальные трансформеры: магия превращения пикселей в знания Визуальные трансформеры (Vision Transformers, ViTs) — класс моделей глубокого обучения, которые достигли выдающихся результатов в задачах классификации изображений. В основе ViTs лежит архитектура трансформеров, изначально разработанная для обработки естественного языка. В новой статье подробно рассказываем (с картинками), как работают такие модели компьютерного зрения. 🔗 Читать статью 🔗 Зеркало

3 739

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۷ اردیبهشت, ۰۷:۱۶

18.4k3.6k20.67%

کپی شد!

💵Моделирование курса валют методом Монте-Карло Метод Монте-Карло позволяет исследовать какой-либо случайный процесс, многократно имитируя его. Новая статья на «Хабре» посвящена анализу и прогнозированию валютных курсов с помощью такого подхода. Автор привёл примеры кода на Python и объяснил каждую используемую функцию. 🔗 Читать статью целиком

1 574

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۶ اردیبهشت, ۱۸:۱۷

18.4k3.6k20.67%

کپی شد!

🎓 Небольшая подборка бесплатных курсов по классическому машинному обучению ▫️Stanford CS229: Machine Learning by Andrew Ng Культовый курс по основам машинного обучения с Эндрю Ыном, американским учёным-информатиком. Представляет собой набор видеолекций. ▫️Алгоритмы Машинного обучения с нуля Курс на Stepik, на котором подробно разбираются основные алгоритмы классического ML: линейная и логистическая регрессии, метод k-ближайших соседей, случайный лес, метод главных компонент и др. ▫️HarvardX: CS50's Introduction to Artificial Intelligence with Python Курс, рассказывающий о концептах и алгоритмах, лежащих в основе современного ML. Также в программе есть теория вероятностей, нейросети, NLP и др. ▫️Машинное обучение (курс лекций, К.В. Воронцов) В курсе делается упор на глубокое понимание математических основ. Автор — зав. лаб. «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ.

ادامه مطلب ...

1 641

114

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۶ اردیبهشت, ۱۵:۰۰

18.4k3.6k20.67%

کپی شد!

ААА! Авторы Академии Аналитиков Авито выпустили бесплатный курс по прикладной статистике. В нём две части — первая по базе, которую важно знать для работы с данными, вторая по более сложным критериям. Пройти можно здесь. Курс научит собирать и валидировать кастомные критерии на реальных данных, а ещё решать задачи бизнеса с применением прикладной статистики.

1 578

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۶ اردیبهشت, ۰۹:۰۰

18.4k3.6k20.67%

کپی شد!

⭐ PySpark: небольшой гайд по библиотеке PySpark — это Python API для Apache Spark. А Apache Spark, в свою очередь, представляет собой движок для распределённой обработки задач, связанных с большими данными. Так, PySpark позволяет работать с данными любого размера. Библиотека поддерживает все функции Spark, включая Spark SQL и DataFrames. 🔸Spark SQL предназначен для работы со структурированными данными и позволяет сочетать SQL-запросы с программами Spark. 🔸PySpark DataFrames позволяет читать, записывать, трансформировать и анализировать данные. 👆К посту мы прикрепили небольшую шпаргалку по этим двум основным инструментам PySpark

ادامه مطلب ...

PySpark_SQL_Cheat_Sheet.pdf

1 663

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۶ اردیبهشت, ۰۶:۰۰

18.4k3.6k20.67%

کپی شد!

Телеграм-канал для ML-специалистов от Яндекса Yandex for ML — канал для ML-инженеров от Яндекса. Рассказываем, как мы обучаем наши модели и интегрируем их в продукты, как делаем сервисы с архитектурой сразу из нескольких нейросетей, как обучаем модели для специфичных задач и многое другое. Подписывайтесь 👉 @Yandex4ML

1 527

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۵ اردیبهشت, ۱۸:۰۵

18.4k3.6k20.67%

کپی شد!

💬 Итак, настало время расшифровать аббревиатуры. На выбор: 🔹AI/ИИ 🔹ML 🔹DL 🔹GPT 🔹DS 👇Только неправильные ответы👇

1 636

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۵ اردیبهشت, ۱۵:۰۰

18.4k3.6k20.67%

کپی شد!

Хотите учиться у экспертов в области IT? Школа анализа данных Яндекса принимает заявки до 12 мая, успейте зарегистрироваться. ШАД для вас, если вы: · интересуетесь Machine Learning · имеете хорошую математическую подготовку · уверенно владеете каким-либо языком программирования Программа длится два года, обучение бесплатное. Можно выбрать одно из направлений: Data Science, инфраструктура больших данных, разработка машинного обучения или анализ данных и ИИ в прикладных науках. Больше об учёбе в ШАД и возможностях для выпускников расскажем на днях открытых дверей. Узнать даты и зарегистрироваться можно по ссылке.

ادامه مطلب ...

file

1 668

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۵ اردیبهشت, ۱۱:۰۵

18.4k3.6k20.67%

کپی شد!

🐍🤔 «Задумчивый» код: временная сложность операций со структурами данных в Python Вы когда-нибудь задумывались, почему некоторые операции в Python выполняются мгновенно, а другие заставляют ваш код «задумчиво» работать? В новой статье разбираемся во временной сложности и узнаём, как писать быстрый и эффективный код. 🔗 Читать статью 🔗 Зеркало

1 360

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۵ اردیبهشت, ۰۹:۲۳

18.4k3.6k20.67%

کپی شد!

🦾🧠🏋Качаем мозги к лету! Хотите начать работать с большими данными, применять методы машинного обучения, статистический анализ, а также разрабатывать алгоритмы для извлечения информации? Тогда наш полугодовой курс «Математика для Data Science» от преподавателей МГУ, подходит для этого. И мы можете попасть на него со скидкой 40% ➡️ Математика для Data Science 29 990 ₽ 17 994 ₽ Вас ждет развернутая обратная связь по всем домашним заданиям, а также ссылки на полезные дополнительные материалы. У вас не будет шансов не усвоить какие-то темы курса👌 ⭐️ Переходите и активируйте бесплатные вводные занятия курса – https://proglib.io/w/b1ca6fe9

ادامه مطلب ...

1 578

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۵ اردیبهشت, ۰۷:۱۴

18.4k3.6k20.67%

کپی شد!

⚡ Вышел PyTorch 2.3 Основное нововведение — поддержка пользовательских ядер Triton в torch.compile. Их можно переносить без снижения производительности или сбоев в графике. Triton — языковой компилятор для создания сильно оптимизированных ядер CUDA. Помимо этого в PyTorch 2.3: ▫️Tensor Parallel API, который позволяет реализовать распределённые вычисления. API был специально адаптирован для обучения трансформеров с очень большим количеством параметров. ▫️Подкласс torch.sparse.SparseSemiStructuredTensor, который реализует полуструктурированную разреженность и позволяет добиться ускорения вычислений до 1.6 раза по сравнению с умножениями плотных (dense) матриц. 🔗 Прочесть о релизе подробнее можно здесь

ادامه مطلب ...

PyTorch 2.3 Release Blog

We are excited to announce the release of PyTorch® 2.3 (release note)! PyTorch 2.3 offers support for user-defined Triton kernels in torch.compile, allowing for users to migrate their own Triton kernels from eager without experiencing performance regressions or graph breaks. Tensor Parallelism improves the experience for training Large Language Models using native PyTorch functions, which has been validated on training runs for 100B parameter models. As well, semi-structured sparsity implements semi-structured sparsity as a Tensor subclass, with observed speedups of up to 1.6 over dense matrix multiplication.

1 672

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۴ اردیبهشت, ۱۸:۰۴

18.4k3.6k20.67%

کپی شد!

🥺 Итоги недели в мире ИИ и обзоры новых сервисов У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ. Ниже — небольшая выдержка из статьи, а целиком читайте здесь 👈 💬 Новости 🔘Искусственный интеллект успешно прошёл сложные экзамены и сравнился по с человеческим IQ во многих областях. Например, ИИ так же хорош, как человек в понимании, объяснении и обсуждение текста, изображений и видео. 🔘Microsoft выпустила новую модель VASA-1, которая генерирует потрясающе реалистичные видео на основе одного фото и одной аудиозаписи. 🔘Появился первый в мире конкурс красоты и успешности для ИИ-инфлюенсеров Мисс AI. 🛠 Инструменты 🔘Vidyard AI Avatars — генерирует видео с участием вашего ИИ-двойника. 🔘Flim — ИИ-поисковик для креативных людей. 🔘EasyFolders — сохраняет диалоги с ChatGPT и Claude в удобных древовидных папках. 📈 Исследования 🔘ИИ помог учёным определить области мозга, связанные с психозом. Анализ данных МРТ с помощью нового алгоритма машинного обучения выявил характерные «подписи» в мозге людей с расстройствами. ➡ Вы можете подписаться на email-рассылку здесь

ادامه مطلب ...

Гайд по соцсетям Proglib (2).mp4

1 520

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۴ اردیبهشت, ۰۹:۰۰

18.4k3.6k20.67%

کپی شد!

GitVerse – еще круче, быстрее и удобнее На онлайн-презентации «GitVerse: открой вселенную кода» СберТех представил новую функциональность платформы, которая поможет ускорить и упростить разработку. Рассказываем про новые фичи GitVerse: ✔️ CI/CD-инструменты Помогут автоматизировать сборку исходного кода и процессы поставки. А еще можно перенести свои проекты с Git-репозиториев в один клик. ✔️ Новые функции персонального AI-ассистента* GigaCode Теперь GigaCode умеет решать связанные с кодом задачи в окне чата прямо в среде разработки. А в репозитории в GitVerse можно получить объяснение, что делает конкретная часть кода, и советы по его улучшению. ✔️ Функциональность для организаций Отличная новость – разрабатывать на GitVerse теперь могут не только индивидуальные разработчики, но и малые и средние предприятия. Регистрируйтесь и воспользуйтесь новыми возможностями GitVerse! *AI, artificial intelligence — искусственный интеллект

ادامه مطلب ...

1 418

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۴ اردیبهشت, ۰۷:۱۴

18.4k3.6k20.67%

کپی شد!

🚀 Awesome Machine Learning — фреймворки и библиотеки для ML Этот репозиторий был вдохновлён другим — awesome-php. Включает в себя библиотеки, фреймворки и инструменты для машинного обучения на всех языках программирования: от С до Julia (Python, конечно, тоже есть). Вот темы, которые есть в списке, на примере Python: 🔸 Компьютерное зрение — SimpleCV — pytessarct 🔸 Обработка естественного языка — NLTK — Transformers 🔸 Анализ данных/визуализация — plotly — DataComPy 🔸 Код соревнований Kaggle 🔸 Обучение с подкреплением — DeepMind Lab — ViZDoom 🔗 Ссылка на репозиторий Awesome Machine Learning

ادامه مطلب ...

1 882

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۳ اردیبهشت, ۲۰:۰۱

18.4k3.6k20.67%

کپی شد!

🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом. Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций. Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах. 👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.

ادامه مطلب ...

1 890

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۳ اردیبهشت, ۱۸:۴۲

18.4k3.6k20.67%

کپی شد!

💬 А вы используете в свой работе Jupyter Notebook? ❤️ — использую постоянно 👍 — иногда использую 🤔 — нет #интерактив

1 763

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۳ اردیبهشت, ۱۱:۱۵

18.4k3.6k20.67%

کپی شد!

🛠️ NLP по-русски: подборка инструментов 🔹 Natasha Набор инструментов Natasha позволяет решать базовые NLP-задачи: токенизацию, сегментацию на предложения, морфологический и синтаксический анализ, лемматизацию, извлечение именованных сущностей. 🔹 DeepPavlov Это библиотека, созданная на базе PyTorch. Позволяет создавать чат-ботов и сложные диалоговые системы. Включает предобученные модели для русского языка. 🔹pymorphy2 Морфологический анализатор для русского и украинского языков. Может приводить слово к начальной форме и возвращать грамматическую информацию о нём. Также можно использовать форк pymorphy3, который сейчас развивается. 🔹SpaCy Библиотека для обработки естественного языка, поддерживающая 75+ языков, а также включающая предобученные векторы слов. NLP — Natural Language Processing, обработка естественного языка

ادامه مطلب ...

1 927

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۳ اردیبهشت, ۰۹:۱۰

18.4k3.6k20.67%

کپی شد!

✨ Визуализация эмбеддингов в браузере У TensorFlow есть онлайн-инструмент, который позволяет изучить пространство эмбеддингов (векторных представлений). Это не только залипательно, но и может быть полезно. Для пространств высокой размерности инструмент предварительно использует методы сокращения размерности (например, PCA). На странице доступны предобученные эмбеддинги — Word2Vec, Mnist (в виде картинок!) и Iris. Кроме того, есть возможность загрузить собственные. 🔗 Ссылка на инструмент TensorFlow

ادامه مطلب ...

Запись экрана 2024-04-23 в 10.54.31.mp4

1 837

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۳ اردیبهشت, ۰۶:۰۰

18.4k3.6k20.67%

کپی شد!

1 млн рублей за научную статью по AI/ML и возможность презентовать свои исследования на конференции AI Journey 2024 До 20 августа идет отбор статей для публикации в журнале «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics, которые выйдут в рамках ежегодной международной конференции по искусственному интеллекту AI Journey. Статья может быть оформлена на русском или английском языке, а также должна представлять только ранее не опубликованные сведения. Приз за лучшую статью — 1 млн рублей. Узнайте подробности и успейте подать заявку по ссылке.

ادامه مطلب ...

5 285

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۲ اردیبهشت, ۱۸:۱۲

18.4k3.6k20.67%

کپی شد!

📊🎲 Несколько полезных шпаргалок для дата-сайентистов Могут пригодиться при подготовке к собеседованию. 🔹Введение в теорию вероятностей 🔹Обзор способов визуализации данных 🔹Описательная статистика

1 888

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۲ اردیبهشت, ۱۵:۰۰

18.4k3.6k20.67%

کپی شد!

Meetup по Data Science от X5 Tech ⚡️25 апреля в 19:00 в пространстве Articon + онлайн трансляция Присоединяйтесь к следующему митапу по Data Science от X5 Tech! Обсудим последние достижения в области ML и подходы к решению неэффективных процессов. Вы узнаете о мониторинге языковых моделей, чат-ботах на основе искусственного интеллекта, методах улучшения RAG-систем и многом другом! ⏳ Таймлайн: 18:30-19:00 — Начало регистрации участников. Вкусняшки и живое общение. 19:00-21:30 — Выступления спикеров 21:30 — AFTER PARTY 😎 Спикеры — X5 Tech и Звук. Регистрация открыта __ Реклама. ООО "Корпоративный центр ИКС 5", ИНН: 7728632689, erid: LjN8Jt27S

ادامه مطلب ...

1 602

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۲ اردیبهشت, ۰۷:۰۴

18.4k3.6k20.67%

کپی شد!

1 234

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۱ اردیبهشت, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

🌐 Онлайн-обучение в ML: что это такое В традиционном подходе модель обучается, используя весь набор данных сразу. Этот процесс часто сопровождается большими вычислительными затратами и не учитывает изменения в данных, которые происходят в реальном времени. ❓Что делать? Можно обучать модель на одной точке входящих данных за раз. Например, вы храните на диске (или получаете в реальном времени из какого-то источника) обучающую выборку и не загружаете её в оперативную память. Тогда вы можете считывать объекты по одному и соответственно обновлять веса. После обработки всех объектов обучающей выборки значение функции потерь уменьшится (однако часто нужно несколько десятков проходов по выборке, чтобы оно уменьшилось достаточно). 🤔 Где можно применять: ▫️Анализ финансовых рынков; ▫️Системы мониторинга показателей здоровья; ▫️Обнаружение мошенничества. 🤖 Ограничения метода: ▫️Чувствительность к порядку поступающих данных; ▫️Меньший контроль за обучением; ▫️Проблемы с интерпретацией.

ادامه مطلب ...

1 769

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۱ اردیبهشت, ۱۵:۰۰

18.4k3.6k20.67%

کپی شد!

Систематизируете и углубите знания бэкенд-разработки на Python на курсе Яндекс Практикума за 6 месяцев. Преимущества курса: — актуальная программа, которая постоянно обновляется; — много практики, лайвкодинг и хакатон; — возможность совмещать с другой учёбой или работой; — наставники из Яндекса и не только; — помощь с трудоустройством. ◾️Погружайтесь в Python, нарабатывайте нужные навыки и осваивайте инструменты для работы. Начните курс бесплатно, а если понравится, платите как удобно: в рассрочку или целиком. → Начать бесплатно

ادامه مطلب ...

1 409

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۱ اردیبهشت, ۰۷:۰۳

18.4k3.6k20.67%

کپی شد!

✅Ответы на вопросы с собеседований А вот и ответы на три вопроса с собеседований, которые мы недавно вам задавали! 1️⃣ Как оценить статистическую значимость анализа? Для оценки статистической значимости нужно провести проверку гипотезы. Сначала определяют нулевую и альтернативную гипотезы. Затем рассчитывают p – вероятность получения наблюдаемых результатов, если нулевая гипотеза верна. Наконец, устанавливают уровень значимости alpha. Если p < alpha, нулевая гипотеза отвергается – иными словами, анализ является статистически значимым. 2️⃣ Приведите три примера распределений с длинным хвостом. Почему они важны в задачах классификации и регрессии? Три практических примера: степенной закон, закон Парето и продажи продуктов (например, продукты-бестселлеры против обычных). При решении задач классификации и регрессии важно не забывать о распределении с длинным хвостом, поскольку редко встречающиеся значения составляют существенную часть выборки. Это влияет на выбор метода обработки выбросов. Кроме того, некоторые методики машинного обучения предполагают, что данные распределены нормально. 3️⃣ Что такое центральная предельная теорема, и почему она важна? Центральная предельная теорема (ЦПТ) говорит о том, что сумма достаточно большого количества слабо зависимых случайных величин с примерно одинаковыми масштабами имеет распределение, близкое к нормальному. Центральная предельная теорема важна, поскольку она используется при проверке гипотез и расчете доверительных интервалов. 👉Хотите больше вопросов и ответы на них? Читайте нашу статью: 🎲 40 вопросов по статистике с собеседований на должность Data Scientist

ادامه مطلب ...

1 758

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۰ اردیبهشت, ۱۸:۲۶

18.4k3.6k20.67%

کپی شد!

🧠 Теоретические основы популярных алгоритмов машинного обучения и их реализация с нуля на Python Автор «Хабра» Егор Захаренко составил список собственных статей с описанием популярных алгоритмов классического машинного обучения. К каждой статье прилагается код на Python. Обучение с учителем 🔸 Линейная регрессия и её модификации 🔸 Логистическая и Softmax-регрессии 🔸 Линейный дискриминантный анализ (LDA) 🔸 Наивный байесовский классификатор 🔸 Метод опорных векторов (SVM) 🔸 Метод K-ближайших соседей (KNN) 🔸 Дерево решений (CART) 🔸 Бэггинг и случайный лес 🔸 Алгоритмы AdaBoost (SAMME & R2) 🔸 Градиентный бустинг и его модификации 🔸 Стекинг и блендинг Обучение без учителя 🔹 Метод главных компонент (PCA) 🔹 Популярные алгоритмы кластеризации 👉 Ноутбуки с алгоритмами можно скачать на Kaggle и GitHub.

ادامه مطلب ...

2 063

219

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۲۰ اردیبهشت, ۰۷:۰۳

18.4k3.6k20.67%

کپی شد!

⚡️Как войти в Data Science всего за год? Очень кратко пересказываем историю одного специалиста, который устроился в Data Science после работы в авиационной промышленности. В карточках — его путь и одна из рекомендаций, а в статье по ссылке — большая подборка полезных ресурсов! 👉Читать статью А чтобы следовать совету и окружить себя подходящим информационным фоном, изучайте другие классные статьи про Data Science: ⭐️Математические основы генеративных нейронных сетей: что нужно знать для их изучения ⭐️Что такое GPT: раскрываем тайны трансформеров ⭐️Как работают языковые модели (LLM): простое объяснение через аналогию с кулинарией

ادامه مطلب ...

1 611

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۹ فروردین, ۱۸:۰۴

18.4k3.6k20.67%

کپی شد!

⬆️ Дорожная карта дата-сайентиста 2024 Очередную Roadmap составил один из реддиторов. В ней он перечислил необходимые специалисту по ИИ библиотеки, фреймворки и платформы. Цветом автор разметил уровень навыков: 💚 — обязательные и относительно простые; 💛 — более сложные; ❤️ — самые сложные в освоении. 👇Мы приводим укороченную версию списка со ссылками на наши обучающие материалы👇 ▫️Python ▫️Pandas ▫️SQL ▫️Django ▫️Git ▫️Алгоритмы машинного обучения ▫️Kubernetes ▫️Большие языковые модели (LLM)

ادامه مطلب ...

2 119

116

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۹ فروردین, ۰۹:۰۴

18.4k3.6k20.67%

کپی شد!

👩‍💼Собеседование — самое важное событие для начинающего специалиста Для многих новичков сам факт приглашения на собеседование — уже большое событие. И, как нам кажется, половина успеха! Давайте проверим, насколько вы к нему готовы — мы выбрали три популярных вопроса, которые задают на собеседованиях будущим Data-специалистам; пишите свои ответы в комментариях! 1️⃣ Как оценить статистическую значимость анализа? 2️⃣ Приведите три примера распределений с длинным хвостом. Почему они важны в задачах классификации и регрессии? 3️⃣ Что такое центральная предельная теорема, и почему она важна? #собес_academy

ادامه مطلب ...

1 998

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۹ فروردین, ۰۷:۱۸

18.4k3.6k20.67%

کپی شد!

🦙 Вышла Llama 3 Это самая крупная открытая языковая модель от Meta*. Ключевые особенности: 🔘Доступна сейчас в двух версиях: предобученная модель с 8 млрд параметров и дообученная на инструкциях модель на 70 млрд. 🔘Должна хорошо справляться со сложными, многоступенчатыми задачами и генерацией кода. 🔘Размер контекстного окна составляет 8 тысяч токенов. 🔘По бенчмаркам превосходит другие открытые LLM. 🔘Дообучение Llama 3 после этапа предтренировки производилось на 10 миллионах примерах, вручную размеченных людьми. Известно также, что в процессе обучения находится модель с 400+ млрд параметров. 🔗 Репозиторий Llama 3 🔗 Страница моделей на Hugging Face *организация, деятельность которой запрещена на территории РФ

ادامه مطلب ...

2 190

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۸ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

На вход нейросети подаётся фотография размером 227×227×3. К ней применяется свёрточный слой с фильтром размером 11×11. Всего применяется 96 фильтров с шагом 4. Каким будет размер выходного изображения после этого слоя?

54x54x96

55×55×96

54x54

55×55

رأی دادن ناشناس

2 252

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۸ فروردین, ۱۶:۱۲

18.4k3.6k20.67%

کپی شد!

⚡️Data Fusion-2024 начала свою работу! Сегодня и завтра говорим о Data Science, искусственном интеллекте и машинном обучении. Участников конференции ждут: 🔹 Более 30 научных и бизнес-сессий и 150 спикеров: обсуждаем все от трендов ИИ до новостей сферы беспилотного транспорта. Трансляция самого интересного — здесь. 🔹 Доклад об опасностях развития ИИ и о том, как их избежать 🔹 Награждение победителей конкурса Data Fusion Contest, одного из самых сложных соревнований в сфере Data Science. Живем в эпоху больших данных 💚 Кстати, на скриншотах — наша метавселенная, где уже совсем скоро стартует одна из сессий конференции. Пока тестируем и используем метаверс внутри банка: например, проводим в ней встречи команд и создаем 3D-модели сложных технологических продуктов и сервисов.

ادامه مطلب ...

1 882

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۸ فروردین, ۱۱:۰۷

18.4k3.6k20.67%

کپی شد!

🤔 Оптимизация гиперпараметров за 5 секунд? Гиперпараметры — это характеристики модели, которые фиксируются ещё до начала обучения. Например, глубина решающего дерева и learning rate для градиентного спуска. Их подбор — очень важный этап обучения. Правильные значения гиперпараметров могут радикальным образом повлиять на производительность. На «Хабре» опубликовали обзор следующих основных методов оптимизации гиперпараметров: ▫️Grid Search ▫️Random Search ▫️Байесовская/вероятностная оптимизация ▫️TPE (Tree-structured Parzen Estimator). 🔗 Читать статью

ادامه مطلب ...

2 169

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۸ فروردین, ۰۹:۱۳

18.4k3.6k20.67%

کپی شد!

Данные сегодня ценнее золота. А умение извлекать из них пользу — навык, который уже сейчас нужен крупным работодателям. Приходите на день открытых дверей онлайн-бакалавриата «Аналитика и Data Science» от ТюмГУ и Нетологии, чтобы погрузиться в тему больших данных. Встреча пройдёт 20 апреля в 14:00 мск. Вы узнаете: - Кто работает с данными и чем именно занимаются эти специалисты. - Какие знания и навыки нужны, чтобы реализоваться в профессии. - Как устроено обучение в бакалавриате и что входит в программу. - Какие есть требования к поступлению. Погрузитесь в одну из самых востребованных и перспективных профессий. Регистрируйтесь, чтобы сделать первый шаг к карьере аналитика или Data Scientist. Записаться → https://netolo.gy/c4qO Реклама ООО “Нетология” LatgBqBwM

ادامه مطلب ...

~۲۰ اردیبهشت, ۱۰:۱۱

1 599

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۸ فروردین, ۰۷:۱۲

18.4k3.6k20.67%

کپی شد!

🔥 Вышла новая PyTorch-библиотека для файн-тюнинга LLM Библиотека называется torchtune. Она поддерживает весь воркфлоу, включая: 🔸 Загрузку и подготовку датасетов и чекпойнтов моделей; 🔸 Настройку процесса обучения с помощью разнообразных строительных блоков (как в torch); 🔸 Процесс логирования и метрики для отслеживания процесса обучения; 🔸 Квантизацию моделей после обучения; 🔸 Оценку моделей с помощью популярных бенчмарков; 🔸 Локальный запуск для тестирования. 🔗 Репозиторий torchtune 🔗 Туториалы по работе с библиотекой

ادامه مطلب ...

torchtune: Easily fine-tune LLMs using PyTorch

We’re pleased to announce the alpha release of torchtune, a PyTorch-native library for easily fine-tuning large language models.

2 187

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۷ فروردین, ۱۸:۰۴

18.4k3.6k20.67%

کپی شد!

🖥 Итоги недели в мире Python и обзоры новых инструментов У нас есть еженедельная рассылка о последних открытиях и тенденциях в мире Python. Мы опубликовали новый выпуск на 📰. Ниже — небольшая часть выпуска, а целиком читайте здесь 👈 💬 Как автоматически создавать субтитры В статье рассматривается простейший способ транскрипции видео и создания субтитров — с помощью Python, Whisper и FFmpeg. ▶️ Видеотуториалы 🔘Основные приёмы работы с SQLAlchemy SQLAlchemy — это библиотека, предназначенная для работы с реляционными базами данных. Умеет выполнять все запросы, доступные в SQL. 🔘Клон ChatGPT на Django Автор видео показывает, как сделать аналог знаменитого чат-бота с помощью Django, вебсокетов (Channels) и HTMX. 🛠 Инструменты 🔘Tkinter Designer — автоматически конвертирует дизайны Figma в код Tkinter GUI. 🔘drawpyo — библиотека для визуализации диаграмм, карт и схем Draw.io. 🔘Great Tables — создаёт привлекательные таблицы для визуализации данных из датафреймов Pandas и Polars. ➡ Вы можете подписаться на email-рассылку здесь

ادامه مطلب ...

1 555

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۷ فروردین, ۰۷:۱۳

18.4k3.6k20.67%

کپی شد!

🧡 Гайд для новичков по Google Colab 💛 Один из специалистов Google по машинному обучению выпустил получасовой ролик, который охватывает все необходимые новичку тонкости использования Colab-ноутбуков. 🔸04:05 Виды ячеек 🔸10:49 Вызов подсказок 🔸13:02 Отрисовка графиков 🔸13:43 Создание форм 🔸15:07 Установка пакетов 🔸17:30 Интеграция с Google Drive 🔸19:41 Магические команды 🔸22:19 Установка секретов 🔗 Ссылка на видео

2 237

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۶ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

💬 Начните писать в комментариях фразу «Искусственный интеллект скоро...», а подсказки при вводе пусть продолжат за вас. #интерактив

2 378

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۶ فروردین, ۱۱:۰۵

18.4k3.6k20.67%

کپی شد!

🤖💣 ИИ-ассистенты разработчика: скрытая угроза Внедрение ИИ в процессы разработки и отладки неизменно сопровождается изматывающими обсуждениями с участием юристов, комплаенс-менеджеров и специалистов по кибербезопасности. И это понятно — никому не хочется нести ответственность за риски, связанные с безопасностью данных, конфиденциальностью и соблюдением авторских прав. Однако самый важный вопрос — как использование ИИ повлияет на качество готового продукта — обычно остается без внимания. Именно эту проблему мы и обсудим. 🔗 Читать статью 🔗 Зеркало

ادامه مطلب ...

11 085

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۶ فروردین, ۰۷:۱۲

18.4k3.6k20.67%

کپی شد!

🔥🎥 Adobe анонсировала ИИ-редактор для Premiere Pro Компания показала на видео возможности модели Adobe Firefly. Скоро в Premiere Pro появится вкладка Generative, в которой будут следующие опции: 🔸Object Addition — позволяет выделить участок сцены и промптом указать, что именно там должно располагаться. Нужные объекты сгенерируются в нужном месте. 🔸Object Removal — объекты можно не только добавлять, но и убирать. Их выделение выглядит очень просто, и видимых следов от присутствия не остаётся. 🔸Generative Extend — позволяет расширить ваши футажи, чтобы добиться необходимой длительности ролика. Все фишки появятся в Premiere Pro «позже в этом году». Кроме того, программу можно будет интегрировать со сторонними видеомоделями (Pika, Runway и, может быть даже, Sora от OpenAI).

ادامه مطلب ...

Generative_AI_in_Premiere_Pro_powered_by_Adobe_Firefly_Adobe_V.mp4

2 330

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۵ فروردین, ۱۸:۰۷

18.4k3.6k20.67%

کپی شد!

👆Как обучаются большие языковые модели👆 #memes

N01IFr6xq90lU1FY.mp4

2 611

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۵ فروردین, ۰۹:۰۲

18.4k3.6k20.67%

کپی شد!

🧑‍💻 Анализ навыков data-специализаций в вакансиях HH.ru Один из пользователей «Хабра» проанализировал вакансии на HeadHunter по следующим трём специализациям: ▪️BI/Data аналитик; ▪️Data Science; ▪️Продуктовый аналитик. Автор также создал дашборд, где можно посмотреть требуемые навыки для каждой специализации, среднюю зарплату и количество вакансий по России. 🔗 Desktop-версия дашборда 🔗 Mobile-версия дашборда 👉 Здесь можно прочитать статью

2 365

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۵ فروردین, ۰۶:۰۳

18.4k3.6k20.67%

کپی شد!

🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта. В ней: ● Новости о прорывных исследованиях в области машинного обучения и нейросетей ● Материалы о применении ИИ в разных сферах ● Статьи об этических аспектах развития технологий ● Подборки лучших онлайн-курсов и лекций по машинному обучению ● Обзоры инструментов и библиотек для разработки нейронных сетей ● Ссылки на репозитории с открытым исходным кодом ИИ-проектов ● Фильмы, сериалы и книги 👉Подписаться👈

ادامه مطلب ...

2 167

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۴ فروردین, ۱۸:۰۲

18.4k3.6k20.67%

کپی شد!

Как выбрать количество скрытых слоёв и нейронов в нейросети? Не существует универсального решения этой проблемы. Выбор количества скрытых слоёв и нейронов часто зависит от практических наблюдений и экспериментов. Однако есть несколько общих принципов и эвристик, которые можно использовать. ▫️Количество скрытых слоёв может быть определено сложностью решаемой проблемы. Простые задачи можно решить с использованием всего одного скрытого слоя, тогда как более сложные задачи могут потребовать больше. Однако нужно помнить, что добавление дополнительных слоёв также увеличивает риск переобучения. Следует находить компромисс. ▫️Количество нейронов в скрытом слое может быть определено на основе количества входных признаков и желаемого уровня сложности модели. Некоторые специалисты советуют применять такие правила: — Число нейронов в скрытых слоях должно лежать в диапазоне от количества входных до количества выходных нейронов. — Можно сделать количество нейронов в скрытом слое кратным к размеру входного слоя. Например, в два раза больше или в два раза меньше. На практике бывает полезно начать с простой модели и постепенно увеличивать её сложность до достижения желаемой производительности. #вопросы_с_собеседований

ادامه مطلب ...

2 306

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۴ فروردین, ۰۷:۲۴

18.4k3.6k20.67%

کپی شد!

📊 Индуктивная статистика: доверительные интервалы, предельные ошибки, размер выборки и проверка гипотез На «Хабре» вышла хорошая статья, рассказывающая о: 🔘анализе выборок; 🔘влиянии параметров эксперимента и статистических критериев на результаты анализа; 🔘основных критериях; 🔘доверительных интервалах; 🔘статистических тестах. 🔗 Читать статью

2 303

124

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۳ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

1 745

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۳ فروردین, ۰۷:۱۱

18.4k3.6k20.67%

کپی شد!

🦾 Почти 1000 опенсорсных LLM-инструментов На этом сайте каждые 6 часов обновляется llama-police — список инструментов на основе больших языковых моделей (LLM) с открытым исходным кодом. В таблице перечислены репозитории таких проектов, их краткое описание, количество контрибьюторов, звёзд и т.д. 👉 Большинство из проектов также можно найти в cool-llm-repos на GitHub. 🔗 Ссылка на сайт

2 227

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۲ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

😍 Итоги недели в мире ИИ и обзоры новых сервисов У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ. Ниже — небольшая выдержка из статьи, а целиком читайте здесь 👈 💬 Новости 🔘С помощью браузера Opera теперь можно загружать и использовать локальные LLM. Поддерживается более 150 моделей. 🔘AI-компании уже соскрапили почти весь интернет и в ближайшее время начнут испытывать недостаток в данных. 🔘Stability AI представила новую версию модели Stable Audio 2.0 для генерации музыкальных треков длиной до 3 минут. 🛠 Инструменты 🔘Undermind — ИИ-поисковик, который ищет решения самых сложных проблем по огромной базе научных публикаций. 🔘IMG2HTML — конвертирует скриншоты в HTML-код. Может создать клон сайта по URL. 🔘CallTeacher — ИИ-преподаватель иностранных языков. 🔘Photoroom — мощный ИИ-редактор изображений. 📈 Исследования 🔘Какие модели лучше всего справляются с суммаризацией. Спойлер: не GPT-4. 🔘Придумана новая техника взлома LLM. Метод заключается в том, чтобы незаметно перенастроить модель на выполнение вредоносных запросов, на которые она обычно отказывается отвечать. ➡ Вы можете подписаться на email-рассылку здесь

ادامه مطلب ...

1 943

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۲ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

https://t.me/neuro_text/38

Библиотека нейротекста | ChatGPT, Gemini, Bing

😍 Итоги недели в мире ИИ и обзоры новых сервисов У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ. Ниже — небольшая выдержка из статьи, а целиком читайте здесь 👈 💬 Новости 🔘С помощью браузера Opera теперь можно загружать и использовать локальные LLM. Поддерживается более 150 моделей. 🔘AI-компании уже соскрапили почти весь интернет и в ближайшее время начнут испытывать недостаток в данных. 🔘Stability AI представила новую версию модели Stable Audio 2.0 для генерации музыкальных треков длиной до 3 минут. 🛠 Инструменты 🔘Undermind — ИИ-поисковик, который ищет решения самых сложных проблем по огромной базе научных публикаций. 🔘IMG2HTML — конвертирует скриншоты в HTML-код. Может создать клон сайта по URL. 🔘CallTeacher — ИИ-преподаватель иностранных языков. 🔘Photoroom — мощный ИИ-редактор изображений. 📈 Исследования 🔘Какие модели лучше всего справляются с суммаризацией. ⠌⣈⠆⠩⣐⠨⠰⢨ ⠪⠊ ⢘⠜⡄⠸⣀⠡ 🔘Придумана новая техника взлома LLM. Метод заключается в том, чтобы незаметно перенастроить модель на выполнение вредоносных запросов, на которые она обычно отказывается отвечать. ➡ Вы можете подписаться на email-рассылку здесь

~۱۲ فروردین, ۱۸:۰۳

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۲ فروردین, ۰۹:۰۶

18.4k3.6k20.67%

کپی شد!

👾 Замена смартфону с ИИ оказалась не рабочей Журналист The Verge протестировал носимое устройство Humane AI Pin, которое позиционируется как замена смартфону. Это коробочка без экрана, всё взаимодействие с которой идёт через голосовое управление. Она работает под управлением операционной системы CosmOS, которая снабжена ассистентом с искусственным интеллектом. 🤔 Журналист использовал Humane AI Pin какое-то время и пришёл к выводу, что у устройства есть множество технических проблем, и его функциональность ограничена. Так, Humane AI Pin работает медленно и часто не выполняет команды. Кроме того, устройство быстро перегревается, аккумулятор держит заряд мало времени, а проектор, предназначенный для отображения информации, имеет низкое качество. 🔗 Прочесть статью целиком

ادامه مطلب ...

2 121

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۲ فروردین, ۰۶:۰۳

18.4k3.6k20.67%

کپی شد!

Самые полезные каналы для программистов в одной подборке! Сохраняйте себе, чтобы не потерять 💾 🔥Для всех Библиотека программиста — новости, статьи, досуг, фундаментальные темы Книги для программистов IT-мемы Proglib Academy — тут мы рассказываем про обучение и курсы #️⃣C# Книги для шарпистов | C#, .NET, F# Библиотека шарписта — полезные статьи, новости и обучающие материалы по C# Библиотека задач по C# — код, квизы и тесты Библиотека собеса по C# — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Вакансии по C#, .NET, Unity Вакансии по PHP, Symfony, Laravel ☁️DevOps Библиотека devops’а — полезные статьи, новости и обучающие материалы по DevOps Вакансии по DevOps & SRE Библиотека задач по DevOps — код, квизы и тесты Библиотека собеса по DevOps — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования 🐘PHP Библиотека пхпшника — полезные статьи, новости и обучающие материалы по PHP Вакансии по PHP, Symfony, Laravel Библиотека PHP для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по PHP — код, квизы и тесты 🐍Python Библиотека питониста — полезные статьи, новости и обучающие материалы по Python Вакансии по питону, Django, Flask Библиотека Python для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по Python — код, квизы и тесты ☕Java Библиотека джависта — полезные статьи по Java, новости и обучающие материалы Библиотека Java для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по Java — код, квизы и тесты Вакансии для java-разработчиков 👾Data Science Книги для дата сайентистов | Data Science Библиотека Data Science — полезные статьи, новости и обучающие материалы по Data Science Библиотека Data Science для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по Data Science — код, квизы и тесты Вакансии по Data Science, анализу данных, аналитике, искусственному интеллекту 🦫Go Книги для Go разработчиков Библиотека Go разработчика — полезные статьи, новости и обучающие материалы по Go Библиотека Go для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по Go — код, квизы и тесты Вакансии по Go 🧠C++ Книги для C/C++ разработчиков Библиотека C/C++ разработчика — полезные статьи, новости и обучающие материалы по C++ Библиотека C++ для собеса — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования Библиотека задач по C++ — код, квизы и тесты Вакансии по C++ 💻Другие профильные каналы Библиотека фронтендера Библиотека мобильного разработчика Библиотека хакера Библиотека тестировщика 💼Каналы с вакансиями Вакансии по фронтенду, джаваскрипт, React, Angular, Vue Вакансии для мобильных разработчиков Вакансии по QA тестированию InfoSec Jobs — вакансии по информационной безопасности 📁Чтобы добавить папку с нашими каналами, нажмите 👉сюда👈 🤖Также у нас есть боты: Бот с IT-вакансиями Бот с мероприятиями в сфере IT Мы в других соцсетях: 🔸VK 🔸YouTube 🔸Дзен 🔸Facebook * 🔸Instagram * * Организация Meta запрещена на территории РФ

ادامه مطلب ...

1 826

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۱ فروردین, ۱۸:۰۰

18.4k3.6k20.67%

کپی شد!

Что нужно вставить на место пропуска, чтобы вывести число измерений массива arr?

size

len

shape

ndim

225

رأی دادن ناشناس

2 005

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۱ فروردین, ۱۸:۰۰

18.4k3.6k20.67%

کپی شد!

2 043

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۱ فروردین, ۱۱:۰۴

18.4k3.6k20.67%

کپی شد!

13 776

137

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۱ فروردین, ۰۷:۱۱

18.4k3.6k20.67%

کپی شد!

🔥 Практическое видео по работе с базовым набором DS-инструментов Автор YouTube-канала Onur Baltacı сделал 7.5-часовое видео с введением в основные библиотеки и инструменты для науки о данных и машинного обучения. Предназначено для начинающих. Таймкоды: 🔸 Программирование на Python 🔸 Анализ данных с Pandas 🔸 Анализ данных с NumPy 🔸 Визуализация данных с Matplotlib 🔸 Визуализация данных с Seaborn 🔸 Визуализация данных с Plotly 🔸 Проект по анализу данных 🔸 Машинное обучение со Scikit-learn 🔸 Проект по машинному обучению 🔗 Ссылка на ролик

ادامه مطلب ...

2 210

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۰ فروردین, ۱۸:۲۵

18.4k3.6k20.67%

کپی شد!

import numpy as np

class LinearRegression:
    def __init__(self, learning_rate=0.01, n_iters=1000):
        self.learning_rate = learning_rate
        self.n_iters = n_iters

    def fit(self, X, y):
        n_samples, n_features = X.shape
        self.weights = np.zeros(n_features)
        self.bias = 0

        for _ in range(self.n_iters):
            model_preds = self.predict(X)
            dw = (1 / n_samples) * np.dot(X.T, (model_preds - y))
            db = (1 / n_samples) * np.sum(model_preds - y)

            self.weights -= self.learning_rate * dw
            self.bias -= self.learning_rate * db

    def predict(self, X):
        return np.dot(X, self.weights) + self.bias

#машинное_обучение #программирование

ادامه مطلب ...

2 213

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۰ فروردین, ۱۸:۱۸

18.4k3.6k20.67%

کپی شد!

https://t.me/ds_interview_lib/273

Библиотека собеса по Data Science | вопросы с собеседований

Напишите линейную регрессию на Python с нуля Это один из самых простых алгоритмов. Он включает следующие шаги: 1️⃣ Инициализация параметров. 2️⃣ Вычисление предсказаний. 3️⃣ Вычисление функции потерь. 4️⃣ Обновление параметров с помощью градиентного спуска. 5️⃣ Повторение до сходимости. import numpy as np class LinearRegression: def __init__(self, learning_rate=0.01, n_iters=1000): self.learning_rate = learning_rate self.n_iters = n_iters def fit(self, X, y): n_samples, n_features = X.shape self.weights = np.zeros(n_features) self.bias = 0 for _ in range(self.n_iters): model_preds = self.predict(X) dw = (1 / n_samples) * np.dot(X.T, (model_preds - y)) db = (1 / n_samples) * np.sum(model_preds - y) self.weights -= self.learning_rate * dw self.bias -= self.learning_rate * db def predict(self, X): return np.dot(X, self.weights) + self.bias #машинное_обучение #программирование

~۱۰ فروردین, ۱۸:۲۹

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۰ فروردین, ۱۵:۰۰

18.4k3.6k20.67%

کپی شد!

Нейросеть для генерации изображений YandexART стала доступна для тестирования внешним компаниям! В режиме закрытого превью нейросеть уже попробовали несколько внешних компаний. Например, крупная e-com сеть тестирует YandexART для создания уникального дизайна подарочных карт. Клиенты сети смогут ввести текстовый запрос и самостоятельно выбрать собственное оформление для карты. Теперь на облачной платформе Yandex Cloud с помощью YandexART компании смогут создавать визуалы для рекламы и социальных сетей, дизайн-макеты, иллюстрации для диджитала и книг. Нейросеть можно встроить через API в различные сервисы и веб-приложения.

ادامه مطلب ...

2 177

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۰ فروردین, ۱۱:۳۴

18.4k3.6k20.67%

کپی شد!

Хардкорный курс по математике для тех, кто правда любит математику! Начать с вводных занятий можно здесь, ответив всего на 4 вопроса – https://proglib.io/w/584771bd Что вас ждет: – Вводный урок от CPO курса – Лекции с преподавателями ВМК МГУ по темам: теория множеств, непрерывность функции, основные формулы комбинаторики, матрицы и операции над ними, градиентный спуск – Практические задания для закрепления материала и ссылки на дополнительные материалы. ⚡️ Переходите и начинайте учиться уже сегодня – https://proglib.io/w/584771bd

ادامه مطلب ...

2 152

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۰ فروردین, ۱۱:۰۳

18.4k3.6k20.67%

کپی شد!

1 510

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۱۰ فروردین, ۰۷:۱۱

18.4k3.6k20.67%

کپی شد!

🧑‍💻 Обучение GPT-2 на языке C Андрей Карпаты в режиме детокса от соцсетей времени зря не терял — на днях он опубликовал реализацию языковой модели целиком на C. Хватило ему примерно тысячи строк. Хотели когда-нибудь обучить LLM на чистом C без 245MB PyTorch и 107MB cPython? Не хотели? Ну, вы всё равно можете! В общем, все желающие могут ознакомиться с кодом по этой ссылке 👈

2 133

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۹ فروردین, ۲۰:۰۱

18.4k3.6k20.67%

کپی شد!

ادامه مطلب ...

2 229

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۹ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

2 045

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۹ فروردین, ۱۱:۰۳

18.4k3.6k20.67%

کپی شد!

⚛️ Квантовое машинное обучение: курсы и материалы 🖥️ Открытый курс квантового машинного обучения Курс от сообщества ODS. Содержит лекции разных уровней сложности и глубины. Все объяснения подкрепляются кодом. 🖥️ Забавный комикс о смысле квантовых вычислений Развенчивает популярные представления о том, что такое квантовый компьютер. 🖥️ Руководство по квантовому машинному обучению для начинающих Объясняет основные понятия из этой сферы. Автор постепенно добавляет в руководство больше контента. 🖥️ Курс CERN по квантовым вычислениям по-русски Нужно зарегистрироваться, чтобы получить доступ ко всем видео-лекциям и конспектам. 🖥️ CERN Introductory Course Англоязычная версия вводного курса по квантовым вычислениям. 🖥️ QuantumAlgorithms.org Здесь лежат конспекты лекций о квантовых алгоритмах и квантовому машинному обучению.

ادامه مطلب ...

2 357

111

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۹ فروردین, ۰۷:۱۱

18.4k3.6k20.67%

کپی شد!

🤖 Матричные вычисления, лежащие в основе Transformers Автор YouTube-канала StatQuest with Josh Starmer Джош Стармер опубликовал новое отличное видео, объясняющее матричные вычисления, на базе которых строится одна из самых известных архитектур нейросетей. Джош пошагово, подробно и на примерах рассказывает про эмбеддинги слов (их векторные представления), позиционное кодирование, матрицы Q, K и V. 🔗 Смотреть видео

The matrix math behind transformer neural networks, one step at a time!!!

Transformers, the neural network architecture behind ChatGPT, do a lot of math. However, this math can be done quickly using matrix math because GPUs are optimized for it. Matrix math is also used when we code neural networks, so learning how ChatGPT does it will help you code your own. Thus, in this video, we go through the math one step at a time and explain what each step does so that you can use it on your own with confidence. NOTE: This StatQuest assumes that you are already familiar with: Transformers: https://youtu.be/zxQyTK8quyY The essential matrix algebra for neural networks: https://youtu.be/bQ5BoolX9Ag If you'd like to support StatQuest, please consider... Patreon: https://www.patreon.com/statquest ...or... YouTube Membership: https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw/join ...buying my book, a study guide, a t-shirt or hoodie, or a song from the StatQuest store... https://statquest.org/statquest-store/ ...or just donating to StatQuest! paypal: https://www.paypal.me/statquest venmo: @JoshStarmer Lastly, if you want to keep up with me as I research and create new StatQuests, follow me on twitter: https://twitter.com/joshuastarmer 0:00 Awesome song and introduction 1:43 Word Embedding 3:37 Position Encoding 4:28 Self Attention 12:09 Residual Connections 13:08 Decoder Word Embedding and Position Encoding 15:33 Masked Self Attention 20:18 Encoder-Decoder Attention 21:31 Fully Connected Layer 22:16 SoftMax #StatQuest #Transformer #ChatGPT

2 363

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۸ فروردین, ۱۸:۰۵

18.4k3.6k20.67%

کپی شد!

😿 Том был первым, кто потерял работу из-за ИИ

ssstwitter.com_1712379530790.mp4

2 661

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۸ فروردین, ۰۷:۰۸

18.4k3.6k20.67%

کپی شد!

🐼 Pandas: от хаоса к красоте кода Работа с pandas.DataFrame может превратиться в неловкую кучу старого (не очень) доброго спагетти-кода. Автор делится своим опытом и рассказывает, какие практики старается соблюдать. ❌ Этого не стоит делать: ▫️не изменяйте DataFrame слишком сильно внутри функций; ◽не пишите методы, которые изменяют DataFrame и не возвращают его. ✅ Этого стоит придерживаться: ◽создавайте новые объекты вместо того, чтобы изменять исходный DataFrame, и не забывайте делать глубокую копию, когда это необходимо; ◽выполняйте только операции аналогичного уровня внутри одной функции; ◽разрабатывайте функции с учётом возможности переиспользования; ◽тестируйте свои функции. 🔗 Ссылка на статью

ادامه مطلب ...

2 465

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۷ فروردین, ۱۸:۰۵

18.4k3.6k20.67%

کپی شد!

🧠 Сколько времени нужно, чтобы «успокоить» ум? Своими наблюдениями делится один из самых известных специалистов по искусственному интеллекту, сооснователь OpenAI Андрей Карпаты. Возвращаюсь после экспериментального двухнедельного детокса от интернета. Основной вывод заключается в том, что я не осознавал, насколько неспокойным может стать ум при перенасыщении проблемами/информацией (как взболтанная жидкость), и примерно двух недель достаточно, чтобы перейти в гораздо более спокойное состояние. Меня поразило, как перенасыщенный мозг автоматически выталкивает на поверхность сознания проблемы, создавая состояние постоянной тревоги и нервозности. После некоторого времени в устоявшемся состоянии эта активность просто... прекращается. Вы можете сидеть, и ваш мозг не переходит сразу в режим решения проблем, он просто остаётся в тишине. Ничего не происходит. Я уверен, это может показаться многим странным, но я думаю, что очень давно не был в таком подмножестве пространства состояний «динамики мозга», и приятно знать, что 1) это состояние существует, и 2) его можно посетить, если хочешь, но путь туда занимает несколько недель.

ادامه مطلب ...

2 454

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۷ فروردین, ۰۷:۱۴

18.4k3.6k20.67%

کپی شد!

⛏️ Экспериментируйте с нейросетью прямо в браузере У TensorFlow есть песочница, в которой можно настраивать нейронную сеть и сразу смотреть на результат своих изменений. Можно выбрать количество слоёв, размер батча, уровень шума в данных, преобразования входных данных, даже вручную прописать веса — и увидеть, что меняется. Полезно для понимания того, как это всё устроено. 🔗 Ссылка на песочницу

2 996

107

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۶ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

👾 LLM сразились между собой в турнире по Street Fighter III Разработчики придумали бенчмарк LLM Colosseum, который предлагает совершенно новый способ оценки больших языковых моделей (LLM). Воспользоваться им может каждый желающий — исходный код открыт. 😎 На прикреплённом к посту видео сражаются модели OpenAI и Mistral. В это битве победителем вышла Mistral. Но как это работает? Все действия персонажей определяются решениями LLM в режиме реального времени. Моделям отправляют текстовое описание происходящего на экране и спрашивают, каким должен быть следующий шаг. При этом, как показала практика, чтобы победить в Street Fighter III, для LLM важна скорость. Поэтому более маленькие модели выигрывают чаще, чем более крупные. На данный момент первое место в рейтинге занимает gpt-3.5-turbo-0125. За ней следуют mistral-small-latest и gpt-4-1106-preview.

ادامه مطلب ...

ssstwitter.com_1712395202997.mp4

2 443

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۶ فروردین, ۰۷:۰۹

18.4k3.6k20.67%

کپی شد!

🤖👾 Как злоумышленники взламывают LLM: 7 ключевых стратегий Чат-боты на основе ИИ все чаще становятся мишенью для хакеров. Какие уязвимости позволяют злоумышленникам взламывать ИИ-системы и как защитить свои приложения от атак? Рассказываем о 7 ключевых стратегиях. 👉 Читать статью 👉 Зеркало

1 860

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۵ فروردین, ۱۸:۰۵

18.4k3.6k20.67%

کپی شد!

Свежий #дайджест материалов по ИИ, Data Science и машинному обучению ▪️Синтетическое генерирование данных (SMOTE) SMOTE используется для решения проблемы несбалансированности классов в обучающих данных. ▪️Propensity score matching: как оценивать маркетинговые кампании, если невозможно провести A/B тесты Propensity Score Matching (PSM) — это статистический метод, позволяющий оценить эффект вмешательства, сравнивая группы с похожим распределением ключевых характеристик, за исключением самого вмешательства. ▪️Логистическая и Softmax-регрессии. Основная идея и реализация с нуля на Python Очень подробная статья с формулами и кодом. ▪️Ускорение инференса LLM ML-разработчик из команды YandexGPT разобрал задачу ускорения инференса больших языковых моделей. ▪️What's next for AI agentic workflows ft. Andrew Ng of AI Fund Эндрю Ын рассказывает о том, что будет дальше с ИИ-агентами.

ادامه مطلب ...

2 292

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۵ فروردین, ۰۷:۱۱

18.4k3.6k20.67%

کپی شد!

🐍 Хэш-карты: незаменимый инструмент для Python-разработчика Хэш-карты представляют собой одну из наиболее распространенных реализаций хэширования. Они хранят пары ключ-значение в списке, доступ к которому осуществляется через его индекс. О том, как работать с хэш-картами в Python, читайте в нашей новой статье. 🔗 Ссылка 🔗 Зеркало

1 949

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۴ فروردین, ۱۸:۰۱

18.4k3.6k20.67%

کپی شد!

💬 У нас есть вопрос Расскажите, пожалуйста, на какие статьи вы переходили или какие последние ссылки открывали из Telegram? Речь идёт не только о наших статьях и ссылках, а о любых. 👇 Пишите ответы в комментариях в стиле «был пост со статьёй такой-то, я её открыл и почитал». Будем благодарны обратной связи!

2 251

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۴ فروردین, ۱۵:۰۱

18.4k3.6k20.67%

کپی شد!

erid: LjN8KCB72 Х5 Tech Talk: Наводим порядок в данных X5 Tech совместно с сообществом dbt & modern data stack проводят встречу, на которой эксперты по работе с данными обсудят успешный опыт внедрения открытых каталогов данных на базе OpenMetadata и DataHub. ➡️ Для слушателей выступят: Анатолий Шулика, руководитель продукта "Портал по работе с данными", X5 Tech Ринат Абдурахманов, руководитель департамента data governance, Beeline Григорий Ильяшенко, Tele2 Появление каталога данных в компании и развитие востребованного сервиса, а также путь от таблиц до моделей машинного обучения моделей - все это обсудят в режиме онлайн. 11 апреля, 19:00 🌐 Подробности и регистрация – по ссылке __ Реклама. ООО "Корпоративный центр ИКС 5", ИНН: 7728632689

ادامه مطلب ...

2 727

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۴ فروردین, ۱۱:۰۶

18.4k3.6k20.67%

کپی شد!

📊 Периодическая таблица методов визуализации Забавная версия таблицы Менделеева, в которой собраны разные методы визуализации данных и концептов. Помогает освежить всё в памяти. 🔗 Ссылка на таблицу

2 457

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۴ فروردین, ۰۷:۱۰

18.4k3.6k20.67%

کپی شد!

👀 Amazon провалила ИИ-проект с автоматизированными магазинами Компания отказалась от Just Walk Out в своих магазинах Amazon Go. Предполагалось, что технология будет автоматизировать работу касс с помощью компьютерного зрения. Однако, как оказалось, работает она плохо. 👉 По задумке, Just Walk Out должна была позволять покупателю взять любые товары и уйти из магазина, не проведя их через кассу. Amazon хотела, чтобы ИИ-система через камеры отслеживала, что забрали клиенты, и списывала деньги с них позже. Журналисты выяснили, что на проект Amazon работали более 1000 человек из Индии, которые вручную размечали видео для обучения моделей, а также перепроверяли их результаты. И если ручная разметка — это нормальное явление, то постоянная перепроверка оказалась слишком накладной и свела преимущества технологии на нет. 🤔 Теперь Amazon перейдёт на более разумный формат работы: в магазинах будут использоваться тележки со встроенными экранами и сканерами для оплаты.

ادامه مطلب ...

2 868

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۳ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

👾 Карточки по мотивам наших вопросов с собеседований DS Наш подписчик сделал колоду карточек ANKI из пар вопрос-ответ, опубликованных в канале Библиотека собеса по Data Science. Всего в наборе 203 карточки. Чтобы смотреть их в удобной форме, нужно: ▪️Завести аккаунт на AnkiWeb; ▪️Скачать десктопное приложение ANKI; ▪️Скачать карточки; ▪️Открыть их в приложении. ❤️ Если вы тоже делали карточки, шпаргалки или инструкции по нашим материалам, то обязательно присылайте нашему боту

3 367

105

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۳ فروردین, ۱۵:۰۰

18.4k3.6k20.67%

کپی شد!

У Яндекс Практикума есть бесплатный курс по основам анализа данных. В нём забавный интерактивный сюжет и много практики: четыре реальных кейса из разных областей. Вам предстоит: — выяснить причину массовой поломки гаджетов, — проверить окупаемость рекламы мобильного приложения, — выбрать стратегию развития ИИ-стартапа, — оценить эффективность роботов в службе поддержки. На курсе вы напишете первый код на Python и поймёте, чем занимаются специалисты в сфере. → Приходите учиться бесплатно.

~۰۵ فروردین, ۱۵:۲۳

1 679

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۳ فروردین, ۰۷:۱۴

18.4k3.6k20.67%

کپی شد!

🔥 Язык для машинного обучения Mojo стал открытым Создатели Mojo объявили, что теперь проект опенсорсный, и каждый может внести свой вклад в разработку. 👀 Помимо предоставления исходного кода, команда также открыла историю изменений стандартной библиотеки, выпустила ночные сборки компилятора Mojo, предоставила публичную систему непрерывной интеграции и разрешила пулл-реквесты на GitHub. 🔗 Ссылка на репозиторий Mojo

Modular: The Next Big Step in Mojo🔥 Open Source

We are building a next-generation AI developer platform for the world. Check out our latest post: The Next Big Step in Mojo🔥 Open Source

2 685

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۲ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

💬 Как изменился ваш информационный пузырь за год? Помните свои информационные предпочтения год назад? Многое изменилось! Социальные сети, мессенджеры, YouTube, подкасты — все эти каналы ежедневно борются за наше внимание. У каждого из нас за год сформировался свой уникальный информационный рацион. Пройдите наш опрос и расскажите, как изменились ваши вкусы в медиапотреблении. 👉 Пройти опрос Опрос займёт у вас примерно 4 минуты.

2 621

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۲ فروردین, ۱۴:۰۱

18.4k3.6k20.67%

کپی شد!

Оффер в компанию будущего можно получить за день. Попробуй свои силы на OneDayOffer от SberAutoTech 20 апреля! Мы ищем системных аналитиков и разработчиков C++, которые не боятся сложных задач. Оставь заявку, выполни тестовое задание и получи приглашение на мероприятие. За один день ты успеешь познакомиться с командами разработки, пройти собеседования и получить фидбек. Если всё сложится, уже вечером мы предложим тебе место в команде. Работать в SberAutoTech — значит создавать новое. Мы развиваем технологию автономного вождения, совместимую с разными транспортными средствами. Тебя ждут интересные и необычные проекты, возможности для профессионального развития, и, участия в конференциях. Узнай больше по ссылке.

ادامه مطلب ...

~۰۴ فروردین, ۱۴:۰۶

1 619

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۲ فروردین, ۱۱:۰۳

18.4k3.6k20.67%

کپی شد!

💩 Подборка полезных команд для работы в Jupyter-ноутбуках 💩ИИ-помощник в ноутбук — Jupyter AI Точно работает в JupyterLab. Сначала нужно установить расширение:

pip install 'jupyter-ai>=1.0,<2.0' # если вы используете JupyterLab 3
pip install jupyter-ai             # если вы используете JupyterLab 4

Затем следует установить переменную окружения с API-ключом OpenAI:

%env OPENAI_API_KEY=ваш_ключ

В конце концов можно вставить следующий код:

%reload_ext jupyter_ai
%%ai chatgpt
generate a function for sum of two numbers

💩Красивый вывод LaTeX формул

%%latex
$$c = \sqrt{a^2 + b^2}$$

💩Выполнение SQL-запросов Эта магическая команда становится доступной после установки и настройки расширения ipython-sql. Вот последовательность команд:

pip install ipython-sql
%load_ext sql
%sql postgresql://username:password@hostname:port/database_name
%sql SELECT * FROM my_table LIMIT 5;

💩Запуск Python-файлов прямо в ноутбуке

%run hello.py

💩Запись содержимого ячейки в Python-файл

%%writefile app.py

def sum_of_numbers(a, b):
    return a + b

c = sum_of_numbers(3, 2)
print(c)

ادامه مطلب ...

2 550

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۲ فروردین, ۰۷:۱۵

18.4k3.6k20.67%

کپی شد!

🔥 Вышел, вероятно, один из лучших роликов с объяснением Transformers На отличном канале 3Blue1Brown опубликовали очередное видео из серии про глубокое обучение. На этот раз авторы отвечают на вопрос «Что такое GPT» и дают визуальное введение в Transformers. 👍 Рекомендуем к просмотру. Канал 3Blue1Brown ещё ни разу не подводил. 🔗 Ссылка на ролик

But what is a GPT? Visual intro to Transformers | Deep learning, chapter 5

An introduction to transformers and their prerequisites Early view of the next chapter for patrons: https://3b1b.co/early-attention Other recommended resources on the topic. Richard Turner's introduction is one of the best starting places: https://arxiv.org/pdf/2304.10557.pdf Coding a GPT with Andrej Karpathy https://youtu.be/kCc8FmEb1nY Introduction to self-attention by John Hewitt https://web.stanford.edu/class/cs224n/readings/cs224n-self-attention-transformers-2023_draft.pdf History of language models by Brit Cruise: https://youtu.be/OFS90-FX6pg ------------------ Timestamps 0:00 - Predict, sample, repeat 3:03 - Inside a transformer 6:36 - Chapter layout 7:20 - The premise of Deep Learning 12:27 - Word embeddings 18:25 - Embeddings beyond words 20:22 - Unembedding 22:22 - Softmax with temperature 26:03 - Up next ------------------ These animations are largely made using a custom Python library, manim. See the FAQ comments here: https://3b1b.co/faq#manim https://github.com/3b1b/manim https://github.com/ManimCommunity/manim/ All code for specific videos is visible here: https://github.com/3b1b/videos/ The music is by Vincent Rubinetti. https://www.vincentrubinetti.com https://vincerubinetti.bandcamp.com/album/the-music-of-3blue1brown https://open.spotify.com/album/1dVyjwS8FBqXhRunaG5W5u ------------------ 3blue1brown is a channel about animating math, in all senses of the word animate. If you're reading the bottom of a video description, I'm guessing you're more interested than the average viewer in lessons here. It would mean a lot to me if you chose to stay up to date on new ones, either by subscribing here on YouTube or otherwise following on whichever platform below you check most regularly. Mailing list: https://3blue1brown.substack.com Twitter: https://twitter.com/3blue1brown Instagram: https://www.instagram.com/3blue1brown Reddit: https://www.reddit.com/r/3blue1brown Facebook: https://www.facebook.com/3blue1brown Patreon: https://patreon.com/3blue1brown Website: https://www.3blue1brown.com

2 785

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение ۰۱ فروردین, ۱۸:۰۳

18.4k3.6k20.67%

کپی شد!

😪 Это должно было быть первоапрельской шуткой...

2 098

بیشتر...

Last updated: ۱۱.۰۷.۲۳

2024 Telemetr.io همه حق محفوظ است

Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение

Add your telegram channel for

all posts Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение

PySpark_SQL_Cheat_Sheet.pdf

file

Гайд по соцсетям Proglib (2).mp4

Запись экрана 2024-04-23 в 10.54.31.mp4

Generative_AI_in_Premiere_Pro_powered_by_Adobe_Firefly_Adobe_V.mp4

N01IFr6xq90lU1FY.mp4

Что нужно вставить на место пропуска, чтобы вывести число измерений массива arr?

ssstwitter.com_1712379530790.mp4

ssstwitter.com_1712395202997.mp4

امتیاز

Collections of Telegram channels

ابزارها

Resources

Our bots