Best analytics service

Add your telegram channel for

  • get advanced analytics
  • get more advertisers
  • find out the gender of subscriber
Channel location and language

audience statistics Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение

Все самое полезное для дата сайентиста в одном канале. Список наших каналов:  https://t.me/proglibrary/8353  Учиться у нас:  https://proglib.io/w/907158ab  Обратная связь:  @proglibrary_feedback_bot  По рекламе:  @proglib_adv  Прайс:  @proglib_adv ertising 
Show more
18 363+9
~3 579
~4
20.67%
Telegram general rating
Globally
42 302place
of 78 777
5 597place
of 8 625
In category
884place
of 1 396

Subscribers gender

Find out how many male and female subscibers you have on the channel.
?%
?%

Audience language

Find out the distribution of channel subscribers by language
Russian?%English?%Arabic?%
Subscribers count
ChartTable
D
W
M
Y
help

Data loading is in progress

User lifetime on the channel

Find out how long subscribers stay on the channel.
Up to a week?%Old Timers?%Up to a month?%
Subscribers gain
ChartTable
D
W
M
Y
help

Data loading is in progress

Hourly Audience Growth

    Data loading is in progress

    Time
    Growth
    Total
    Events
    Reposts
    Mentions
    Posts
    Since the beginning of the war, more than 2000 civilians have been killed by Russian missiles, according to official data. Help us protect Ukrainians from missiles - provide max military assisstance to Ukraine #Ukraine. #StandWithUkraine
    ✍️ Правила внедрения машинного обучения от Google У Google есть целый , в котором перечислены лучшие практики для специалистов по машинному обучению. Мы приведём избранные правила. ✅ Не бойтесь запускать продукт без машинного обучения Для машинного обучения всегда нужны данные. Если с этим есть проблема, то стоит попробовать использовать для своего продукта нечто другое, какую-нибудь простую эвристику. Иными словами, если ML не является абсолютно необходимым для вашего продукта, не применяйте его, пока у вас не будет достаточно данных. ✅ Сначала придумайте метрики Прежде чем определиться, что будет делать ваша система машинного обучения, попробуйте отследить как можно больше показателей в вашей текущей системе. ✅ Между сложной эвристикой и машинным обучением выбирайте второе Простая эвристика может помочь быстро запустить продукт. Сложную эвристику трудно поддерживать. Как только у вас появятся данные и базовое представление о том, чего вы пытаетесь достичь, переходите к машинному обучению. ✅ Сделайте первую модель простой и правильно настройте инфраструктуру Прежде чем кто-либо сможет использовать вашу новую продвинутую систему машинного обучения, вам необходимо будет определить: - Как давать примеры на вход алгоритму. - Что такое «хорошо» и «плохо» для вашей системы. - Как интегрировать модель в ваше приложение. Специалисты Google также советуют выбирать простые признаки для модели. ✅ Постарайтесь обнаружить проблемы перед экспортом моделей В частности, убедитесь, что производительность модели на отложенных данных находится на разумном уровне. Если у вас остаются опасения по поводу данных, не экспортируйте модель. ✅ Не зацикливайтесь на выборе оптимизируемой цели На ранних этапах процесса машинного обучения можно заметить, что улучшаются все показатели, даже те, которые вы не оптимизируете напрямую. Например, вам важно количество кликов и время, проведённое на сайте. Если вы оптимизируете количество кликов, скорее всего, вы увидите и увеличение времени на сайте. Старайтесь сохранять процесс простым и не перегружайте себя размышлениями о балансе различных метрик. ✅ Выберите простую метрику для вашей первой цели Проще всего моделировать поведение пользователя, которое можно наблюдать непосредственно. Например, факт клика по ссылке, оценки чего-либо и т.д. Избегайте моделирования косвенных эффектов вначале: не стоит пытаться отследить посетил ли пользователь сайт на следующий день и как долго он находился на сайте. Наконец, не нужно пытаться заставить машинное обучение выяснить, счастлив ли пользователь. ✅ Логируйте Стоит сохранять набор признаков, используемых во время применения модели, а затем использовать их во время обучения. Даже если вы не можете сделать это для каждого примера, сделайте хотя бы для небольшой части. ✅ Не тратьте время на новые признаки, если проблемой стали несогласованные цели Если цели, поставленные перед алгоритмом или системой машинного обучения, не соответствуют общим целям продукта или бизнеса, то не стоит пытаться решить их примитивным добавлением новых признаков.
    Show more ...
    621
    28
    🤖 Машинное обучение для людей: Разбираемся простыми словами Этот блогпост представляет собой большое введение для тех, кто хочет разобраться в машинном обучении без формул и теорем. Автор даёт много примеров реальных задач и их решений, а также старается писать об этом простым языком. Вот темы, которые охватывает блогпост: 🔹составляющие машинного обучения; 🔹алгоритмы обучения с учителем; 🔹алгоритмы обучения без учителя; 🔹уменьшение размерности; 🔹обучение с подкреплением; 🔹ансамбли; 🔹глубокое обучение и нейросети. 🔗
    Show more ...
    Машинное обучение для людей
    None
    1 113
    61
    🤖🖼️ Как работают визуальные трансформеры: магия превращения пикселей в знания Визуальные трансформеры (Vision Transformers, ViTs) — класс моделей глубокого обучения, которые достигли выдающихся результатов в задачах классификации изображений. В основе ViTs лежит архитектура трансформеров, изначально разработанная для обработки естественного языка. В новой статье подробно рассказываем (с картинками), как работают такие модели компьютерного зрения. 🔗 🔗
    3 739
    60
    💵Моделирование курса валют методом Монте-Карло Метод Монте-Карло позволяет исследовать какой-либо случайный процесс, многократно имитируя его. Новая статья на «Хабре» посвящена анализу и прогнозированию валютных курсов с помощью такого подхода. Автор привёл примеры кода на Python и объяснил каждую используемую функцию. 🔗
    1 574
    75
    🎓 Небольшая подборка бесплатных курсов по классическому машинному обучению ▫️ Культовый курс по основам машинного обучения с Эндрю Ыном, американским учёным-информатиком. Представляет собой набор видеолекций. ▫️ Курс на Stepik, на котором подробно разбираются основные алгоритмы классического ML: линейная и логистическая регрессии, метод k-ближайших соседей, случайный лес, метод главных компонент и др. ▫️ Курс, рассказывающий о концептах и алгоритмах, лежащих в основе современного ML. Также в программе есть теория вероятностей, нейросети, NLP и др. ▫️ В курсе делается упор на глубокое понимание математических основ. Автор — зав. лаб. «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ.
    Show more ...
    1 641
    114
    ААА! Авторы Академии Аналитиков Авито выпустили бесплатный курс по прикладной статистике. В нём две части — первая по базе, которую важно знать для работы с данными, вторая по более сложным критериям. Пройти можно здесь. Курс научит собирать и валидировать кастомные критерии на реальных данных, а ещё решать задачи бизнеса с применением прикладной статистики.
    1 578
    60
    PySpark: небольшой гайд по библиотеке PySpark — это Python API для Apache Spark. А Apache Spark, в свою очередь, представляет собой движок для распределённой обработки задач, связанных с большими данными. Так, PySpark позволяет работать с данными любого размера. Библиотека поддерживает все функции Spark, включая Spark SQL и DataFrames. 🔸Spark SQL предназначен для работы со структурированными данными и позволяет сочетать SQL-запросы с программами Spark. 🔸PySpark DataFrames позволяет читать, записывать, трансформировать и анализировать данные. 👆К посту мы прикрепили небольшую шпаргалку по этим двум основным инструментам PySpark
    Show more ...

    PySpark_SQL_Cheat_Sheet.pdf

    1 663
    50
    Телеграм-канал для ML-специалистов от Яндекса Yandex for ML — канал для ML-инженеров от Яндекса. Рассказываем, как мы обучаем наши модели и интегрируем их в продукты, как делаем сервисы с архитектурой сразу из нескольких нейросетей, как обучаем модели для специфичных задач и многое другое. Подписывайтесь 👉
    1 527
    3
    💬 Итак, настало время расшифровать аббревиатуры. На выбор: 🔹AI/ИИ 🔹ML 🔹DL 🔹GPT 🔹DS 👇Только неправильные ответы👇
    1 636
    5
    Хотите учиться у экспертов в области IT? Школа анализа данных Яндекса принимает заявки до 12 мая, успейте . ШАД для вас, если вы: · интересуетесь Machine Learning · имеете хорошую математическую подготовку · уверенно владеете каким-либо языком программирования Программа длится два года, обучение бесплатное. Можно выбрать одно из направлений: Data Science, инфраструктура больших данных, разработка машинного обучения или анализ данных и ИИ в прикладных науках. Больше об учёбе в ШАД и возможностях для выпускников расскажем на днях открытых дверей. Узнать даты и зарегистрироваться можно .
    Show more ...

    file

    1 668
    9
    🐍🤔 «Задумчивый» код: временная сложность операций со структурами данных в Python Вы когда-нибудь задумывались, почему некоторые операции в Python выполняются мгновенно, а другие заставляют ваш код «задумчиво» работать? В новой статье разбираемся во временной сложности и узнаём, как писать быстрый и эффективный код. 🔗 🔗
    1 360
    20
    🦾🧠🏋Качаем мозги к лету! Хотите начать работать с большими данными, применять методы машинного обучения, статистический анализ, а также разрабатывать алгоритмы для извлечения информации? Тогда наш полугодовой курс от преподавателей МГУ, подходит для этого. И мы можете попасть на него со скидкой 40% ➡️ 29 990 ₽ 17 994 ₽ Вас ждет развернутая обратная связь по всем домашним заданиям, а также ссылки на полезные дополнительные материалы. У вас не будет шансов не усвоить какие-то темы курса👌 ⭐️ Переходите и активируйте бесплатные вводные занятия курса
    Show more ...
    1 578
    2
    Вышел PyTorch 2.3 Основное нововведение — . Их можно переносить без снижения производительности или сбоев в графике. Triton — языковой компилятор для создания сильно оптимизированных ядер CUDA. Помимо этого в PyTorch 2.3: ▫️Tensor Parallel API, который позволяет реализовать распределённые вычисления. API был специально адаптирован для обучения трансформеров с очень большим количеством параметров. ▫️Подкласс torch.sparse.SparseSemiStructuredTensor, который реализует полуструктурированную разреженность и позволяет добиться ускорения вычислений до 1.6 раза по сравнению с умножениями плотных (dense) матриц. 🔗
    Show more ...
    PyTorch 2.3 Release Blog
    We are excited to announce the release of PyTorch® 2.3 (release note)! PyTorch 2.3 offers support for user-defined Triton kernels in torch.compile, allowing for users to migrate their own Triton kernels from eager without experiencing performance regressions or graph breaks. Tensor Parallelism improves the experience for training Large Language Models using native PyTorch functions, which has been validated on training runs for 100B parameter models. As well, semi-structured sparsity implements semi-structured sparsity as a Tensor subclass, with observed speedups of up to 1.6 over dense matrix multiplication.
    1 672
    18
    🥺 Итоги недели в мире ИИ и обзоры новых сервисов У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ. Ниже — небольшая выдержка из статьи, а целиком  👈 💬 Новости 🔘Искусственный интеллект успешно сложные экзамены и сравнился по с человеческим IQ во многих областях. Например, ИИ так же хорош, как человек в понимании, объяснении и обсуждение текста, изображений и видео. 🔘Microsoft выпустила новую модель VASA-1, которая потрясающе реалистичные видео на основе одного фото и одной аудиозаписи. 🔘 первый в мире конкурс красоты и успешности для ИИ-инфлюенсеров Мисс AI. 🛠 Инструменты 🔘 — генерирует видео с участием вашего ИИ-двойника. 🔘 — ИИ-поисковик для креативных людей. 🔘 — сохраняет диалоги с ChatGPT и Claude в удобных древовидных папках. 📈 Исследования 🔘ИИ учёным определить области мозга, связанные с психозом. Анализ данных МРТ с помощью нового алгоритма машинного обучения выявил характерные «подписи» в мозге людей с расстройствами. ➡ Вы можете подписаться на email-рассылку здесь
    Show more ...

    Гайд по соцсетям Proglib (2).mp4

    1 520
    5
    GitVerse – еще круче, быстрее и удобнее На онлайн-презентации «» СберТех представил новую функциональность платформы, которая поможет ускорить и упростить разработку. Рассказываем про новые фичи GitVerse: ✔️ CI/CD-инструменты Помогут автоматизировать сборку исходного кода и процессы поставки. А еще можно перенести свои проекты с Git-репозиториев в один клик. ✔️ Новые функции персонального AI-ассистента* GigaCode Теперь GigaCode умеет решать связанные с кодом задачи в окне чата прямо в среде разработки. А в репозитории в GitVerse можно получить объяснение, что делает конкретная часть кода, и советы по его улучшению. ✔️ Функциональность для организаций Отличная новость – разрабатывать на GitVerse теперь могут не только индивидуальные разработчики, но и малые и средние предприятия. и воспользуйтесь новыми возможностями GitVerse! *AI, artificial intelligence — искусственный интеллект
    Show more ...
    1 418
    1
    🚀 Awesome Machine Learning — фреймворки и библиотеки для ML Этот репозиторий был вдохновлён другим — awesome-php. Включает в себя библиотеки, фреймворки и инструменты для машинного обучения на всех языках программирования: от С до Julia (Python, конечно, тоже есть). Вот темы, которые есть в списке, на примере Python: 🔸 Компьютерное зрение 🔸 Обработка естественного языка 🔸 Анализ данных/визуализация 🔸 Код соревнований Kaggle 🔸 Обучение с подкреплением 🔗
    Show more ...
    1 882
    41
    🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи Напоминаем, что у нас есть бесплатный для всех, кто хочет научиться интересно писать — о программировании и в целом. Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций. Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах. 👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
    Show more ...
    1 890
    1
    💬 А вы используете в свой работе Jupyter Notebook? ❤️ — использую постоянно 👍 — иногда использую 🤔 — нет
    1 763
    2
    🛠️ NLP по-русски: подборка инструментов 🔹 Набор инструментов Natasha позволяет решать базовые NLP-задачи: токенизацию, сегментацию на предложения, морфологический и синтаксический анализ, лемматизацию, извлечение именованных сущностей. 🔹 Это библиотека, созданная на базе PyTorch. Позволяет создавать чат-ботов и сложные диалоговые системы. Включает предобученные модели для русского языка. 🔹 Морфологический анализатор для русского и украинского языков. Может приводить слово к начальной форме и возвращать грамматическую информацию о нём. Также можно использовать форк , который сейчас развивается. 🔹 Библиотека для обработки естественного языка, поддерживающая 75+ языков, а также включающая предобученные векторы слов. NLP — Natural Language Processing, обработка естественного языка
    Show more ...
    1 927
    56
    Визуализация эмбеддингов в браузере У TensorFlow есть онлайн-инструмент, который позволяет изучить пространство эмбеддингов (векторных представлений). Это не только залипательно, но и может быть полезно. Для пространств высокой размерности инструмент предварительно использует методы сокращения размерности (например, PCA). На странице доступны предобученные эмбеддинги — Word2Vec, Mnist (в виде картинок!) и Iris. Кроме того, есть возможность загрузить собственные. 🔗
    Show more ...

    Запись экрана 2024-04-23 в 10.54.31.mp4

    1 837
    31
    1 млн рублей за научную статью по AI/ML и возможность презентовать свои исследования на конференции AI Journey 2024 До 20 августа идет отбор статей для публикации в журнале «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics, которые выйдут в рамках ежегодной международной конференции по искусственному интеллекту AI Journey. Статья может быть оформлена на русском или английском языке, а также должна представлять только ранее не опубликованные сведения. Приз за лучшую статью — 1 млн рублей. Узнайте подробности и успейте подать заявку
    Show more ...
    5 285
    11
    📊🎲 Несколько полезных шпаргалок для дата-сайентистов Могут пригодиться при подготовке к собеседованию. 🔹 🔹 🔹
    1 888
    73
    Meetup по Data Science от X5 Tech ⚡️25 апреля в 19:00 в пространстве Articon + онлайн трансляция Присоединяйтесь к следующему митапу по Data Science от X5 Tech! Обсудим последние достижения в области ML и подходы к решению неэффективных процессов. Вы узнаете о мониторинге языковых моделей, чат-ботах на основе искусственного интеллекта, методах улучшения RAG-систем и многом другом! ⏳ Таймлайн: 18:30-19:00 — Начало регистрации участников. Вкусняшки и живое общение. 19:00-21:30 — Выступления спикеров 21:30 — AFTER PARTY 😎 Спикеры — X5 Tech и Звук. __ Реклама. ООО "Корпоративный центр ИКС 5", ИНН: 7728632689, erid: LjN8Jt27S
    Show more ...
    1 602
    17
    1 234
    27
    🌐 Онлайн-обучение в ML: что это такое В традиционном подходе модель обучается, используя весь набор данных сразу. Этот процесс часто сопровождается большими вычислительными затратами и не учитывает изменения в данных, которые происходят в реальном времени. ❓Что делать? Можно обучать модель на одной точке входящих данных за раз. Например, вы храните на диске (или получаете в реальном времени из какого-то источника) обучающую выборку и не загружаете её в оперативную память. Тогда вы можете считывать объекты по одному и соответственно обновлять веса. После обработки всех объектов обучающей выборки значение функции потерь уменьшится (однако часто нужно несколько десятков проходов по выборке, чтобы оно уменьшилось достаточно). 🤔 Где можно применять: ▫️Анализ финансовых рынков; ▫️Системы мониторинга показателей здоровья; ▫️Обнаружение мошенничества. 🤖 Ограничения метода: ▫️Чувствительность к порядку поступающих данных; ▫️Меньший контроль за обучением; ▫️Проблемы с интерпретацией.
    Show more ...
    1 769
    10
    Систематизируете и углубите знания бэкенд-разработки на Python на курсе Яндекс Практикума за 6 месяцев. Преимущества курса: — актуальная программа, которая постоянно обновляется; — много практики, лайвкодинг и хакатон; — возможность совмещать с другой учёбой или работой; — наставники из Яндекса и не только; — помощь с трудоустройством. ◾️Погружайтесь в Python, нарабатывайте нужные навыки и осваивайте инструменты для работы. Начните курс бесплатно, а если понравится, платите как удобно: в рассрочку или целиком. Начать бесплатно
    Show more ...
    1 409
    4
    Ответы на вопросы с собеседований А вот и ответы на три вопроса с собеседований, которые мы недавно вам задавали! 1️⃣ Как оценить статистическую значимость анализа? Для оценки статистической значимости нужно провести проверку гипотезы. Сначала определяют нулевую и альтернативную гипотезы. Затем рассчитывают p – вероятность получения наблюдаемых результатов, если нулевая гипотеза верна. Наконец, устанавливают уровень значимости alpha. Если p < alpha, нулевая гипотеза отвергается – иными словами, анализ является статистически значимым. 2️⃣ Приведите три примера распределений с длинным хвостом. Почему они важны в задачах классификации и регрессии? Три практических примера: степенной закон, закон Парето и продажи продуктов (например, продукты-бестселлеры против обычных). При решении задач классификации и регрессии важно не забывать о распределении с длинным хвостом, поскольку редко встречающиеся значения составляют существенную часть выборки. Это влияет на выбор метода обработки выбросов. Кроме того, некоторые методики машинного обучения предполагают, что данные распределены нормально. 3️⃣ Что такое центральная предельная теорема, и почему она важна? Центральная предельная теорема (ЦПТ) говорит о том, что сумма достаточно большого количества слабо зависимых случайных величин с примерно одинаковыми масштабами имеет распределение, близкое к нормальному. Центральная предельная теорема важна, поскольку она используется при проверке гипотез и расчете доверительных интервалов. 👉Хотите больше вопросов и ответы на них? Читайте нашу статью:
    Show more ...
    1 758
    35
    🧠 Теоретические основы популярных алгоритмов машинного обучения и их реализация с нуля на Python Автор «Хабра» Егор Захаренко список собственных статей с описанием популярных алгоритмов классического машинного обучения. К каждой статье прилагается код на Python. Обучение с учителем 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 Обучение без учителя 🔹 🔹 👉 Ноутбуки с алгоритмами можно скачать на и .
    Show more ...
    2 063
    219
    ⚡️Как войти в Data Science всего за год? Очень кратко пересказываем историю одного специалиста, который устроился в Data Science после работы в авиационной промышленности. В карточках — его путь и одна из рекомендаций, а в статье по ссылке — большая подборка полезных ресурсов! 👉 А чтобы следовать совету и окружить себя подходящим информационным фоном, изучайте другие классные статьи про Data Science: ⭐️⭐️⭐️
    Show more ...
    1 611
    47
    ⬆️ Дорожная карта дата-сайентиста 2024 Очередную составил один из реддиторов. В ней он перечислил необходимые специалисту по ИИ библиотеки, фреймворки и платформы. Цветом автор разметил уровень навыков: 💚 — обязательные и относительно простые; 💛 — более сложные; ❤️ — самые сложные в освоении. 👇Мы приводим укороченную версию списка со ссылками на наши обучающие материалы👇 ▫️ ▫️ ▫️ ▫️ ▫️ ▫️ ▫️ ▫️
    Show more ...
    2 119
    116
    Last updated: 11.07.23
    Privacy Policy Telemetrio