The service is also available in your language. For translation, pressEnglish
Best analytics service

Add your telegram channel for

  • get advanced analytics
  • get more advertisers
  • find out the gender of subscriber
دسته بندی
زبان جغرافیایی و کانال

all posts Библиотека data scientist’а | Data Science, Machine learning, анализ данных, машинное обучение

Все самое полезное для дата сайентиста в одном канале. Список наших каналов:  https://t.me/proglibrary/8353  Учиться у нас:  https://proglib.io/w/907158ab  Обратная связь:  @proglibrary_feedback_bot  По рекламе:  @proglib_adv  Прайс:  @proglib_adv ertising 
نمایش توضیحات
18 363+9
~3 579
~4
20.67%
رتبه کلی تلگرام
در جهان
42 302جایی
از 78 777
در کشور, روسیه 
5 597جایی
از 8 625
دسته بندی
884جایی
از 1 396
همه انتشارات
✍️ Правила внедрения машинного обучения от Google У Google есть целый , в котором перечислены лучшие практики для специалистов по машинному обучению. Мы приведём избранные правила. ✅ Не бойтесь запускать продукт без машинного обучения Для машинного обучения всегда нужны данные. Если с этим есть проблема, то стоит попробовать использовать для своего продукта нечто другое, какую-нибудь простую эвристику. Иными словами, если ML не является абсолютно необходимым для вашего продукта, не применяйте его, пока у вас не будет достаточно данных. ✅ Сначала придумайте метрики Прежде чем определиться, что будет делать ваша система машинного обучения, попробуйте отследить как можно больше показателей в вашей текущей системе. ✅ Между сложной эвристикой и машинным обучением выбирайте второе Простая эвристика может помочь быстро запустить продукт. Сложную эвристику трудно поддерживать. Как только у вас появятся данные и базовое представление о том, чего вы пытаетесь достичь, переходите к машинному обучению. ✅ Сделайте первую модель простой и правильно настройте инфраструктуру Прежде чем кто-либо сможет использовать вашу новую продвинутую систему машинного обучения, вам необходимо будет определить: - Как давать примеры на вход алгоритму. - Что такое «хорошо» и «плохо» для вашей системы. - Как интегрировать модель в ваше приложение. Специалисты Google также советуют выбирать простые признаки для модели. ✅ Постарайтесь обнаружить проблемы перед экспортом моделей В частности, убедитесь, что производительность модели на отложенных данных находится на разумном уровне. Если у вас остаются опасения по поводу данных, не экспортируйте модель. ✅ Не зацикливайтесь на выборе оптимизируемой цели На ранних этапах процесса машинного обучения можно заметить, что улучшаются все показатели, даже те, которые вы не оптимизируете напрямую. Например, вам важно количество кликов и время, проведённое на сайте. Если вы оптимизируете количество кликов, скорее всего, вы увидите и увеличение времени на сайте. Старайтесь сохранять процесс простым и не перегружайте себя размышлениями о балансе различных метрик. ✅ Выберите простую метрику для вашей первой цели Проще всего моделировать поведение пользователя, которое можно наблюдать непосредственно. Например, факт клика по ссылке, оценки чего-либо и т.д. Избегайте моделирования косвенных эффектов вначале: не стоит пытаться отследить посетил ли пользователь сайт на следующий день и как долго он находился на сайте. Наконец, не нужно пытаться заставить машинное обучение выяснить, счастлив ли пользователь. ✅ Логируйте Стоит сохранять набор признаков, используемых во время применения модели, а затем использовать их во время обучения. Даже если вы не можете сделать это для каждого примера, сделайте хотя бы для небольшой части. ✅ Не тратьте время на новые признаки, если проблемой стали несогласованные цели Если цели, поставленные перед алгоритмом или системой машинного обучения, не соответствуют общим целям продукта или бизнеса, то не стоит пытаться решить их примитивным добавлением новых признаков.
ادامه مطلب ...
621
28
🤖 Машинное обучение для людей: Разбираемся простыми словами Этот блогпост представляет собой большое введение для тех, кто хочет разобраться в машинном обучении без формул и теорем. Автор даёт много примеров реальных задач и их решений, а также старается писать об этом простым языком. Вот темы, которые охватывает блогпост: 🔹составляющие машинного обучения; 🔹алгоритмы обучения с учителем; 🔹алгоритмы обучения без учителя; 🔹уменьшение размерности; 🔹обучение с подкреплением; 🔹ансамбли; 🔹глубокое обучение и нейросети. 🔗
ادامه مطلب ...
Машинное обучение для людей
None
1 113
61
🤖🖼️ Как работают визуальные трансформеры: магия превращения пикселей в знания Визуальные трансформеры (Vision Transformers, ViTs) — класс моделей глубокого обучения, которые достигли выдающихся результатов в задачах классификации изображений. В основе ViTs лежит архитектура трансформеров, изначально разработанная для обработки естественного языка. В новой статье подробно рассказываем (с картинками), как работают такие модели компьютерного зрения. 🔗 🔗
3 739
60
💵Моделирование курса валют методом Монте-Карло Метод Монте-Карло позволяет исследовать какой-либо случайный процесс, многократно имитируя его. Новая статья на «Хабре» посвящена анализу и прогнозированию валютных курсов с помощью такого подхода. Автор привёл примеры кода на Python и объяснил каждую используемую функцию. 🔗
1 574
75
🎓 Небольшая подборка бесплатных курсов по классическому машинному обучению ▫️ Культовый курс по основам машинного обучения с Эндрю Ыном, американским учёным-информатиком. Представляет собой набор видеолекций. ▫️ Курс на Stepik, на котором подробно разбираются основные алгоритмы классического ML: линейная и логистическая регрессии, метод k-ближайших соседей, случайный лес, метод главных компонент и др. ▫️ Курс, рассказывающий о концептах и алгоритмах, лежащих в основе современного ML. Также в программе есть теория вероятностей, нейросети, NLP и др. ▫️ В курсе делается упор на глубокое понимание математических основ. Автор — зав. лаб. «Машинное обучение и семантический анализ» Института искусственного интеллекта МГУ.
ادامه مطلب ...
1 641
114
ААА! Авторы Академии Аналитиков Авито выпустили бесплатный курс по прикладной статистике. В нём две части — первая по базе, которую важно знать для работы с данными, вторая по более сложным критериям. Пройти можно здесь. Курс научит собирать и валидировать кастомные критерии на реальных данных, а ещё решать задачи бизнеса с применением прикладной статистики.
1 578
60
PySpark: небольшой гайд по библиотеке PySpark — это Python API для Apache Spark. А Apache Spark, в свою очередь, представляет собой движок для распределённой обработки задач, связанных с большими данными. Так, PySpark позволяет работать с данными любого размера. Библиотека поддерживает все функции Spark, включая Spark SQL и DataFrames. 🔸Spark SQL предназначен для работы со структурированными данными и позволяет сочетать SQL-запросы с программами Spark. 🔸PySpark DataFrames позволяет читать, записывать, трансформировать и анализировать данные. 👆К посту мы прикрепили небольшую шпаргалку по этим двум основным инструментам PySpark
ادامه مطلب ...

PySpark_SQL_Cheat_Sheet.pdf

1 663
50
Телеграм-канал для ML-специалистов от Яндекса Yandex for ML — канал для ML-инженеров от Яндекса. Рассказываем, как мы обучаем наши модели и интегрируем их в продукты, как делаем сервисы с архитектурой сразу из нескольких нейросетей, как обучаем модели для специфичных задач и многое другое. Подписывайтесь 👉
1 527
3
💬 Итак, настало время расшифровать аббревиатуры. На выбор: 🔹AI/ИИ 🔹ML 🔹DL 🔹GPT 🔹DS 👇Только неправильные ответы👇
1 636
5
Хотите учиться у экспертов в области IT? Школа анализа данных Яндекса принимает заявки до 12 мая, успейте . ШАД для вас, если вы: · интересуетесь Machine Learning · имеете хорошую математическую подготовку · уверенно владеете каким-либо языком программирования Программа длится два года, обучение бесплатное. Можно выбрать одно из направлений: Data Science, инфраструктура больших данных, разработка машинного обучения или анализ данных и ИИ в прикладных науках. Больше об учёбе в ШАД и возможностях для выпускников расскажем на днях открытых дверей. Узнать даты и зарегистрироваться можно .
ادامه مطلب ...

file

1 668
9
🐍🤔 «Задумчивый» код: временная сложность операций со структурами данных в Python Вы когда-нибудь задумывались, почему некоторые операции в Python выполняются мгновенно, а другие заставляют ваш код «задумчиво» работать? В новой статье разбираемся во временной сложности и узнаём, как писать быстрый и эффективный код. 🔗 🔗
1 360
20
🦾🧠🏋Качаем мозги к лету! Хотите начать работать с большими данными, применять методы машинного обучения, статистический анализ, а также разрабатывать алгоритмы для извлечения информации? Тогда наш полугодовой курс от преподавателей МГУ, подходит для этого. И мы можете попасть на него со скидкой 40% ➡️ 29 990 ₽ 17 994 ₽ Вас ждет развернутая обратная связь по всем домашним заданиям, а также ссылки на полезные дополнительные материалы. У вас не будет шансов не усвоить какие-то темы курса👌 ⭐️ Переходите и активируйте бесплатные вводные занятия курса
ادامه مطلب ...
1 578
2
Вышел PyTorch 2.3 Основное нововведение — . Их можно переносить без снижения производительности или сбоев в графике. Triton — языковой компилятор для создания сильно оптимизированных ядер CUDA. Помимо этого в PyTorch 2.3: ▫️Tensor Parallel API, который позволяет реализовать распределённые вычисления. API был специально адаптирован для обучения трансформеров с очень большим количеством параметров. ▫️Подкласс torch.sparse.SparseSemiStructuredTensor, который реализует полуструктурированную разреженность и позволяет добиться ускорения вычислений до 1.6 раза по сравнению с умножениями плотных (dense) матриц. 🔗
ادامه مطلب ...
PyTorch 2.3 Release Blog
We are excited to announce the release of PyTorch® 2.3 (release note)! PyTorch 2.3 offers support for user-defined Triton kernels in torch.compile, allowing for users to migrate their own Triton kernels from eager without experiencing performance regressions or graph breaks. Tensor Parallelism improves the experience for training Large Language Models using native PyTorch functions, which has been validated on training runs for 100B parameter models. As well, semi-structured sparsity implements semi-structured sparsity as a Tensor subclass, with observed speedups of up to 1.6 over dense matrix multiplication.
1 672
18
🥺 Итоги недели в мире ИИ и обзоры новых сервисов У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ. Ниже — небольшая выдержка из статьи, а целиком  👈 💬 Новости 🔘Искусственный интеллект успешно сложные экзамены и сравнился по с человеческим IQ во многих областях. Например, ИИ так же хорош, как человек в понимании, объяснении и обсуждение текста, изображений и видео. 🔘Microsoft выпустила новую модель VASA-1, которая потрясающе реалистичные видео на основе одного фото и одной аудиозаписи. 🔘 первый в мире конкурс красоты и успешности для ИИ-инфлюенсеров Мисс AI. 🛠 Инструменты 🔘 — генерирует видео с участием вашего ИИ-двойника. 🔘 — ИИ-поисковик для креативных людей. 🔘 — сохраняет диалоги с ChatGPT и Claude в удобных древовидных папках. 📈 Исследования 🔘ИИ учёным определить области мозга, связанные с психозом. Анализ данных МРТ с помощью нового алгоритма машинного обучения выявил характерные «подписи» в мозге людей с расстройствами. ➡ Вы можете подписаться на email-рассылку здесь
ادامه مطلب ...

Гайд по соцсетям Proglib (2).mp4

1 520
5
GitVerse – еще круче, быстрее и удобнее На онлайн-презентации «» СберТех представил новую функциональность платформы, которая поможет ускорить и упростить разработку. Рассказываем про новые фичи GitVerse: ✔️ CI/CD-инструменты Помогут автоматизировать сборку исходного кода и процессы поставки. А еще можно перенести свои проекты с Git-репозиториев в один клик. ✔️ Новые функции персонального AI-ассистента* GigaCode Теперь GigaCode умеет решать связанные с кодом задачи в окне чата прямо в среде разработки. А в репозитории в GitVerse можно получить объяснение, что делает конкретная часть кода, и советы по его улучшению. ✔️ Функциональность для организаций Отличная новость – разрабатывать на GitVerse теперь могут не только индивидуальные разработчики, но и малые и средние предприятия. и воспользуйтесь новыми возможностями GitVerse! *AI, artificial intelligence — искусственный интеллект
ادامه مطلب ...
1 418
1
🚀 Awesome Machine Learning — фреймворки и библиотеки для ML Этот репозиторий был вдохновлён другим — awesome-php. Включает в себя библиотеки, фреймворки и инструменты для машинного обучения на всех языках программирования: от С до Julia (Python, конечно, тоже есть). Вот темы, которые есть в списке, на примере Python: 🔸 Компьютерное зрение 🔸 Обработка естественного языка 🔸 Анализ данных/визуализация 🔸 Код соревнований Kaggle 🔸 Обучение с подкреплением 🔗
ادامه مطلب ...
1 882
41
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи Напоминаем, что у нас есть бесплатный для всех, кто хочет научиться интересно писать — о программировании и в целом. Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций. Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах. 👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
ادامه مطلب ...
1 890
1
💬 А вы используете в свой работе Jupyter Notebook? ❤️ — использую постоянно 👍 — иногда использую 🤔 — нет
1 763
2
🛠️ NLP по-русски: подборка инструментов 🔹 Набор инструментов Natasha позволяет решать базовые NLP-задачи: токенизацию, сегментацию на предложения, морфологический и синтаксический анализ, лемматизацию, извлечение именованных сущностей. 🔹 Это библиотека, созданная на базе PyTorch. Позволяет создавать чат-ботов и сложные диалоговые системы. Включает предобученные модели для русского языка. 🔹 Морфологический анализатор для русского и украинского языков. Может приводить слово к начальной форме и возвращать грамматическую информацию о нём. Также можно использовать форк , который сейчас развивается. 🔹 Библиотека для обработки естественного языка, поддерживающая 75+ языков, а также включающая предобученные векторы слов. NLP — Natural Language Processing, обработка естественного языка
ادامه مطلب ...
1 927
56
Визуализация эмбеддингов в браузере У TensorFlow есть онлайн-инструмент, который позволяет изучить пространство эмбеддингов (векторных представлений). Это не только залипательно, но и может быть полезно. Для пространств высокой размерности инструмент предварительно использует методы сокращения размерности (например, PCA). На странице доступны предобученные эмбеддинги — Word2Vec, Mnist (в виде картинок!) и Iris. Кроме того, есть возможность загрузить собственные. 🔗
ادامه مطلب ...

Запись экрана 2024-04-23 в 10.54.31.mp4

1 837
31
1 млн рублей за научную статью по AI/ML и возможность презентовать свои исследования на конференции AI Journey 2024 До 20 августа идет отбор статей для публикации в журнале «Доклады Российской академии наук. Математика, информатика, процессы управления» и его англоязычной версии Doklady Mathematics, которые выйдут в рамках ежегодной международной конференции по искусственному интеллекту AI Journey. Статья может быть оформлена на русском или английском языке, а также должна представлять только ранее не опубликованные сведения. Приз за лучшую статью — 1 млн рублей. Узнайте подробности и успейте подать заявку
ادامه مطلب ...
5 285
11
📊🎲 Несколько полезных шпаргалок для дата-сайентистов Могут пригодиться при подготовке к собеседованию. 🔹 🔹 🔹
1 888
73
Meetup по Data Science от X5 Tech ⚡️25 апреля в 19:00 в пространстве Articon + онлайн трансляция Присоединяйтесь к следующему митапу по Data Science от X5 Tech! Обсудим последние достижения в области ML и подходы к решению неэффективных процессов. Вы узнаете о мониторинге языковых моделей, чат-ботах на основе искусственного интеллекта, методах улучшения RAG-систем и многом другом! ⏳ Таймлайн: 18:30-19:00 — Начало регистрации участников. Вкусняшки и живое общение. 19:00-21:30 — Выступления спикеров 21:30 — AFTER PARTY 😎 Спикеры — X5 Tech и Звук. __ Реклама. ООО "Корпоративный центр ИКС 5", ИНН: 7728632689, erid: LjN8Jt27S
ادامه مطلب ...
1 602
17
1 234
27
🌐 Онлайн-обучение в ML: что это такое В традиционном подходе модель обучается, используя весь набор данных сразу. Этот процесс часто сопровождается большими вычислительными затратами и не учитывает изменения в данных, которые происходят в реальном времени. ❓Что делать? Можно обучать модель на одной точке входящих данных за раз. Например, вы храните на диске (или получаете в реальном времени из какого-то источника) обучающую выборку и не загружаете её в оперативную память. Тогда вы можете считывать объекты по одному и соответственно обновлять веса. После обработки всех объектов обучающей выборки значение функции потерь уменьшится (однако часто нужно несколько десятков проходов по выборке, чтобы оно уменьшилось достаточно). 🤔 Где можно применять: ▫️Анализ финансовых рынков; ▫️Системы мониторинга показателей здоровья; ▫️Обнаружение мошенничества. 🤖 Ограничения метода: ▫️Чувствительность к порядку поступающих данных; ▫️Меньший контроль за обучением; ▫️Проблемы с интерпретацией.
ادامه مطلب ...
1 769
10
Систематизируете и углубите знания бэкенд-разработки на Python на курсе Яндекс Практикума за 6 месяцев. Преимущества курса: — актуальная программа, которая постоянно обновляется; — много практики, лайвкодинг и хакатон; — возможность совмещать с другой учёбой или работой; — наставники из Яндекса и не только; — помощь с трудоустройством. ◾️Погружайтесь в Python, нарабатывайте нужные навыки и осваивайте инструменты для работы. Начните курс бесплатно, а если понравится, платите как удобно: в рассрочку или целиком. Начать бесплатно
ادامه مطلب ...
1 409
4
Ответы на вопросы с собеседований А вот и ответы на три вопроса с собеседований, которые мы недавно вам задавали! 1️⃣ Как оценить статистическую значимость анализа? Для оценки статистической значимости нужно провести проверку гипотезы. Сначала определяют нулевую и альтернативную гипотезы. Затем рассчитывают p – вероятность получения наблюдаемых результатов, если нулевая гипотеза верна. Наконец, устанавливают уровень значимости alpha. Если p < alpha, нулевая гипотеза отвергается – иными словами, анализ является статистически значимым. 2️⃣ Приведите три примера распределений с длинным хвостом. Почему они важны в задачах классификации и регрессии? Три практических примера: степенной закон, закон Парето и продажи продуктов (например, продукты-бестселлеры против обычных). При решении задач классификации и регрессии важно не забывать о распределении с длинным хвостом, поскольку редко встречающиеся значения составляют существенную часть выборки. Это влияет на выбор метода обработки выбросов. Кроме того, некоторые методики машинного обучения предполагают, что данные распределены нормально. 3️⃣ Что такое центральная предельная теорема, и почему она важна? Центральная предельная теорема (ЦПТ) говорит о том, что сумма достаточно большого количества слабо зависимых случайных величин с примерно одинаковыми масштабами имеет распределение, близкое к нормальному. Центральная предельная теорема важна, поскольку она используется при проверке гипотез и расчете доверительных интервалов. 👉Хотите больше вопросов и ответы на них? Читайте нашу статью:
ادامه مطلب ...
1 758
35
🧠 Теоретические основы популярных алгоритмов машинного обучения и их реализация с нуля на Python Автор «Хабра» Егор Захаренко список собственных статей с описанием популярных алгоритмов классического машинного обучения. К каждой статье прилагается код на Python. Обучение с учителем 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 Обучение без учителя 🔹 🔹 👉 Ноутбуки с алгоритмами можно скачать на и .
ادامه مطلب ...
2 063
219
⚡️Как войти в Data Science всего за год? Очень кратко пересказываем историю одного специалиста, который устроился в Data Science после работы в авиационной промышленности. В карточках — его путь и одна из рекомендаций, а в статье по ссылке — большая подборка полезных ресурсов! 👉 А чтобы следовать совету и окружить себя подходящим информационным фоном, изучайте другие классные статьи про Data Science: ⭐️⭐️⭐️
ادامه مطلب ...
1 611
47
⬆️ Дорожная карта дата-сайентиста 2024 Очередную составил один из реддиторов. В ней он перечислил необходимые специалисту по ИИ библиотеки, фреймворки и платформы. Цветом автор разметил уровень навыков: 💚 — обязательные и относительно простые; 💛 — более сложные; ❤️ — самые сложные в освоении. 👇Мы приводим укороченную версию списка со ссылками на наши обучающие материалы👇 ▫️ ▫️ ▫️ ▫️ ▫️ ▫️ ▫️ ▫️
ادامه مطلب ...
2 119
116
👩‍💼Собеседование — самое важное событие для начинающего специалиста Для многих новичков сам факт приглашения на собеседование — уже большое событие. И, как нам кажется, половина успеха! Давайте проверим, насколько вы к нему готовы — мы выбрали три популярных вопроса, которые задают на собеседованиях будущим Data-специалистам; пишите свои ответы в комментариях! 1️⃣ Как оценить статистическую значимость анализа? 2️⃣ Приведите три примера распределений с длинным хвостом. Почему они важны в задачах классификации и регрессии? 3️⃣ Что такое центральная предельная теорема, и почему она важна?
ادامه مطلب ...
1 998
11
🦙 Вышла Llama 3 Это самая крупная открытая языковая модель от Meta*. Ключевые особенности: 🔘Доступна сейчас в двух версиях: предобученная модель с 8 млрд параметров и дообученная на инструкциях модель на 70 млрд. 🔘Должна хорошо справляться со сложными, многоступенчатыми задачами и генерацией кода. 🔘Размер контекстного окна составляет 8 тысяч токенов. 🔘По бенчмаркам превосходит другие открытые LLM. 🔘Дообучение Llama 3 после этапа предтренировки производилось на 10 миллионах примерах, вручную размеченных людьми. Известно также, что в процессе обучения находится модель с 400+ млрд параметров. 🔗 🔗 *организация, деятельность которой запрещена на территории РФ
ادامه مطلب ...
2 190
39

На вход нейросети подаётся фотография размером 227×227×3. К ней применяется свёрточный слой с фильтром размером 11×11. Всего применяется 96 фильтров с шагом 4. Каким будет размер выходного изображения после этого слоя?

54x54x96
55×55×96
54x54
55×55
0
رأی دادن ناشناس
2 252
4
⚡️Data Fusion-2024 начала свою работу! Сегодня и завтра говорим о Data Science, искусственном интеллекте и машинном обучении. Участников конференции ждут: 🔹 Более 30 научных и бизнес-сессий и 150 спикеров: обсуждаем все от трендов ИИ до новостей сферы беспилотного транспорта. Трансляция самого интересного — 🔹 Доклад об опасностях развития ИИ и о том, как их избежать 🔹 Награждение победителей конкурса Data Fusion Contest, одного из самых сложных соревнований в сфере Data Science. Живем в эпоху больших данных 💚 Кстати, на скриншотах — наша метавселенная, где уже совсем скоро стартует одна из сессий конференции. Пока тестируем и используем метаверс внутри банка: например, проводим в ней встречи команд и создаем 3D-модели сложных технологических продуктов и сервисов.
ادامه مطلب ...
1 882
5
🤔 Оптимизация гиперпараметров за 5 секунд? Гиперпараметры — это характеристики модели, которые фиксируются ещё до начала обучения. Например, глубина решающего дерева и learning rate для градиентного спуска. Их подбор — очень важный этап обучения. Правильные значения гиперпараметров могут радикальным образом повлиять на производительность. На «Хабре» опубликовали обзор следующих основных методов оптимизации гиперпараметров: ▫️Grid Search ▫️Random Search ▫️Байесовская/вероятностная оптимизация ▫️TPE (Tree-structured Parzen Estimator). 🔗
ادامه مطلب ...
2 169
54
Данные сегодня ценнее золота. А умение извлекать из них пользу — навык, который уже сейчас нужен крупным работодателям. Приходите на день открытых дверей онлайн-бакалавриата «Аналитика и Data Science» от ТюмГУ и Нетологии, чтобы погрузиться в тему больших данных. Встреча пройдёт 20 апреля в 14:00 мск. Вы узнаете: - Кто работает с данными и чем именно занимаются эти специалисты. - Какие знания и навыки нужны, чтобы реализоваться в профессии. - Как устроено обучение в бакалавриате и что входит в программу. - Какие есть требования к поступлению. Погрузитесь в одну из самых востребованных и перспективных профессий. Регистрируйтесь, чтобы сделать первый шаг к карьере аналитика или Data Scientist. Записаться → Реклама ООО “Нетология” LatgBqBwM
ادامه مطلب ...
1 599
4
🔥 Вышла новая PyTorch-библиотека для файн-тюнинга LLM Библиотека называется . Она поддерживает весь воркфлоу, включая: 🔸 Загрузку и подготовку датасетов и чекпойнтов моделей; 🔸 Настройку процесса обучения с помощью разнообразных строительных блоков (как в torch); 🔸 Процесс логирования и метрики для отслеживания процесса обучения; 🔸 Квантизацию моделей после обучения; 🔸 Оценку моделей с помощью популярных бенчмарков; 🔸 Локальный запуск для тестирования. 🔗 🔗
ادامه مطلب ...
torchtune: Easily fine-tune LLMs using PyTorch
We’re pleased to announce the alpha release of torchtune, a PyTorch-native library for easily fine-tuning large language models.
2 187
66
🖥 Итоги недели в мире Python и обзоры новых инструментов У нас есть еженедельная рассылка о последних открытиях и тенденциях в мире Python. Мы опубликовали новый выпуск на 📰. Ниже — небольшая часть выпуска, а целиком 👈 💬 Как автоматически создавать субтитры В рассматривается простейший способ транскрипции видео и создания субтитров — с помощью Python, Whisper и FFmpeg. ▶️ Видеотуториалы 🔘 SQLAlchemy — это библиотека, предназначенная для работы с реляционными базами данных. Умеет выполнять все запросы, доступные в SQL. 🔘 Автор видео показывает, как сделать аналог знаменитого чат-бота с помощью Django, вебсокетов (Channels) и HTMX. 🛠 Инструменты 🔘 — автоматически конвертирует дизайны Figma в код Tkinter GUI. 🔘 — библиотека для визуализации диаграмм, карт и схем . 🔘 — создаёт привлекательные таблицы для визуализации данных из датафреймов Pandas и Polars. ➡ Вы можете подписаться на email-рассылку
ادامه مطلب ...
1 555
24
🧡 Гайд для новичков по Google Colab 💛 Один из специалистов Google по машинному обучению выпустил получасовой ролик, который охватывает все необходимые новичку тонкости использования Colab-ноутбуков. 🔸 Виды ячеек 🔸 Вызов подсказок 🔸 Отрисовка графиков 🔸 Создание форм 🔸 Установка пакетов 🔸 Интеграция с Google Drive 🔸 Магические команды 🔸 Установка секретов 🔗
2 237
77
💬 Начните писать в комментариях фразу «Искусственный интеллект скоро...», а подсказки при вводе пусть продолжат за вас.
2 378
1
🤖💣 ИИ-ассистенты разработчика: скрытая угроза Внедрение ИИ в процессы разработки и отладки неизменно сопровождается изматывающими обсуждениями с участием юристов, комплаенс-менеджеров и специалистов по кибербезопасности. И это понятно — никому не хочется нести ответственность за риски, связанные с безопасностью данных, конфиденциальностью и соблюдением авторских прав. Однако самый важный вопрос — как использование ИИ повлияет на качество готового продукта — обычно остается без внимания. Именно эту проблему мы и обсудим. 🔗 🔗
ادامه مطلب ...
11 085
72
🔥🎥 Adobe анонсировала ИИ-редактор для Premiere Pro Компания на видео возможности модели Adobe Firefly. Скоро в Premiere Pro появится вкладка Generative, в которой будут следующие опции: 🔸Object Addition — позволяет выделить участок сцены и промптом указать, что именно там должно располагаться. Нужные объекты сгенерируются в нужном месте. 🔸Object Removal — объекты можно не только добавлять, но и убирать. Их выделение выглядит очень просто, и видимых следов от присутствия не остаётся. 🔸Generative Extend — позволяет расширить ваши футажи, чтобы добиться необходимой длительности ролика. Все фишки появятся в Premiere Pro «позже в этом году». Кроме того, программу можно будет интегрировать со сторонними видеомоделями (Pika, Runway и, может быть даже, Sora от OpenAI).
ادامه مطلب ...

Generative_AI_in_Premiere_Pro_powered_by_Adobe_Firefly_Adobe_V.mp4

2 330
18
👆Как обучаются большие языковые модели👆

N01IFr6xq90lU1FY.mp4

2 611
40
🧑‍💻 Анализ навыков data-специализаций в вакансиях HH.ru Один из пользователей «Хабра» проанализировал вакансии на HeadHunter по следующим трём специализациям: ▪️BI/Data аналитик; ▪️Data Science; ▪️Продуктовый аналитик. Автор также создал дашборд, где можно посмотреть требуемые навыки для каждой специализации, среднюю зарплату и количество вакансий по России. 🔗 🔗 👉
2 365
66
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта. В ней: ● Новости о прорывных исследованиях в области машинного обучения и нейросетей ● Материалы о применении ИИ в разных сферах ● Статьи об этических аспектах развития технологий ● Подборки лучших онлайн-курсов и лекций по машинному обучению ● Обзоры инструментов и библиотек для разработки нейронных сетей ● Ссылки на репозитории с открытым исходным кодом ИИ-проектов ● Фильмы, сериалы и книги 👉
ادامه مطلب ...
2 167
1
Как выбрать количество скрытых слоёв и нейронов в нейросети? Не существует универсального решения этой проблемы. Выбор количества скрытых слоёв и нейронов часто зависит от практических наблюдений и экспериментов. Однако есть несколько общих принципов и эвристик, которые можно использовать. ▫️Количество скрытых слоёв может быть определено сложностью решаемой проблемы. Простые задачи можно решить с использованием всего одного скрытого слоя, тогда как более сложные задачи могут потребовать больше. Однако нужно помнить, что добавление дополнительных слоёв также увеличивает риск переобучения. Следует находить компромисс. ▫️Количество нейронов в скрытом слое может быть определено на основе количества входных признаков и желаемого уровня сложности модели. Некоторые специалисты советуют применять такие правила: — Число нейронов в скрытых слоях должно лежать в диапазоне от количества входных до количества выходных нейронов. — Можно сделать количество нейронов в скрытом слое кратным к размеру входного слоя. Например, в два раза больше или в два раза меньше. На практике бывает полезно начать с простой модели и постепенно увеличивать её сложность до достижения желаемой производительности.
ادامه مطلب ...
2 306
27
📊 Индуктивная статистика: доверительные интервалы, предельные ошибки, размер выборки и проверка гипотез На «Хабре» вышла хорошая статья, рассказывающая о: 🔘анализе выборок; 🔘влиянии параметров эксперимента и статистических критериев на результаты анализа; 🔘основных критериях; 🔘доверительных интервалах; 🔘статистических тестах. 🔗
2 303
124
1 745
14
🦾 Почти 1000 опенсорсных LLM-инструментов На этом сайте каждые 6 часов обновляется llama-police — список инструментов на основе больших языковых моделей (LLM) с открытым исходным кодом. В таблице перечислены репозитории таких проектов, их краткое описание, количество контрибьюторов, звёзд и т.д. 👉 Большинство из проектов также можно найти в на GitHub. 🔗
2 227
67
😍 Итоги недели в мире ИИ и обзоры новых сервисов У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ. Ниже — небольшая выдержка из статьи, а целиком  👈 💬 Новости 🔘С помощью браузера Opera теперь можно локальные LLM. Поддерживается более 150 моделей. 🔘AI-компании уже соскрапили почти весь интернет и в ближайшее время начнут испытывать . 🔘Stability AI представила для генерации музыкальных треков длиной до 3 минут. 🛠 Инструменты 🔘 — ИИ-поисковик, который ищет решения самых сложных проблем по огромной базе научных публикаций. 🔘 — конвертирует скриншоты в HTML-код. Может создать клон сайта по URL. 🔘 — ИИ-преподаватель иностранных языков. 🔘 — мощный ИИ-редактор изображений. 📈 Исследования 🔘 Спойлер: не GPT-4. 🔘 Метод заключается в том, чтобы незаметно перенастроить модель на выполнение вредоносных запросов, на которые она обычно отказывается отвечать. ➡ Вы можете подписаться на email-рассылку здесь
ادامه مطلب ...
1 943
26
https://t.me/neuro_text/38
Библиотека нейротекста | ChatGPT, Gemini, Bing
😍 Итоги недели в мире ИИ и обзоры новых сервисов У нас вышла новая статья на 📰 по мотивам еженедельной рассылки про последние новости и тенденции в мире ИИ. Ниже — небольшая выдержка из статьи, а целиком читайте здесь 👈 💬 Новости 🔘С помощью браузера Opera теперь можно загружать и использовать локальные LLM. Поддерживается более 150 моделей. 🔘AI-компании уже соскрапили почти весь интернет и в ближайшее время начнут испытывать недостаток в данных. 🔘Stability AI представила новую версию модели Stable Audio 2.0 для генерации музыкальных треков длиной до 3 минут. 🛠 Инструменты 🔘Undermind — ИИ-поисковик, который ищет решения самых сложных проблем по огромной базе научных публикаций. 🔘IMG2HTML — конвертирует скриншоты в HTML-код. Может создать клон сайта по URL. 🔘CallTeacher — ИИ-преподаватель иностранных языков. 🔘Photoroom — мощный ИИ-редактор изображений. 📈 Исследования 🔘Какие модели лучше всего справляются с суммаризацией. ⠌⣈⠆⠩⣐⠨⠰⢨ ⠪⠊ ⢘⠜⡄⠸⣀⠡ 🔘Придумана новая техника взлома LLM. Метод заключается в том, чтобы незаметно перенастроить модель на выполнение вредоносных запросов, на которые она обычно отказывается отвечать. ➡ Вы можете подписаться на email-рассылку здесь
2
0
👾 Замена смартфону с ИИ оказалась не рабочей Журналист The Verge протестировал носимое устройство Humane AI Pin, которое позиционируется как замена смартфону. Это коробочка без экрана, всё взаимодействие с которой идёт через голосовое управление. Она работает под управлением операционной системы CosmOS, которая снабжена ассистентом с искусственным интеллектом. 🤔 Журналист использовал Humane AI Pin какое-то время и пришёл к выводу, что у устройства есть множество технических проблем, и его функциональность ограничена. Так, Humane AI Pin работает медленно и часто не выполняет команды. Кроме того, устройство быстро перегревается, аккумулятор держит заряд мало времени, а проектор, предназначенный для отображения информации, имеет низкое качество. 🔗
ادامه مطلب ...
2 121
4
Самые полезные каналы для программистов в одной подборке! Сохраняйте себе, чтобы не потерять 💾 🔥Для всех — новости, статьи, досуг, фундаментальные темы — тут мы рассказываем про обучение и курсы #️⃣C# — полезные статьи, новости и обучающие материалы по C# — код, квизы и тесты — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования ☁️DevOps — полезные статьи, новости и обучающие материалы по DevOps — код, квизы и тесты — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования 🐘PHP — полезные статьи, новости и обучающие материалы по PHP — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования — код, квизы и тесты 🐍Python — полезные статьи, новости и обучающие материалы по Python — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования — код, квизы и тесты ☕Java — полезные статьи по Java, новости и обучающие материалы — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования — код, квизы и тесты 👾Data Science — полезные статьи, новости и обучающие материалы по Data Science — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования — код, квизы и тесты 🦫Go — полезные статьи, новости и обучающие материалы по Go — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования — код, квизы и тесты 🧠C++ — полезные статьи, новости и обучающие материалы по C++ — тренируемся отвечать на каверзные вопросы во время интервью и технического собеседования — код, квизы и тесты 💻Другие профильные каналы 💼Каналы с вакансиями 📁Чтобы добавить папку с нашими каналами, нажмите 👉сюда👈 🤖Также у нас есть боты: Мы в других соцсетях: 🔸 🔸 🔸 🔸 * 🔸 * * Организация Meta запрещена на территории РФ
ادامه مطلب ...
1 826
18

Что нужно вставить на место пропуска, чтобы вывести число измерений массива arr?

size
len
shape
ndim
225
رأی دادن ناشناس
2 005
0
2 043
0
13 776
137
🔥 Практическое видео по работе с базовым набором DS-инструментов Автор YouTube-канала Onur Baltacı сделал 7.5-часовое видео с введением в основные библиотеки и инструменты для науки о данных и машинного обучения. Предназначено для начинающих. Таймкоды: 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔸 🔗
ادامه مطلب ...
2 210
88
Напишите линейную регрессию на Python с нуля Это один из самых простых алгоритмов. Он включает следующие шаги: 1️⃣ Инициализация параметров. 2️⃣ Вычисление предсказаний. 3️⃣ Вычисление функции потерь. 4️⃣ Обновление параметров с помощью градиентного спуска. 5️⃣ Повторение до сходимости.
import numpy as np

class LinearRegression:
    def __init__(self, learning_rate=0.01, n_iters=1000):
        self.learning_rate = learning_rate
        self.n_iters = n_iters

    def fit(self, X, y):
        n_samples, n_features = X.shape
        self.weights = np.zeros(n_features)
        self.bias = 0

        for _ in range(self.n_iters):
            model_preds = self.predict(X)
            dw = (1 / n_samples) * np.dot(X.T, (model_preds - y))
            db = (1 / n_samples) * np.sum(model_preds - y)

            self.weights -= self.learning_rate * dw
            self.bias -= self.learning_rate * db

    def predict(self, X):
        return np.dot(X, self.weights) + self.bias
ادامه مطلب ...
2 213
66
https://t.me/ds_interview_lib/273
Библиотека собеса по Data Science | вопросы с собеседований
Напишите линейную регрессию на Python с нуля Это один из самых простых алгоритмов. Он включает следующие шаги: 1️⃣ Инициализация параметров. 2️⃣ Вычисление предсказаний. 3️⃣ Вычисление функции потерь. 4️⃣ Обновление параметров с помощью градиентного спуска. 5️⃣ Повторение до сходимости. import numpy as np class LinearRegression: def __init__(self, learning_rate=0.01, n_iters=1000): self.learning_rate = learning_rate self.n_iters = n_iters def fit(self, X, y): n_samples, n_features = X.shape self.weights = np.zeros(n_features) self.bias = 0 for _ in range(self.n_iters): model_preds = self.predict(X) dw = (1 / n_samples) * np.dot(X.T, (model_preds - y)) db = (1 / n_samples) * np.sum(model_preds - y) self.weights -= self.learning_rate * dw self.bias -= self.learning_rate * db def predict(self, X): return np.dot(X, self.weights) + self.bias #машинное_обучение #программирование
85
2
Нейросеть для генерации изображений YandexART стала доступна для тестирования внешним компаниям! В режиме закрытого превью нейросеть уже попробовали несколько внешних компаний. Например, крупная e-com сеть тестирует YandexART для создания уникального дизайна подарочных карт. Клиенты сети смогут ввести текстовый запрос и самостоятельно выбрать собственное оформление для карты. Теперь на облачной платформе Yandex Cloud с помощью YandexART компании смогут создавать визуалы для рекламы и социальных сетей, дизайн-макеты, иллюстрации для диджитала и книг. Нейросеть можно встроить через API в различные сервисы и веб-приложения.
ادامه مطلب ...
2 177
7
Хардкорный курс по математике для тех, кто правда любит математику! Начать с вводных занятий можно здесь, ответив всего на 4 вопроса – Что вас ждет: – Вводный урок от CPO курса – Лекции с преподавателями ВМК МГУ по темам: теория множеств, непрерывность функции, основные формулы комбинаторики, матрицы и операции над ними, градиентный спуск – Практические задания для закрепления материала и ссылки на дополнительные материалы. ⚡️ Переходите и начинайте учиться уже сегодня –
ادامه مطلب ...
2 152
8
1 510
3
🧑‍💻 Обучение GPT-2 на языке C Андрей Карпаты в от соцсетей времени зря не терял — на днях он реализацию языковой модели целиком на C. Хватило ему примерно тысячи строк. Хотели когда-нибудь обучить LLM на чистом C без 245MB PyTorch и 107MB cPython? Не хотели? Ну, вы всё равно можете! В общем, все желающие могут ознакомиться с кодом по 👈
2 133
35
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи Напоминаем, что у нас есть бесплатный для всех, кто хочет научиться интересно писать — о программировании и в целом. Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций. Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах. 👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
ادامه مطلب ...
2 229
6
2 045
22
⚛️ Квантовое машинное обучение: курсы и материалы 🖥️ Курс от сообщества ODS. Содержит лекции разных уровней сложности и глубины. Все объяснения подкрепляются кодом. 🖥️ Развенчивает популярные представления о том, что такое квантовый компьютер. 🖥️ Объясняет основные понятия из этой сферы. Автор постепенно добавляет в руководство больше контента. 🖥️ Нужно зарегистрироваться, чтобы получить доступ ко всем видео-лекциям и конспектам. 🖥️ Англоязычная версия вводного курса по квантовым вычислениям. 🖥️ Здесь лежат конспекты лекций о квантовых алгоритмах и квантовому машинному обучению.
ادامه مطلب ...
2 357
111
🤖 Матричные вычисления, лежащие в основе Transformers Автор YouTube-канала StatQuest with Josh Starmer Джош Стармер опубликовал новое отличное видео, объясняющее матричные вычисления, на базе которых строится одна из самых известных архитектур нейросетей. Джош пошагово, подробно и на примерах рассказывает про эмбеддинги слов (их векторные представления), позиционное кодирование, матрицы Q, K и V. 🔗
The matrix math behind transformer neural networks, one step at a time!!!
Transformers, the neural network architecture behind ChatGPT, do a lot of math. However, this math can be done quickly using matrix math because GPUs are optimized for it. Matrix math is also used when we code neural networks, so learning how ChatGPT does it will help you code your own. Thus, in this video, we go through the math one step at a time and explain what each step does so that you can use it on your own with confidence. NOTE: This StatQuest assumes that you are already familiar with: Transformers: https://youtu.be/zxQyTK8quyY The essential matrix algebra for neural networks: https://youtu.be/bQ5BoolX9Ag If you'd like to support StatQuest, please consider... Patreon: https://www.patreon.com/statquest ...or... YouTube Membership: https://www.youtube.com/channel/UCtYLUTtgS3k1Fg4y5tAhLbw/join ...buying my book, a study guide, a t-shirt or hoodie, or a song from the StatQuest store... https://statquest.org/statquest-store/ ...or just donating to StatQuest! paypal: https://www.paypal.me/statquest venmo: @JoshStarmer Lastly, if you want to keep up with me as I research and create new StatQuests, follow me on twitter: https://twitter.com/joshuastarmer 0:00 Awesome song and introduction 1:43 Word Embedding 3:37 Position Encoding 4:28 Self Attention 12:09 Residual Connections 13:08 Decoder Word Embedding and Position Encoding 15:33 Masked Self Attention 20:18 Encoder-Decoder Attention 21:31 Fully Connected Layer 22:16 SoftMax #StatQuest #Transformer #ChatGPT
2 363
68
😿 Том был первым, кто потерял работу из-за ИИ

ssstwitter.com_1712379530790.mp4

2 661
55
🐼 Pandas: от хаоса к красоте кода Работа с pandas.DataFrame может превратиться в неловкую кучу старого (не очень) доброго спагетти-кода. Автор делится своим опытом и рассказывает, какие практики старается соблюдать. ❌ Этого не стоит делать: ▫️не изменяйте DataFrame слишком сильно внутри функций; ◽не пишите методы, которые изменяют DataFrame и не возвращают его. ✅ Этого стоит придерживаться: ◽создавайте новые объекты вместо того, чтобы изменять исходный DataFrame, и не забывайте делать глубокую копию, когда это необходимо; ◽выполняйте только операции аналогичного уровня внутри одной функции; ◽разрабатывайте функции с учётом возможности переиспользования; ◽тестируйте свои функции. 🔗
ادامه مطلب ...
2 465
32
🧠 Сколько времени нужно, чтобы «успокоить» ум? Своими наблюдениями делится один из самых известных специалистов по искусственному интеллекту, сооснователь OpenAI Андрей Карпаты. Возвращаюсь после экспериментального двухнедельного детокса от интернета. Основной вывод заключается в том, что я не осознавал, насколько неспокойным может стать ум при перенасыщении проблемами/информацией (как взболтанная жидкость), и примерно двух недель достаточно, чтобы перейти в гораздо более спокойное состояние. Меня поразило, как перенасыщенный мозг автоматически выталкивает на поверхность сознания проблемы, создавая состояние постоянной тревоги и нервозности. После некоторого времени в устоявшемся состоянии эта активность просто... прекращается. Вы можете сидеть, и ваш мозг не переходит сразу в режим решения проблем, он просто остаётся в тишине. Ничего не происходит. Я уверен, это может показаться многим странным, но я думаю, что очень давно не был в таком подмножестве пространства состояний «динамики мозга», и приятно знать, что 1) это состояние существует, и 2) его можно посетить, если хочешь, но путь туда занимает несколько недель.
ادامه مطلب ...
2 454
35
⛏️ Экспериментируйте с нейросетью прямо в браузере У TensorFlow есть песочница, в которой можно настраивать нейронную сеть и сразу смотреть на результат своих изменений. Можно выбрать количество слоёв, размер батча, уровень шума в данных, преобразования входных данных, даже вручную прописать веса — и увидеть, что меняется. Полезно для понимания того, как это всё устроено. 🔗
2 996
107
👾 LLM сразились между собой в турнире по Street Fighter III Разработчики придумали LLM Colosseum, который предлагает совершенно новый способ оценки больших языковых моделей (LLM). Воспользоваться им может каждый желающий — исходный код открыт. 😎 На прикреплённом к посту видео сражаются модели OpenAI и Mistral. В это битве победителем вышла Mistral. Но как это работает? Все действия персонажей определяются решениями LLM в режиме реального времени. Моделям отправляют текстовое описание происходящего на экране и спрашивают, каким должен быть следующий шаг. При этом, как показала практика, чтобы победить в Street Fighter III, для LLM важна скорость. Поэтому более маленькие модели выигрывают чаще, чем более крупные. На данный момент первое место в рейтинге занимает gpt-3.5-turbo-0125. За ней следуют mistral-small-latest и gpt-4-1106-preview.
ادامه مطلب ...

ssstwitter.com_1712395202997.mp4

2 443
19
🤖👾 Как злоумышленники взламывают LLM: 7 ключевых стратегий Чат-боты на основе ИИ все чаще становятся мишенью для хакеров. Какие уязвимости позволяют злоумышленникам взламывать ИИ-системы и как защитить свои приложения от атак? Рассказываем о 7 ключевых стратегиях. 👉 👉
1 860
15
Свежий материалов по ИИ, Data Science и машинному обучению ▪️ SMOTE используется для решения проблемы несбалансированности классов в обучающих данных. ▪️ Propensity Score Matching (PSM) — это статистический метод, позволяющий оценить эффект вмешательства, сравнивая группы с похожим распределением ключевых характеристик, за исключением самого вмешательства. ▪️ Очень подробная статья с формулами и кодом. ▪️ ML-разработчик из команды YandexGPT разобрал задачу ускорения инференса больших языковых моделей. ▪️ Эндрю Ын рассказывает о том, что будет дальше с ИИ-агентами.
ادامه مطلب ...
2 292
33
🐍 Хэш-карты: незаменимый инструмент для Python-разработчика Хэш-карты представляют собой одну из наиболее распространенных реализаций хэширования. Они хранят пары ключ-значение в списке, доступ к которому осуществляется через его индекс. О том, как работать с хэш-картами в Python, читайте в нашей новой статье. 🔗 🔗
1 949
20
💬 У нас есть вопрос Расскажите, пожалуйста, на какие статьи вы переходили или какие последние ссылки открывали из Telegram? Речь идёт не только о наших статьях и ссылках, а о любых. 👇 Пишите ответы в комментариях в стиле «был пост со статьёй такой-то, я её открыл и почитал». Будем благодарны обратной связи!
2 251
1
erid: LjN8KCB72 Х5 Tech Talk: Наводим порядок в данных X5 Tech совместно с сообществом dbt & modern data stack проводят встречу, на которой эксперты по работе с данными обсудят успешный опыт внедрения открытых каталогов данных на базе OpenMetadata и DataHub. ➡️ Для слушателей выступят: Анатолий Шулика, руководитель продукта "Портал по работе с данными", X5 Tech Ринат Абдурахманов, руководитель департамента data governance, Beeline Григорий Ильяшенко, Tele2 Появление каталога данных в компании и развитие востребованного сервиса, а также путь от таблиц до моделей машинного обучения моделей - все это обсудят в режиме онлайн. 11 апреля, 19:00 🌐 Подробности и регистрация – __ Реклама. ООО "Корпоративный центр ИКС 5", ИНН: 7728632689
ادامه مطلب ...
2 727
12
📊 Периодическая таблица методов визуализации Забавная версия таблицы Менделеева, в которой собраны разные методы визуализации данных и концептов. Помогает освежить всё в памяти. 🔗
2 457
52
👀 Amazon провалила ИИ-проект с автоматизированными магазинами Компания от Just Walk Out в своих магазинах Amazon Go. Предполагалось, что технология будет автоматизировать работу касс с помощью компьютерного зрения. Однако, как оказалось, работает она плохо. 👉 По задумке, Just Walk Out должна была позволять покупателю взять любые товары и уйти из магазина, не проведя их через кассу. Amazon хотела, чтобы ИИ-система через камеры отслеживала, что забрали клиенты, и списывала деньги с них позже. Журналисты выяснили, что на проект Amazon работали более 1000 человек из Индии, которые вручную размечали видео для обучения моделей, а также перепроверяли их результаты. И если ручная разметка — это нормальное явление, то постоянная перепроверка оказалась слишком накладной и свела преимущества технологии на нет. 🤔 Теперь Amazon перейдёт на более разумный формат работы: в магазинах будут использоваться тележки со встроенными экранами и сканерами для оплаты.
ادامه مطلب ...
2 868
19
👾 Карточки по мотивам наших вопросов с собеседований DS Наш подписчик сделал колоду карточек ANKI из пар вопрос-ответ, опубликованных в канале . Всего в наборе 203 карточки. Чтобы смотреть их в удобной форме, нужно: ▪️Завести аккаунт на ; ▪️ десктопное приложение ANKI; ▪️ карточки; ▪️Открыть их в приложении. ❤️ Если вы тоже делали карточки, шпаргалки или инструкции по нашим материалам, то обязательно присылайте
3 367
105
У Яндекс Практикума есть бесплатный курс по основам анализа данных. В нём забавный интерактивный сюжет и много практики: четыре реальных кейса из разных областей. Вам предстоит: — выяснить причину массовой поломки гаджетов, — проверить окупаемость рекламы мобильного приложения, — выбрать стратегию развития ИИ-стартапа, — оценить эффективность роботов в службе поддержки. На курсе вы напишете первый код на Python и поймёте, чем занимаются специалисты в сфере. Приходите учиться бесплатно.
1 679
33
🔥 Язык для машинного обучения Mojo стал открытым Создатели Mojo , что теперь проект опенсорсный, и каждый может внести свой вклад в разработку. 👀 Помимо предоставления исходного кода, команда также открыла историю изменений стандартной библиотеки, выпустила ночные сборки компилятора Mojo, предоставила публичную систему непрерывной интеграции и разрешила пулл-реквесты на GitHub. 🔗
Modular: The Next Big Step in Mojo🔥 Open Source
We are building a next-generation AI developer platform for the world. Check out our latest post: The Next Big Step in Mojo🔥 Open Source
2 685
30
💬 Как изменился ваш информационный пузырь за год? Помните свои информационные предпочтения год назад? Многое изменилось! Социальные сети, мессенджеры, YouTube, подкасты — все эти каналы ежедневно борются за наше внимание. У каждого из нас за год сформировался свой уникальный информационный рацион. Пройдите наш опрос и расскажите, как изменились ваши вкусы в медиапотреблении. 👉 Опрос займёт у вас примерно 4 минуты.
2 621
2
Оффер в компанию будущего можно получить за день. Попробуй свои силы на OneDayOffer от SberAutoTech 20 апреля! Мы ищем системных аналитиков и разработчиков C++, которые не боятся сложных задач. Оставь заявку, выполни тестовое задание и получи приглашение на мероприятие. За один день ты успеешь познакомиться с командами разработки, пройти собеседования и получить фидбек. Если всё сложится, уже вечером мы предложим тебе место в команде. Работать в SberAutoTech — значит создавать новое. Мы развиваем технологию автономного вождения, совместимую с разными транспортными средствами. Тебя ждут интересные и необычные проекты, возможности для профессионального развития, и, участия в конференциях. Узнай больше
ادامه مطلب ...
1 619
8
💩 Подборка полезных команд для работы в Jupyter-ноутбуках 💩ИИ-помощник в ноутбук — Jupyter AI Точно работает в JupyterLab. Сначала нужно установить расширение:
pip install 'jupyter-ai>=1.0,<2.0' # если вы используете JupyterLab 3
pip install jupyter-ai             # если вы используете JupyterLab 4
Затем следует установить переменную окружения с API-ключом OpenAI:
%env OPENAI_API_KEY=ваш_ключ
В конце концов можно вставить следующий код:
%reload_ext jupyter_ai
%%ai chatgpt
generate a function for sum of two numbers
💩Красивый вывод LaTeX формул
%%latex
$$c = \sqrt{a^2 + b^2}$$
💩Выполнение SQL-запросов Эта магическая команда становится доступной после установки и настройки расширения ipython-sql. Вот последовательность команд:
pip install ipython-sql
%load_ext sql
%sql postgresql://username:password@hostname:port/database_name
%sql SELECT * FROM my_table LIMIT 5;
💩Запуск Python-файлов прямо в ноутбуке
%run hello.py
💩Запись содержимого ячейки в Python-файл
%%writefile app.py

def sum_of_numbers(a, b):
    return a + b

c = sum_of_numbers(3, 2)
print(c)
ادامه مطلب ...
2 550
77
🔥 Вышел, вероятно, один из лучших роликов с объяснением Transformers На отличном канале 3Blue1Brown опубликовали очередное видео из серии про глубокое обучение. На этот раз авторы отвечают на вопрос «Что такое GPT» и дают визуальное введение в Transformers. 👍 Рекомендуем к просмотру. Канал 3Blue1Brown ещё ни разу не подводил. 🔗
But what is a GPT? Visual intro to Transformers | Deep learning, chapter 5
An introduction to transformers and their prerequisites Early view of the next chapter for patrons: https://3b1b.co/early-attention Other recommended resources on the topic. Richard Turner's introduction is one of the best starting places: https://arxiv.org/pdf/2304.10557.pdf Coding a GPT with Andrej Karpathy https://youtu.be/kCc8FmEb1nY Introduction to self-attention by John Hewitt https://web.stanford.edu/class/cs224n/readings/cs224n-self-attention-transformers-2023_draft.pdf History of language models by Brit Cruise: https://youtu.be/OFS90-FX6pg ------------------ Timestamps 0:00 - Predict, sample, repeat 3:03 - Inside a transformer 6:36 - Chapter layout 7:20 - The premise of Deep Learning 12:27 - Word embeddings 18:25 - Embeddings beyond words 20:22 - Unembedding 22:22 - Softmax with temperature 26:03 - Up next ------------------ These animations are largely made using a custom Python library, manim. See the FAQ comments here: https://3b1b.co/faq#manim https://github.com/3b1b/manim https://github.com/ManimCommunity/manim/ All code for specific videos is visible here: https://github.com/3b1b/videos/ The music is by Vincent Rubinetti. https://www.vincentrubinetti.com https://vincerubinetti.bandcamp.com/album/the-music-of-3blue1brown https://open.spotify.com/album/1dVyjwS8FBqXhRunaG5W5u ------------------ 3blue1brown is a channel about animating math, in all senses of the word animate. If you're reading the bottom of a video description, I'm guessing you're more interested than the average viewer in lessons here. It would mean a lot to me if you chose to stay up to date on new ones, either by subscribing here on YouTube or otherwise following on whichever platform below you check most regularly. Mailing list: https://3blue1brown.substack.com Twitter: https://twitter.com/3blue1brown Instagram: https://www.instagram.com/3blue1brown Reddit: https://www.reddit.com/r/3blue1brown Facebook: https://www.facebook.com/3blue1brown Patreon: https://patreon.com/3blue1brown Website: https://www.3blue1brown.com
2 785
95
😪 Это должно было быть первоапрельской шуткой...
2 098
20
Last updated: ۱۱.۰۷.۲۳
Privacy Policy Telemetrio