Поиск сообщества

Показаны результаты для тегов 'pазработчик'.

  • Поиск по тегам

    Введите теги через запятую.
  • Поиск по автору

Тип контента


Форумы

  • Авторы и издательства
    • GeekBrains
    • Like-Центр (Аяз Шабутдинов)
    • OTUS
    • ХАКЕР
    • Нетология
    • Lynda
    • Convert Monster
    • Бизнес Молодость
    • WebForMyself
    • Udemy
    • Андрей Парабеллум
    • Skillbox
    • Наталья Закхайм
    • Роман Пузат
    • SalesHub
    • Радислав Гандапас
    • Андрей Захарян
    • Лилия Нилова
  • Инфопродукты и другие приватные материалы
    • Бизнес, финансы, схемы заработка
    • Арбитраж трафика | Товарка
    • SMM - все по работе с соц.сетями
    • SEO-оптимизация
    • Сайтостроение
    • Фото и Видео
    • Графика и Дизайн
    • Программирование и Администрирование
    • Копирайтинг
    • Психология
    • Саморазвитие, познание себя
    • Соблазнения | Пикап | Знакомства
    • Иностранные языки
    • Разное
    • Библиотека
    • Программы и скрипты
    • Базы данных
    • Ищу контент
  • Площадка статей и обсуждений
    • BlackRussia Geek (статьи, обзоры, обсуждения)
    • Флудильня | Оффтоп
    • Раздачи | Конкурсы
  • Рынок
    • Рыночная площадь
    • Работа / Вакансии
  • Технический раздел Black Russia
    • FAQ / Правила
    • Новости проекта
    • Вопрос / Ответ (Тех. поддержка)

Блоги

Без результатов

Без результатов

Категории

  • Авторы и издательства
    • GeekBrains
    • Like-Центр (Аяз Шабутдинов)
    • OTUS
    • ХАКЕР
    • Нетология
    • Lynda
    • Convert Monster
    • Бизнес Молодость
    • WebForMyself
    • Udemy
    • Андрей Парабеллум
    • Skillbox
    • Наталья Закхайм
    • Роман Пузат
    • SalesHub
    • Радислав Гандапас
    • Андрей Захарян
    • Лилия Нилова
  • Инфопродукты и другие приватные материалы
    • Бизнес, финансы, схемы заработка
    • Арбитраж трафика | Товарка
    • SMM - все по работе с соц.сетями
    • SEO-оптимизация
    • Сайтостроение
    • Фото и Видео
    • Графика и Дизайн
    • Программирование и Администрирование
    • Копирайтинг
    • Психология
    • Саморазвитие, познание себя
    • Соблазнения | Пикап | Знакомства
    • Иностранные языки
    • Разное
    • Библиотека
    • Программы и скрипты
    • Базы данных

Поиск результатов в...

Поиск результатов, которые содержат...


Дата создания

  • Начало

    Конец


Дата обновления

  • Начало

    Конец


Фильтр по количеству...

Регистрация

  • Начало

    Конец


Группа


Обо мне

Найдено: 3 результата

  1. Программа курса:Первый модульДля разработки в области анализа данных необходимо понимать, как устроены основные алгоритмы, какая у них сложность и скорость работы, сколько требуется ресурсов для их успешной работы, область применимости.В первом модуле программы разбираются все базовые алгоритмы машинного обучения. Изучение проходит на сгенерированных данных, не требующих времени на преобразование и доработку. Разъясняется значение и влияние параметров алгоритмов на результат. Каждый этап обучения сопровождается наглядной визуализацией.Будут рассмотрены алгоритмы: линейная регрессия, логистическая регрессия, деревья решений, knn, SVM, k-means, EM, иерархическая кластеризация, DBScanВ результате слушатели уверенно освоят базовые алгоритмы анализа данных и инструменты для базового анализа данных на PythonЗанятие 1: Базовые инструменты анализа данных в Python. Подготовка к курсу. Git, окружение Python. Обзор курса.Введение в Python, Numpy, Pandas, Sklearn. API Sklearn.Что такое DS, ML, классы решаемых задач.ДЗРеализация библиотеки. Реализация библиотеки для подсчета статистик и преобразования датасетов в формате csv. Отработка инструментов для преобразования данных в pandas и sklearn.Занятие 2: Вводная в математические операции. Интеграл, производная, их свойства, вероятность, плотность вероятности, мат.ожидание, дисперсия, ковариация, матричные вычисления, определитель, обратная матрица и т.п.Занятие 3: Визуализация Визуализация на matplotlib, seaborn, plotlyДЗПостроение визуализаций по даннымЗанятие 4: Линейная регрессия Математика линейной регрессии. Проблема многомерных пространств и переобучения на примере регрессии. Проблема разреженных данных. Регуляризация.Простая линейная регрессия на Python. Оценка качества регресcии. Проверка точности модели: обучающая и тестовая выборки. Обучающая и тестовая выборка, кросс-валидация.Занятие 5: Логистическая регрессия Математика логистической регрессии. Мультиклассовая регрессия. Оценка качества логистической регрессии.Теория вероятностей: условные вероятности, теорема Байеса.Обучение регрессии, градиентный спуск. Регуляризация: L1, L2.ДЗРеализация алгоритма логистической регрессии. Реализация алгоритма логистической регрессии на простых данных. Оценка качества, подбор параметров модели.Занятие 6: KNN, наивный байес Метрики и расстояния между объектами: евклидова и другие.Обучение модели kNN. Ограничения.Метрики качества: accuracy, precision, recall, др.Алгоритм наивного байеса. Байесовский классификатор, Принцип Maximum A-PosterioriЗанятие 7: kMeans, EM Обучение без учителя. Алгоритмы кластеризации, области применения. k-means. Оценка качества обучения, ограничения и подбор алгоритма для задачи.Байесов подход к вероятности. Алгоритмы с lower-bound. Em алгоритм.ДЗРеализация EM-алгоритма. Реализация EM-алгоритма на простых данных. Оценка качества кластеризации.Занятие 8: Иерархическая кластеризация, DB-Scan Иерархическая кластеризация, DB-Scan. Optics. Спектральная кластеризация.Занятие 9: Feature engineering Feature engineering. Статистический анализ данных, выбор фич на основе корреляции.ДЗПреобразование набора данных и подбор фич.Занятие 10: Поиск выбросов в данных
  2. Программа курса:Чаще всего в окружении, в котором приходится работать, данные не готовы для анализа, у них произвольный формат и много ошибок. Например, это данные из баз знаний, открытых API, данные из различных информационных систем партнеров.В третьем модуле рассматриваются вопросы сбора и очистки данных, разбираются типичные задачи бизнеса. Например, это предсказание ctr, ltv. Дополнительно рассмотрим специальные алгоритмы анализа данных - это работа с временными рядами, рекомендательными системами, текстами, графами.Занятие 19: Рекомендательные системы Типы рекомендательных систем. Векторное пространство (тот же TF-IDF) и content-based модели, повторение стандартных метрик корреляций: Пирсон, косинусная мера, Джаккарт. Offline метрики и метрики ранжирования. Построение простой content-based модели. Item(user)-based CF. Использование CF для implicit feedback. Построение CF модели (item-based или MF)ДЗПрименение алгоритма рекомендаций для датасета фильмов.Занятие 20: Временные ряды Что такое временные ряды и простые модели построения прогнозов. Разложение временного ряда на компоненты: тренд, сезонность, цикл, ошибка. Стационарность ряда. Модели класса AR, MA, ARMA, ARIMA. Построение прогноза на примере данных. Модели ARIFMA. Нелинейные модели, библиотека Prophet от Facebook. Векторные моделиЗанятие 21: Latent Dirichlet Allocation ДЗПрименение LDA для категоризации текстов.Занятие 22: Алгоритмы на графах Социальные сетиЗанятие 23: Нейронные сети, обучение нейронных сетей Основы: перцептрон и синапсы, функция активации, примеры задач. Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.ДЗРеализация алгоритма обратного распространения ошибки и применение простой сети на mnist.Занятие 24: Сверточный слои, каскады, визуализация признаков Сверточный слои, каскады, визуализация признаков. Нормализация и регуляризация: batchnorm, dropout. Архитектуры нейросетей: обзор архитектур AlexNet, ResNet, GoogLenet.
  3. Программа курсаОт сгенерированных данных переходим к данным в табличном виде. Такие данные встречаются в конкурсах по анализу данных, а также могут быть собраны, например, напрямую из баз данных. Для применения алгоритмов машинного обучения обычно такие данные требуют дополнительных преобразований.Во втором модуле рассматриваются задачи преобразования и отбора признаков, вопросы подготовки данных для использования в машинном обучении.Также будут рассмотрены более сложные алгоритмы в анализе данных - понижение размерности, определение выбросов в данных, построение ансамблей моделей.Занятие 11: Уменьшение размерности Principle component analysis, t-sne. Поиск подмножества фич (subset selection).ДЗПрименение снижения размерности для использования в модели.Занятие 12: Методы оптимизации SGD, модификации SGDЗанятие 13: Деревья решений Ограничения и недостатки деревьев решений. Классификация и регрессия с помощью деревьев решений. Выбор оптимального сплита, суррогатный сплит.ДЗРеализация алгоритма дерева решений на простых данных. Реализация некоторых эвристик в деревьях решений.Занятие 14: Ансамбли моделей Случайный лес. Обзор методов ансамблирования: бустинг, бэггинг, стекинг, случайные подпространства.Занятие 15: Бустинг Xgboost, catboost, lightgbm, Стекинг, блендингДЗПрименение бустинга для построения лучшей модели.Занятие 16: SVM, Support vector machine Разделяющая поверхность с максимальным зазором. Формулировка задачи оптимизации для случаев линейно-разделимых и линейно-неразделимых классов. Сопряженная задача. Опорные векторы. SVM для задач классификации и регрессии. Kernel trick. Теорема Мерсера. Примеры функций ядра.Занятие 17: Анализ текстовых данных Сбор данных из открытых источников. Очистка данных, подготовка данных для анализа.Задача обработки текста. Введение, обзор задач, токенизация, лемматизация. Python + sklearn для обработки текстов. Понятие мешка слов, TF.IDF и когда они могут быть нужны, feature selection для NLP.ДЗРеализация процесса сбора данных через API. Преобразование текста, подготовка текста для анализа. Применение машинного обучения для предсказания характеристики в собранных данныхЗанятие 18: Анализ текстовых данных Выделение объектов в тексте (named entity recognition, named entity linking)Неструктурированные данные. Структурированные данные. Сбор текстов (scraping)Word2vec для извлечения похожих слов, sentiment analysis