Статьи по теме data-science

Публикации по теме 'data-science'

Вероятность машинного обучения

Как вероятность используется в машинном обучении? 1. Введение В этом посте мы пройдемся по строительным блокам теории вероятностей и используем эти знания для мотивации фундаментальных идей в машинном обучении. В первом разделе мы поговорим о случайных величинах и о том, как они помогают количественно оценивать эксперименты в реальном мире. Следующий раздел перейдет к функциям распределения вероятностей. В последнем разделе будет рассказано о том, как эти математические концепции..

Что нового в данных: re:invent Andy Jassy Keynote

В этом году другой опыт. Чат с моими товарищами по команде представляет собой смесь обсуждения новых функций и фотографий хорошего времяпрепровождения в Вегасе с предыдущих конференций re:Invent. Энди Ясси закончил первое выступление 2020 года, и я не был разочарован. Множество замечательных новых функций, для которых у нас есть варианты использования. Вот мои любимые функции, связанные с данными, о которых было объявлено во время выступления Энди Джасси re:Invent. Склеивание..

Прогнозирование цены закрытия валютного курса

Введение: использование алгоритма для прогнозирования обмена В сегодняшнем взаимосвязанном мире обменные курсы играют ключевую роль в глобальной экономике, в равной степени затрагивая бизнес, инвесторов и путешественников. Способность точно предсказывать движение обменного курса может означать разницу между финансовым успехом и неожиданными потерями. Это проблема, которая десятилетиями занимала умы экономистов, специалистов по обработке данных и финансовых энтузиастов. Я..

Прекратите использовать диаграмму локтя, чтобы найти лучшее значение K, и используйте ее вместо этого

K-Means — один из наиболее важных алгоритмов кластеризации, который обычно используется учеными-данными и специалистами по машинному обучению в задачах обучения без учителя. Одним из параметров этого алгоритма, с которым нужно обращаться осторожно, является количество кластеров K. Наиболее популярным методом нахождения оптимального значения K является локтевая диаграмма, однако это не самый эффективный метод для этого. В этой статье мы рассмотрим более эффективные методы поиска оптимального..

Как кластеризовать данные!

Руководство по использованию неконтролируемого машинного обучения с кластеризацией K-средних При работе над проектами по науке о данных ученые часто сталкиваются с наборами данных, которые имеют немаркированные точки данных. Это затрудняет получение проницательных знаний, которые можно использовать для моделирования поведения данных. Чтобы разобраться в бессмысленных данных, используются неконтролируемые методы машинного обучения для маркировки точек данных, а также для обеспечения..

Понимание байесовского вывода для машинного обучения

Введение: Машинное обучение произвело революцию в области науки о данных, позволив нам создавать прогностические модели, способные учиться на данных и делать точные прогнозы. Однако создавать модели машинного обучения непросто, и необходимо преодолеть множество проблем. Одной из ключевых проблем является неопределенность, которая возникает, когда мы делаем прогнозы на основе неполных или зашумленных данных. В этом сообщении блога мы рассмотрим, как байесовский вывод может помочь нам..

Градиентный спуск, четко объясненный в Python, часть 2: привлекательный код.

Примечание : это продолжение моей предыдущей статьи, посвященной теоретической стороне градиентного спуска. Если вы хотите в этом убедиться, перейдите по этой ссылке . Если вы не очень разбираетесь в теории, вы можете сразу перейти к ней! Градиентный спуск имеет фундаментальное значение для науки о данных, будь то глубокое обучение или машинное обучение. Глубокое понимание принципов градиентного спуска, безусловно, поможет вам в вашей будущей работе. Вместо того, чтобы играться..