Публикации по теме 'feature-engineering'


Система мониторинга и оповещения в реальном времени для промышленного оборудования с использованием Python
Введение. Диагностическое обслуживание – это упреждающий подход к обслуживанию, в котором данные и машинное обучение используются для прогнозирования вероятности отказа оборудования и планирования обслуживания до того, как произойдет отказ. Это позволяет значительно сократить время простоя и повысить эффективность и надежность промышленного оборудования. В этом проекте мы разработаем систему профилактического обслуживания промышленного оборудования на основе Python. Описание проекта ...

Итак, какой алгоритм машинного обучения использовать?!
Как специалист по науке о данных, вы, возможно, ломали голову, пытаясь выбрать лучший алгоритм машинного обучения для своего проекта. С таким количеством доступных вариантов процесс может быть ошеломляющим и запутанным. Но не бойтесь, потому что мы здесь, чтобы упростить это для вас. Давайте начнем с ответа на фундаментальный вопрос: что пытается сделать алгоритм машинного обучения? По своей сути любой алгоритм стремится взять набор функций и преобразовать их в полезный прогноз с..

Основное руководство для выполнения группировки функций с использованием модели дерева решений
Как найти оптимальные сегменты для объединения числовых функций Разработка функций - важный компонент конвейера разработки моделей машинного обучения. Модель машинного обучения понимает только числовые векторы, поэтому специалисту по анализу данных необходимо разработать функции для обучения надежной модели машинного обучения. Биннинг или дискретизация используются для кодирования непрерывной или числовой переменной в категориальную переменную. Иногда числовые или непрерывные..

Обнаружение и удаление выбросов с использованием метода Z-оценки
В этом методе предполагается, что столбец, над которым вы работаете, должен быть нормально распределен. 95% населения находится в пределах μ ± 2σ. 99% населения находится в пределах µ ± 3σ. Если какие-либо значения лежат за пределами этих границ μ ± 3σ. Вы можете рассматривать это как выброс. Сначала вы узнаете, нормально ли распределяются данные или нет; если да, то вы найдете диапазон μ ± 3σ. Вы считаете все строки за пределами этого диапазона выбросами. Вам может быть..

Сокращение числа погибших в коммерческой авиации
Обзор Пилот авиакомпании — одна из самых напряженных и изнурительных профессий без надлежащего управления рабочей нагрузкой. Эта проблема очень распространена во всем мире из-за нехватки пилотов авиакомпаний. Пилоты должны заботиться о безопасности тысяч пассажиров, которых они перевозят по всему миру, но из-за стресса и полной усталости мозга они легко теряют внимание и не могут сохранять концентрацию, а последствия этого могут быть фатальными. Это мировая проблема, не специфичная..