Статьи

Создание собственных трансформаторов с помощью Scikit-Learn
В этой статье обсуждаются два метода создания настраиваемых преобразователей с помощью Scikit-Learn и их реализация с помощью Pipeline и GridSearchCV. Трансформаторы - это классы, которые позволяют преобразовывать данные при предварительной обработке данных для машинного обучения. Примерами трансформаторов в Scikit-Learn являются SimpleImputer, MinMaxScaler, OrdinalEncoder, PowerTransformer и многие другие. Иногда нам может потребоваться выполнить преобразования данных, которые не..

Приложения, интенсивно использующие данные — Хранение и извлечение
Введение Добро пожаловать в мою третью статью из серии Приложения, интенсивно использующие данные . В этой статье мы получим общий обзор различных типов систем хранения, что они делают под капотом, какие структуры данных они используют, как выбрать правильную и в нашей ситуации. Эта статья вдохновлена ​​одной из лучших книг по инженерии данных: Designing Data Intensive Applications Мартина Клеппманна.

«Творчество против ИИ: почему у людей все еще есть преимущество»
Поскольку искусственный интеллект (ИИ) продолжает быстро развиваться и проникать во все сферы нашей жизни, возникает много вопросов о том, что люди будут делать в будущем в работе и творчестве. В то время как некоторые опасаются, что ИИ заменит человеческое творчество, другие утверждают, что он никогда не сможет по-настоящему воспроизвести человеческое воображение и его способность к инновациям. В этой статье мы рассмотрим, почему ИИ терпит неудачу, когда дело доходит до замены..

NeuroEvolution of Augmenting Topologies (NEAT): инновационная эволюция архитектуры нейронных сетей
Введение Нейронные сети произвели революцию в области искусственного интеллекта, позволив машинам учиться на данных и выполнять задачи, которые когда-то считались выше их возможностей. По мере роста спроса на более эффективные и действенные архитектуры нейронных сетей исследователи постоянно изучают инновационные методы оптимизации и развития этих архитектур. Одним из таких новаторских подходов является NeuroEvolution of Augmenting Topologies (NEAT), метод, который сочетает в себе..

О развертывании машинного обучения
Сегодня мы обсудим проблемы развертывания алгоритмов машинного обучения. По данным Forbes [1], примерно 9 из 10 алгоритмов машинного обучения не могут быть запущены в производство. Это означает, что примерно 9 из 10 долларов США, потраченных на науку о данных, не возвращаются! Назовем это «Производственной Долиной Смерти». Машинное обучение сложно, но развертывание алгоритмов машинного обучения еще сложнее. Давайте рассмотрим основные препятствия, с которыми сталкиваются инженеры по..

И вы можете спросить себя: «Ну… Как я сюда попал?»
Ну, на самом деле я никогда не жил в «лачуге с дробовиком», но я жил в некоторых запущенных местах — я люблю старые города и множество заплесневелых скрипучих мест, которые я называл своим домом. Я оказался в другой части мира, работая и путешествуя. До этого я действительно оказался за рулем большого автомобиля — развозного грузовика. Кроме того, когда я доехал до того места, где я сейчас нахожусь, я оказался в красивом доме (крошечная квартирка в Чикаго) с моей красивой (не в..

Amazon рассматривает анализ настроений с использованием НЛП
Amazon рассматривает анализ настроений с использованием НЛП и создание механизма классификации настроений с использованием наивного Байеса Понимание бизнеса С растущей тенденцией к оцифровке и преобладанием мобильных телефонов и доступа в Интернет все больше потребителей присутствуют в Интернете, и их мнение имеет большое значение для любой компании, основанной на продуктах, особенно для предприятий B2C. Отрасли пытаются точно настроить свои стратегии в соответствии с потребностями..

Как установить Hadoop на MacBook M1 или M2 без Homebrew или виртуальной машины
В этой статье я проведу вас через простую установку Hadoop на ваш локальный MacBook M1 или M2. Я буду использовать MacBook Air M1 (arm64) 2020 года с 8 ГБ памяти и MacOS Ventura 13.2.1. Давайте начнем! Прежде чем мы начнем, я уверен, что вы уже знакомы с основной терминологией экосистемы Hadoop. Кроме того, подтвердите, что ваш MacBook M1 или M2 соответствует следующим характеристикам: MacBook M1 или M2 с MacOS Ventura 13.2.1 или выше. Не менее 8 ГБ памяти (ОЗУ) для обеспечения..

Чистые функции JavaScript
В JavaScript чистые функции — это функции, которые производят одни и те же выходные данные для одних и тех же входных данных, не вызывая побочных эффектов и не изменяя какое-либо внешнее состояние. Они работают исключительно на основе своих входных параметров и возвращают новое значение без изменения исходного ввода или каких-либо других переменных вне области действия функции. Чистые функции предсказуемы, их можно использовать повторно, их легче тестировать и анализировать...

Запуск конвейера Bitbucket при изменении S3
Небольшое руководство, которое поможет вам закончить быстрее Bitbucket Pipelines упростила и упростила создание конвейеров CI/CD. Используя Bitbucket, вы можете либо запланировать свои конвейеры, либо выбрать определенные ветки, которые должны запускать конвейеры, как только будут обнаружены какие-либо изменения кода. Для недавнего проекта мне нужно было запускать конвейер битбакета каждый раз, когда в определенной папке моей корзины AWS S3 появлялся новый файл. Это было проще, чем..

Обнаружение объектов FastAI применительно к периапикальным рентгеновским снимкам зубов
Самое главное Эта работа была сильно вдохновлена ​​ отличной статьей Клемента Жуде на Medium о подобном приложении. Краткосрочной целью моей работы было применение системы обнаружения объектов в моей специальности стоматологии. Невероятные инструменты, предоставляемые FastAI, позволили мне сделать это всего за несколько недель заочного обучения. Введение Машинное обучение может радикально изменить рабочие процессы диагностики и планирования лечения в здравоохранении. В тех..

Оптимизация индексов MySQL: улучшение порядка по производительности
Порядок Mysql путем оптимизации Этот пост в блоге продолжает обсуждение оптимизации индексов MySQL. Если вы не читали предыдущую статью Оптимизация индекса MySQL (часть 1) , я предлагаю вам сделать это, прежде чем переходить к этой. Основное внимание в этом сообщении блога уделяется обсуждению принципов, лежащих в основе функциональности Order By в MySQL. Примечание. Все тесты, упомянутые ниже, были проведены MySQL 5.7 . Результаты могут отличаться при использовании MySQL 8 ...

Поток управления JavaScript и обработка ошибок
JavaScript Поток управления и обработка ошибок JavaScript Поток управления: JavaScript включает в себя множество управляющих структур, таких как цикл и функция. если (поле==пусто) { подсказкаПользователю(); } еще { представить форму(); } если (поле==пусто) { подсказкаПользователю(); } еще { представить форму(); } Если пользователь нажимает кнопку отправки, вызывается функция. Функция также может быть циклом. Это позволяет выполнять код, когда..

Общие состязательные сети (GANS)
Вамши Кумар Богоджу Теперь, когда мы заложили фундамент компьютерного зрения и немного объяснили основы семантической сегментации , эта статья призвана предоставить очень высокоуровневое введение в генеративно-состязательные сети (GAN) с привкусом математических модных словечек и глубоких рассуждений. теория. Если вы читали или слышали о каких-либо статьях, связанных с поддельными лицами, мы должны поблагодарить за это GANS! Здесь мы будем: - наметить две модели,..

Визуализация частоты слов в текстовых файлах с помощью Golang
Вам когда-нибудь приходилось анализировать частоту слов в текстовом файле и визуализировать результаты? В этой статье мы познакомим вас с простой программой Golang, которая считывает CSV-файл, содержащий текст, подсчитывает частоту отдельных слов, а затем отображает цветную гистограмму для визуализации результатов. Мы также будем использовать управляющие коды ANSI, чтобы вывести цвета на вывод терминала. Подсчет слов в CSV-файле Первым шагом в нашей программе является чтение файла..

Программирование может завести вас в темные места
Вы готовы к этому? Если вы программист, вы уже знаете, что я имею в виду. Если вы только начинаете свое путешествие или думаете о том, чтобы начать, пристегнитесь. Вот некоторая неприкрашенная правда. Одна из огромных привилегий быть программистом заключается в том, что бывают дни, когда мы смотрим на то, что мы создали, и наше сердце поет! Элегантность, фрактальная простота, это может быть прекрасно. Дизайн и реализация, которые успокаивают ум. Это хорошие дни. Большинство дней..

Рост разработки с низким кодом: есть ли будущее разработки программного обеспечения?
Рост разработки с низким кодом: есть ли будущее разработки программного обеспечения? За последние несколько лет концепция разработки с низким кодом набирает обороты в индустрии программного обеспечения. Но что такое low-code разработка и действительно ли за ней будущее разработки программного обеспечения? Согласно Gartner, разработка с низким кодом относится к использованию графических пользовательских интерфейсов, предварительно созданных шаблонов и функций перетаскивания для создания..

Размышляя о своем опыте участия в выставке Indaba 2023
Уважаемые читатели, Сегодня я хочу поделиться с вами очень личным размышлением. Обычно это не выходит за рамки моих собственных мыслей, но меня вдохновили удивительные истории, с которыми я недавно столкнулся. Возможно, просто возможно, мой опыт сможет вдохновить кого-то другого, а для меня он может послужить формой размышлений, когда я оглянусь на него в будущем. На прошлой неделе мне выпала честь присутствовать на Индабе , ежегодном собрании африканского сообщества машинного..

Как стать инженером по машинному обучению
Машинное обучение было одной из самых популярных областей информатики в последнее десятилетие. Это область искусственного интеллекта, которая включает разработку алгоритмов и статистических моделей, которые позволяют компьютерам учиться на данных без явного программирования. В настоящее время эта область переживает бум с многочисленными приложениями в различных отраслях, от финансов до здравоохранения, электронной коммерции и развлечений. Если вы заинтересованы в том, чтобы начать..

Массивы в Java
Массив — это структура данных, используемая для хранения набора переменных (элементов) одного типа. Элементы массива хранятся в непрерывной области памяти. Где к каждому элементу данных можно получить доступ по его порядковому номеру. Массив в Java основан на индексах, первый элемент массива хранится в 0 -м индексе, 2-й элемент хранится в 1 -м индексе и так далее. Зачем нам нужны массивы? Массивы используются для хранения нескольких значений в одной переменной вместо..