Вопросы по теме 'dataframe'

Python: используйте функцию в лямбда-выражении pandas
У меня есть следующий код, пытающийся найти час столбца «Даты» во фрейме данных: print(df['Dates'].head(3)) df['hour'] = df.apply(lambda x: find_hour(x['Dates']), axis=1) def find_hour(self, input): return input[11:13].astype(float) где...
17950 просмотров
schedule 14.03.2024

Сортировать столбец, содержащий строку в Pandas
Я новичок в Pandas и хочу отсортировать столбец, содержащий строки, и сгенерировать числовое значение для однозначной идентификации строки. Мой фрейм данных выглядит примерно так: df = pd.DataFrame({'key': range(8), 'year_week': ['2015_10',...
3090 просмотров

Pandas fillna только в строках с хотя бы 1 значением, отличным от NaN
Предположим, у меня есть DataFrame, построенный следующим образом: import pandas as pd import numpy as np df = pd.DataFrame(data = {"col1":[3, np.nan, np.nan, 21], "col2":[4, np.nan, 12, np.nan],...
918 просмотров
schedule 25.03.2024

Проблема с производительностью, превращающая строки с началом-концом в кадр данных с TimeIndex
У меня есть большой набор данных, где каждая строка представляет значение определенного типа (например, датчик) за временной интервал (между началом и концом). Это выглядит так: start end type value 2015-01-01 2015-01-05 1 3...
145 просмотров
schedule 04.04.2024

Другой результат между concat и np_r при объединении фрагментов кадра данных
Предположим, что это кадр данных import pandas as pd import numpy as np df = pd.DataFrame({'group1' : ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A'], 'group2' : ['A', 'A', 'A', 'A',...
56 просмотров
schedule 10.03.2024

Расширьте кадр данных pandas, включив в него «недостающие» недели
У меня есть фрейм данных pandas, который содержит данные временных рядов, поэтому индекс фрейма данных имеет тип datetime64 с недельными интервалами, каждая дата приходится на понедельник каждой календарной недели. В фрейме данных есть только...
575 просмотров
schedule 05.04.2024

Удаление строк на основе значений в других строках
Я искал способ удалить строки из моего фрейма данных на основе условий, которые нужно проверить со значениями в другой строке. Вот мой кадр данных: product product_id account_status prod-A 100 active prod-A 100 cancelled...
81 просмотров

В dataFrame есть дополнительный столбец идентификатора, считанный из csv
Я создал dataFrame и это вывод: print(train_df) author text 0 BernardHickey The Commmonwealth Bank of Australia (CBA) warn... 1 BernardHickey Rupert Murdoch predicted in a newspaper...
21 просмотров
schedule 23.03.2024

Избегайте перезаписи файлов с помощью цикла for
У меня есть список фреймов данных (df_cleaned), созданных из нескольких CSV-файлов, выбранных пользователем. Моя цель - сохранить каждый фрейм данных в списке df_cleaned как отдельный CSV-файл локально. У меня есть следующий код, который...
463 просмотров
schedule 13.03.2024

Как назначить категорию на основе содержащейся строки
У меня есть данные, как показано ниже: У меня есть справочная таблица, показанная ниже: Я хочу просмотреть «Описание» таблицы данных, чтобы увидеть, содержит ли строка каждое слово в столбце «Ключ» справочной таблицы, если да, я...
129 просмотров
schedule 16.04.2024

Панды обновляют один кадр данных суммой существующих и других значений
В моем фактическом фрейме данных более миллиона строк, но образец мультииндексного фрейма данных выглядит так ( с 1,0 в IN_VALUE для простоты ): # INDEX ID | MATCH IN_VALUE OUT_VALUE # 0 7 | 1 1.0 -0.33 # 8 | 6...
74 просмотров
schedule 20.04.2024

Увеличение значений строки без зацикливания
Мне нужно суммировать столбец, но мне нужно посмотреть, насколько увеличилась каждая строка, чтобы я мог построить последовательность на диаграмме. Я использую цикл, но в большом наборе данных с тысячами строк он очень медленный. Есть ли более...
33 просмотров
schedule 01.04.2024