Вопросы по теме 'dataframe'
Python: используйте функцию в лямбда-выражении pandas
У меня есть следующий код, пытающийся найти час столбца «Даты» во фрейме данных:
print(df['Dates'].head(3))
df['hour'] = df.apply(lambda x: find_hour(x['Dates']), axis=1)
def find_hour(self, input):
return input[11:13].astype(float)
где...
17950 просмотров
schedule
14.03.2024
Сортировать столбец, содержащий строку в Pandas
Я новичок в Pandas и хочу отсортировать столбец, содержащий строки, и сгенерировать числовое значение для однозначной идентификации строки. Мой фрейм данных выглядит примерно так:
df = pd.DataFrame({'key': range(8), 'year_week': ['2015_10',...
3090 просмотров
schedule
22.04.2024
Pandas fillna только в строках с хотя бы 1 значением, отличным от NaN
Предположим, у меня есть DataFrame, построенный следующим образом:
import pandas as pd
import numpy as np
df = pd.DataFrame(data = {"col1":[3, np.nan, np.nan, 21],
"col2":[4, np.nan, 12, np.nan],...
918 просмотров
schedule
25.03.2024
Проблема с производительностью, превращающая строки с началом-концом в кадр данных с TimeIndex
У меня есть большой набор данных, где каждая строка представляет значение определенного типа (например, датчик) за временной интервал (между началом и концом). Это выглядит так:
start end type value
2015-01-01 2015-01-05 1 3...
145 просмотров
schedule
04.04.2024
Другой результат между concat и np_r при объединении фрагментов кадра данных
Предположим, что это кадр данных
import pandas as pd
import numpy as np
df = pd.DataFrame({'group1' : ['A', 'A', 'A', 'A',
'A', 'A', 'A', 'A'],
'group2' : ['A', 'A', 'A', 'A',...
56 просмотров
schedule
10.03.2024
Расширьте кадр данных pandas, включив в него «недостающие» недели
У меня есть фрейм данных pandas, который содержит данные временных рядов, поэтому индекс фрейма данных имеет тип datetime64 с недельными интервалами, каждая дата приходится на понедельник каждой календарной недели.
В фрейме данных есть только...
575 просмотров
schedule
05.04.2024
Удаление строк на основе значений в других строках
Я искал способ удалить строки из моего фрейма данных на основе условий, которые нужно проверить со значениями в другой строке.
Вот мой кадр данных:
product product_id account_status
prod-A 100 active
prod-A 100 cancelled...
81 просмотров
schedule
10.03.2024
В dataFrame есть дополнительный столбец идентификатора, считанный из csv
Я создал dataFrame и это вывод:
print(train_df)
author text
0 BernardHickey The Commmonwealth Bank of Australia (CBA) warn...
1 BernardHickey Rupert Murdoch predicted in a newspaper...
21 просмотров
schedule
23.03.2024
Избегайте перезаписи файлов с помощью цикла for
У меня есть список фреймов данных (df_cleaned), созданных из нескольких CSV-файлов, выбранных пользователем.
Моя цель - сохранить каждый фрейм данных в списке df_cleaned как отдельный CSV-файл локально.
У меня есть следующий код, который...
463 просмотров
schedule
13.03.2024
Как назначить категорию на основе содержащейся строки
У меня есть данные, как показано ниже:
У меня есть справочная таблица, показанная ниже:
Я хочу просмотреть «Описание» таблицы данных, чтобы увидеть, содержит ли строка каждое слово в столбце «Ключ» справочной таблицы, если да, я...
129 просмотров
schedule
16.04.2024
Панды обновляют один кадр данных суммой существующих и других значений
В моем фактическом фрейме данных более миллиона строк, но образец мультииндексного фрейма данных выглядит так ( с 1,0 в IN_VALUE для простоты ):
# INDEX ID | MATCH IN_VALUE OUT_VALUE
# 0 7 | 1 1.0 -0.33
# 8 | 6...
74 просмотров
schedule
20.04.2024
Увеличение значений строки без зацикливания
Мне нужно суммировать столбец, но мне нужно посмотреть, насколько увеличилась каждая строка, чтобы я мог построить последовательность на диаграмме. Я использую цикл, но в большом наборе данных с тысячами строк он очень медленный. Есть ли более...
33 просмотров
schedule
01.04.2024