Pandas
Добавлено: Пн ноя 27, 2023 1:53 pm
Сегодня
Выводит текущую дату и время.
Убрать NULL
Заменяет пустые значения нулем (или другим значением).
Убрать первую строку датафрейма
Убирает первую строку фрейма (например, при загрузке Эксель файла, можно убрать заголовок).
Задать тип значения
Переопределяет тип на нужный (float, str и т.д.)
Длина строки
Определяет длину строки
Обрезка текста
Обрезает первые 5 (или любое количество) символов справа.
Замена текста
Замена значений в колонке по условию. Замена 202307-202309 на 3К23.
Фильтр датафрейма
Отфильтровать датафрейм по значению в колонке.
Чтение Эксель
Загрузить Эксель файл.
Помещаем данные в датафрем.
Удалить часть строк в Clickhouse по условию
Сводная таблица
Сводный датафрейм
Округление
Левое соединение
Аналог левого соединения (LEFT JOIN). Для объединения датафреймов в один.
Объединение
Аналог UNION ALL
Задать дату
задает конкретное значение даты для поля
Сохранить Excel
Сохранить датафрейм в Эксель.
Удалить NULL строки
Все
Только по столбцу
Минимальное значение
Находит минимальное значение в колонке
Удалить часть строк в Clickhouse по условию с вложенным запросом
Выводит текущую дату и время.
Код: Выделить всё
Statement['UploadDate'] = pd.Timestamp.now()
Заменяет пустые значения нулем (или другим значением).
Код: Выделить всё
Statement = Statement.fillna(0)
Убирает первую строку фрейма (например, при загрузке Эксель файла, можно убрать заголовок).
Код: Выделить всё
Statement = Statement.iloc [1: , :]
Переопределяет тип на нужный (float, str и т.д.)
Код: Выделить всё
Statement['Payments'] = Statement['Payments'].astype(float)
Определяет длину строки
Код: Выделить всё
Statement["CODE"] = Statement["Project"].str.len()
Обрезает первые 5 (или любое количество) символов справа.
Код: Выделить всё
Statement['CODE'] = Statement["Project"].str[:5]
Замена значений в колонке по условию. Замена 202307-202309 на 3К23.
Код: Выделить всё
Statement1.loc[Statement1['StatementPeriod'] == '202307-202309', 'StatementPeriod'] = "3К23"
Отфильтровать датафрейм по значению в колонке.
Код: Выделить всё
Statement1 = Statement1[Statement1['Project'] == '123654']
Загрузить Эксель файл.
Код: Выделить всё
file = pd.read_excel(r'C:\Продажи таблица.xlsx', usecols = "A,B,C")
Код: Выделить всё
Salesdf = file.rename(columns={ file.columns[0]: "City" , file.columns[1]: "Client", file.columns[2]: "Amount" })
Удалить часть строк в Clickhouse по условию
Код: Выделить всё
client.execute('''DELETE FROM Sales1 WHERE Client LIKE '%ИП Иванова%'; ''')
Сводный датафрейм
Код: Выделить всё
Corrections = pd.pivot_table(Corrections, index= ['CorrCompany','CorrPeriod','CorrINN','CorrProject''], aggfunc=np.sum).reset_index()
Код: Выделить всё
df7['ClosingBalance'] = np.round(df7['ClosingBalance'],2)
Аналог левого соединения (LEFT JOIN). Для объединения датафреймов в один.
Код: Выделить всё
df = df.merge(df1, left_on=['Agr'], right_on=['AgrID'], how='left')
Аналог UNION ALL
Код: Выделить всё
projects = pd.concat([DataFrame1,DataFrame2,DataFrame3])
задает конкретное значение даты для поля
Код: Выделить всё
Statement['UploadDate'] = pd.Timestamp('2023-05-19 00:00:00')
Сохранить датафрейм в Эксель.
Код: Выделить всё
CONSO.to_excel(r"/output.xlsx")
Все
Код: Выделить всё
df.dropna()
Код: Выделить всё
Q422 = Q422.dropna(subset=['StatementPeriod']) –только по столбцу
Находит минимальное значение в колонке
Код: Выделить всё
Sales['MinDate'] = Sales['Date'].min()
Удалить часть строк в Clickhouse по условию с вложенным запросом
Код: Выделить всё
DELETE FROM Sales WHERE Date IN (SELECT Date FROM Sales);