데이터분석 시계열다룰때 전처리함수

datatime 유형을 생성하여 시간을 추가할 수 있습니다.

날짜/시간 가져오기

date= datetime.date(연도=2023, 월=2, 일=12)

td = datetime.timedelta(일= 5, 시간=5)

인쇄(날짜+시간)

시계열 데이터를 변환하는 방법

pd.to_datetime(tweet(‘created_at’) //데이터프레임)

pd.to_datetime(df, errors=”coerce”) # 오류를 na 값으로 변경합니다!

시계열을 인덱스로 변환!

Crime_df = Crime.set_index(‘REPORTED_DATE’)

인덱스를 변경한 다음 정렬하여 시간별로 데이터 프레임을 정렬합니다.

Crime_df.sort_index(오름차순 = 참)

정렬 사이의 시간대

Crime_df.loc(‘2017-01-01′:’2017-01-12’).sort_index()

between_time_sort

Crime_df.between_time(’10:00′,’15:00′).sort_index()

원하는 시간만 추출

Crime_df_sr = Crime_df.at_time(’17:12′).sort_index()

다시 스캔

# 월별, 일별, 주별 값 계산

// 연간
Crime_df.resample(‘Y’).sum()


매년 최대값만 받고 싶다면

Crime_df.resample(‘Y’).max()