본문 바로가기

파이썬5

맥(mac)에서 airflow 설치하기 에어플로우(Airflow)를 간단히 설명하자면, 어떤 반복적인 작업(task)들을 실행해주는 scheduler 이다. 여기에서는 anaconda가 설치되어있는 mac환경에서 airflow를 설치하는 내용을 적어보려한다. 1. airflow를 위한 python 가상환경 만들기conda create --name airflow_env python=3.9 -y 2. 가상환경 확인 및 만들어진 가상환경으로 전환 3. airflow 설치// airflow 설치conda install apache-airflow 4. airflow가 설치airflow가 설치되었다면, 터미널에서 다음 명령어로 db를 초기화해준다.// DB 초기화airflow db init DB가 초기화되면 사용자 계정의 폴더에 airflow 라는 폴더.. 2024. 7. 14.
Python : 기간의 시작, 끝 날짜 구하기 오늘 날짜 또는 특정 날짜를 기준을 "전 주" 또는 "전 달"의 시작, 끝 날짜를 구해야하는 경우가 있습니다.예를 들면 매주 월요일에 전 주의 데이터를 가져와서 계산을 한다거나 등의 경우에 말이죠. 이 때 사용할 수 있는 몇 가지 경우의 코드를 작성해보았습니다. 12345678910111213141516171819202122232425262728293031323334353637383940414243444546import datetimefrom dateutil.relativedelta import relativedelta the_date = datetime.date.today()# the_date = datetime... 2024. 7. 13.
회귀모델의 성과 측정 지난 번에 "분류모델의 성과 측정"에 대해서 적은 바 있다.https://walkingfox.tistory.com/220 분류모델의 성과 측정큰 구분에서 모델을 두 부류로 나누자면 아래와 같이 볼 수 있다. 회귀 모델 분류 모델 회귀모델의 경우 평균제곱근 오차(RMSE) 를 사용하지만, 분류모델의 경우는 confusion_matrix 를 이용하여 정확walkingfox.tistory.com 이번에는 "회귀모델의 성과 측정"에 대해서 적어보고자 한다.아래의 지표들은 회귀모델을 통하여 얻은 예측치가 실제 값과 얼마나 차이가 있는지? 즉 얼마나 잘 예측했는지를 나타내는 지표들이다.  이를 구하는 방법을 python 샘플 코드를 참조하세요.import numpy as npfrom sklearn.metrics i.. 2024. 5. 22.
Python : 문자열안의 특정 부분을 변수치환 python 에서 문자열의 특정 부분을 치환하는 몇 가지 방법을 적어려고 한다. 1. 변수 포맷을 이용하는 방법 변수포맷은 아래와 같다 %s : 문자열 %c : 문자 %d : 정수 %f : 실수 아래와 같은 방법으로 string 안에 %s 라는 부분을 특정 변수로 치환할 수 있다. 2. format 함수 사용 이 경우, 변수의 타입을 명시하지 않아도 된다. 아래와 같이 사용할 수 있으며, {0}, {1} 과 같은 부분이 format 안의 인자와 차례로 매칭 치환된다. 3. f문자열 포맷 사용 문자열 앞에 f 를 붙이면 중괄호와 변수이름으로 치환을 할 수 있다. 아래의 예를 참고하자. 2024. 4. 18.
Python : Pandas Visualization pandas의 plot은 내부적으로 matplotlib.pyplot을 이용한다. import numpy as np import pandas as pd import matplotlib.pyplot as plt df1 = pd.DataFrame(np.random.randn(100, 3), index=pd.date_range('1/1/2019', periods=100), columns=['A', 'B', 'C']).cumsum() df1 A B C 2019-01-01 -0.896370 -1.962732 1.584821 2019-01-02 -0.248402 -3.101740 0.370419 2019-01-03 0.622560 -3.979711 1.666569 2019-01-04 1.239019 -3.443114.. 2019. 11. 25.