본캠프/TIL ♨

[TIL 15일차] 250310 파이썬 실습을 시작한 하루

yssummer 2025. 3. 11. 00:10

 

🐱‍👤 하루 요약
1.지금까지 한 것:

    sql 코드카타 5개정도풀기, 파이썬 과제 1번 풀기, 파이썬 라이브세션 후 학습, colab 실습해보기 
2. 앞으로 할 것:

    파이썬 기초 공부를 해가면서 5번까지의 기초 과제를 하나씩 풀어나가고, 주말 지나서 6-10번도 도전할 수 있을 것 같으면 해보기.
3. 새로 안 것:

과제 풀기 시도 해보니까 처음에는 sql이랑 달라서 문제를 읽는 것도 어려웠다. 빈 공간이 아니라

코드를 입력하게 되어있는 앞뒤로 먼저 코드가 써져 있어서, 여기에 쓰는거 맞나? 하는 생각도 했다.

오랫동안 문제를 째려보니 서서히 이해되기는 했다. 풀려고 덤벼보니, 1번은 어렴풋이 알겠고, 2번부터는 모르겠어서

공부를 하기 시작했다. 강의부터 쭉 들을까, 아니면 코랩에서 코드카타 풀듯이 실습부터 덤벼볼까! 고민하다가,

일단 익숙해지기 위해 코랩에서 놀았다. 강의자료에서 소개해준 리스트, 튜플, 딕셔너리 종류를 이것 저것 써서 작동시켜 보았다.

흥미로웠다! 색다른 환경에 적응이 되고 나니 강의의 필요성이 느껴졌다. 머릿속 산재된 정보를 항목별로 찬찬히 쌓을 필요성을 느꼈다.

    
4. 느낌: 흥미롭고 난감하다!

    


😊진행상황

자기 전 캡처! 파이썬 오늘공부와 코드카타 완료~ 여기에 개인과제 조금 손대기까지 추가로 완료~ 

인강은 안들은 하루~

 

 



😊공부메모

  🔵파이썬 코랩으로 처음 갖고 놀아보기

    🧶  다양한 쿼리 테스트와 공부, 적응. + 과제 1번 풀이

      🐬공부 메모 아래와 같이 했다. 그냥 복붙해왔다.

 

판다스는 엑셀표처럼 보이게 만들어주는거다 행과 열이 끝이다 이걸 데이터프레임이라고 부르는거임.

데이터프레임은 파이썬 등에서 쓰는 말이긴 함.

라이브러리 안에 여러 펑션이 있기에 그걸 불러와서 쓰면 된다.

데이터 분석가는 모든 데이터를 테이블 모드로 바꾼 뒤에, 그걸 보면서 통계를 하고 머신러닝을 하고 그룹바이하고 셀렉하고 하는 것이다.

그러니 판다스를 안쓰면 데이터 분석을 한다고 할 수 업겠지? 행과 열이 아니니까 select from where 할게 없는거지.

 

(0)from google.colab import filesuploaded = files.upload()

(1)import ioimport pandas as pddf = pd.read_csv(io.StringIO(uploaded['customer_details.csv'].decode('utf-8')))df.head()

(2)import ioimport pandas as pddf = pd.read_csv(io.BytesIO((uploaded['customer_details.csv'])))df.head()

0,1,2 순서대로 입력했더니 불러와졌는데

이게 이해가 안돼서 열심히 구글링.

아래와 같은 내용이었다.

  • uploaded['customer_details.csv']
    • 업로드된 CSV 파일을 바이트 데이터로 가져옴.
    • csv —> byte data 된 상태
  • io.BytesIO(uploaded['customer_details.csv'])
    • 바이트 데이터를 파일처럼 사용할 수 있도록 변환함.
    • byte data —> file 된 상태
  • pd.read_csv(io.BytesIO(...))
    • 변환된 데이터를 pandas의 read_csv() 함수로 읽어서 데이터프레임(df)으로 변환함.
    • file —> dataframe 된 상태

# 테이블 확인하기 display(df, df2, df3)

# 처음 5 줄만 출력하기

#df2.head() 쩜이 중요. 메소드나 펑션 적용할 때 다 점찍고다.

# 마지막 5 줄만 출력하기

#df2.tail() # 각 테이블의 행(가로) 길이 파악하기 len(df)

# shape: 테이블의 행과 열의 갯수를 반환 df.shape 가로세로줄 몇개니 얘도 역시나 점으로 접근.

# dtypes: 테이블 내 컬럼타입(문자형, 숫자형, 배열 등) 확인 df.dtypes

예를 들어서, 날짜가 20250310인데 숫자인지 문자인지 알 수 없을 떄 string 형태일 때 있었기 때문에, 데이터 어떤 방식으로 저장됐는지 확인할 때 필요.

# columns: 테이블 내 컬럼 확인 df.columns 컬럼이 엄청 많을 수 있다 현업에서는 천개 이상일 수 있다. 컬럼 이름만 리스트로 보고 싶을 때 이걸 씀.

# values: 테이블 내 각 행들을 배열 형태로 확인 df.values # 테이블 기본 구조 한눈에 확인하기 df.info()

# 전체 행 갯수, 평균, 표준편차, 최솟값, 사분위수, 최댓값 확인 df2.describe() --연속형 변수에 대해 계산을 자동으로 해줌.

이 아래부터는 수요일에 마저 예정.

#컬럼별로 결측치(데이터가 없는) 확인하기 df.isnull().sum()

 

 

신기하고 흥미로운 시작이었다!


  🔵sql 코드카타

    🧶인상깊었던 두 문제

   

🐬표현하는 방식이 틀렸어서 헤맸던 쿼리.

select warehouse_id, warehouse_name, address,

case when freezer_yn is null then 'N'

else freezer_yn

end as freezer_yn2

from food_warehouse

where address like '경기도%'

order by warehouse_id;

 

 

🐬데이트 포맷 바꾸는 거를 이때 구글링 해보면서 제대로 알게 되어서 메모한다. 

 

select animal_id, name, date_format(datetime, '%Y-%m-%d') as '날짜'

from animal_ins order by animal_id