미래내일일경험 - 빅리더(23.06~23.12)/교육

[빅리더] 6/27 TIL

NINE1ll 2023. 6. 27. 14:48

하나의 column 명만 변경하고 싶을 때, columns.str.replace를 사용한다.

# 하나의 column 명만 변경하고 싶을 때, columns.str.replace를 사용한다.

df2.columns = df2.columns.str.replace('성적','장학여부')
df2


Numeric

- 가끔씩 int나 float으로 들어가야할 데이터들이 object로 들어가서 문제가 생기는 경우가 있다. 

데이터를 pd.read_csv로 가져와서 hp(housepower)를 보면 float처럼 보인다.  그런데,

실제로 보면 object tpye을 가지고 있다. 이걸 describe를 해보면,

당연하게도 나오지 않는다. (describe는 수치형 변수만 보여준다)

그러면 수치형 변수로 변경하면 된다.

mpg['hp'] = pd.to_numeric(mpg['hp'],errors='coerce')

errors = 'coerce'를 사용하면 numeric이 아닌 경우 NaN 값으로 대체한다. 

이제 멀정하게 describe에도 나오고, 

numerir 이 아닌 값이 NaN으로 변경되어서 na값도 읽힌다.

-- 보간법은 따로 블로그글 올려야지