2019년 1월 31일 목요일

파이썬의 엑셀로 불리는 판다스를 공부하실 분들에게 추천하는 책입니다.

파이썬 분야를 강의하다 보니 2가지 분야가 매우 핫합니다.

1. 데이터 사이언스(데이터 과학)분야 입니다. 앞으로도 전망이 아주 밝은 분야입니다.

2. 머신러닝과 딥러닝분야입니다. 최근에 쉽고 좋은 책들이 너무 많이 나와서 지속적으로 공부하시면 좋은 결과를 얻을 수 있을 것 같습니다. 모든 개발자들이 달려들고 있는 분야입니다.



제가 이 책을 재미있게 본것은 이미 알고 있는 내용들이 대부분이긴 하지만 예제나 설명을 풀어주는 부분이 정말 재미있게 되어있습니다. 파이썬을 이미 알고 있는 개발자라면 파이썬의 엑셀로 불리는 판다스를 한번 공부해 보시기를 권합니다.
설명도 재미있고 예제가 풍부합니다. 실습을 하면서 연습을 해보면 얻을 것이 많은 책이라고 생각합니다. ^^


import pandas

df = pandas.read_csv('c:\\workPandas\\data\\gapminder.tsv', sep='\t')
#print(df)
print(df.head())
       country continent  year  lifeExp       pop   gdpPercap
0  Afghanistan      Asia  1952   28.801   8425333  779.445314
1  Afghanistan      Asia  1957   30.332   9240934  820.853030
2  Afghanistan      Asia  1962   31.997  10267083  853.100710
3  Afghanistan      Asia  1967   34.020  11537966  836.197138
4  Afghanistan      Asia  1972   36.088  13079460  739.981106


#열 단위로 데이터 추출하기
country_df = df['country']
print(type(country_df))
print(country_df.head() )
print(country_df.tail() )


<class 'pandas.core.series.Series'>
0    Afghanistan
1    Afghanistan
2    Afghanistan
3    Afghanistan
4    Afghanistan
Name: country, dtype: object
1699    Zimbabwe
1700    Zimbabwe
1701    Zimbabwe
1702    Zimbabwe
1703    Zimbabwe
Name: country, dtype: object

print(df.head(n=10))
country continent  year  lifeExp       pop   gdpPercap
0  Afghanistan      Asia  1952   28.801   8425333  779.445314
1  Afghanistan      Asia  1957   30.332   9240934  820.853030
2  Afghanistan      Asia  1962   31.997  10267083  853.100710
3  Afghanistan      Asia  1967   34.020  11537966  836.197138
4  Afghanistan      Asia  1972   36.088  13079460  739.981106
5  Afghanistan      Asia  1977   38.438  14880372  786.113360
6  Afghanistan      Asia  1982   39.854  12881816  978.011439
7  Afghanistan      Asia  1987   40.822  13867957  852.395945
8  Afghanistan      Asia  1992   41.674  16317921  649.341395
9  Afghanistan      Asia  1997   41.763  22227415  635.341351

#lifeExp열을 연도별로 그룹화하여 평균 계산하기
print(df.groupby('year')['lifeExp'].mean())
year
1952    49.057620
1957    51.507401
1962    53.609249
1967    55.678290
1972    57.647386
1977    59.570157
1982    61.533197
1987    63.212613
1992    64.160338
1997    65.014676
2002    65.694923
2007    67.007423
Name: lifeExp, dtype: float64
![]

댓글 없음:

댓글 쓰기

참고: 블로그의 회원만 댓글을 작성할 수 있습니다.

마이크로소프트의 빌드 행사가 5월 20일부터 시작되었습니다.

 간단한 등록 절차를 거치고 나면 온라인으로 보실 수 있습니다 .ㅎㅎ  저도 주말에 볼 생각입니다. 올해는 등록을 해야 전체 세션을 볼 수 있네요.  마소의 코파일럿 + PC에 대한 소개 영상입니다. 맥북과의 경쟁을 통해서 더 좋은 제품들이 나오네요....