파이썬 분야를 강의하다 보니 2가지 분야가 매우 핫합니다.
1. 데이터 사이언스(데이터 과학)분야 입니다. 앞으로도 전망이 아주 밝은 분야입니다.
2. 머신러닝과 딥러닝분야입니다. 최근에 쉽고 좋은 책들이 너무 많이 나와서 지속적으로 공부하시면 좋은 결과를 얻을 수 있을 것 같습니다. 모든 개발자들이 달려들고 있는 분야입니다.
제가 이 책을 재미있게 본것은 이미 알고 있는 내용들이 대부분이긴 하지만 예제나 설명을 풀어주는 부분이 정말 재미있게 되어있습니다. 파이썬을 이미 알고 있는 개발자라면 파이썬의 엑셀로 불리는 판다스를 한번 공부해 보시기를 권합니다.
설명도 재미있고 예제가 풍부합니다. 실습을 하면서 연습을 해보면 얻을 것이 많은 책이라고 생각합니다. ^^
import pandas
df = pandas.read_csv('c:\\workPandas\\data\\gapminder.tsv', sep='\t')
#print(df)
print(df.head())
country continent year lifeExp pop gdpPercap
0 Afghanistan Asia 1952 28.801 8425333 779.445314
1 Afghanistan Asia 1957 30.332 9240934 820.853030
2 Afghanistan Asia 1962 31.997 10267083 853.100710
3 Afghanistan Asia 1967 34.020 11537966 836.197138
4 Afghanistan Asia 1972 36.088 13079460 739.981106
#열 단위로 데이터 추출하기
country_df = df['country']
print(type(country_df))
print(country_df.head() )
print(country_df.tail() )
<class 'pandas.core.series.Series'>
0 Afghanistan
1 Afghanistan
2 Afghanistan
3 Afghanistan
4 Afghanistan
Name: country, dtype: object
1699 Zimbabwe
1700 Zimbabwe
1701 Zimbabwe
1702 Zimbabwe
1703 Zimbabwe
Name: country, dtype: object
print(df.head(n=10))
country continent year lifeExp pop gdpPercap
0 Afghanistan Asia 1952 28.801 8425333 779.445314
1 Afghanistan Asia 1957 30.332 9240934 820.853030
2 Afghanistan Asia 1962 31.997 10267083 853.100710
3 Afghanistan Asia 1967 34.020 11537966 836.197138
4 Afghanistan Asia 1972 36.088 13079460 739.981106
5 Afghanistan Asia 1977 38.438 14880372 786.113360
6 Afghanistan Asia 1982 39.854 12881816 978.011439
7 Afghanistan Asia 1987 40.822 13867957 852.395945
8 Afghanistan Asia 1992 41.674 16317921 649.341395
9 Afghanistan Asia 1997 41.763 22227415 635.341351
#lifeExp열을 연도별로 그룹화하여 평균 계산하기
print(df.groupby('year')['lifeExp'].mean())
year
1952 49.057620
1957 51.507401
1962 53.609249
1967 55.678290
1972 57.647386
1977 59.570157
1982 61.533197
1987 63.212613
1992 64.160338
1997 65.014676
2002 65.694923
2007 67.007423
Name: lifeExp, dtype: float64
![]