일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 데이터 마이닝
- 공학박사
- 4차산업혁명
- 다보스 포럼
- hadoop
- 빅데이터
- 데이터 사이언스
- Big Data
- 인공지능
- 기계학습
- R programing
- R
- AI
- 머신러닝
- 캐글
- kaggle
- Python
- machine learning
- 독일유학
- 딥러닝
- 다보스
- 독일박사
- MOOC
- Artificial Intelligence
- deep learning
- Industry 4.0
- IOT
- Data Science
- Today
- Total
Dali van picasso
데이터 사이언스(Data Science)를 무료로 배우는 방법 [첫번째 글] 본문
어떤걸 첫번째 글로 쓸까하다가 고심 끝에 선택했습니다.
(사실 자꾸 미루고 있었는데 계속 써봐야 실력도 늘죠 ㅎㅎ )
이번 글은 Data Scientist 가 되기 좋은 방법론에 대해 소개를 하겠습니다.
한동안은 제가 쌓아놓은 자료를 소개하는 방식으로 글을 쓸 것 같네요 :)
데이터과학 분야를 무료로 배울 수 있는 방법
데이터과학 분야를 무료로 배울 수 있는 방법입니다. 원문페이지에는 26가지의 가이드가 있습니다. 그 중에 10가지만 우선 공유합니다. 10가지만 해도 충분히 시간이 걸리고 해볼만한 일인것 같습니다. 텍스트의 일부를 번역했고 의역이 있으니 참고해주시기 바랍니다. 원문페이지 주소는 http://goo.gl/60R4cC 입니다.
공유해가시는 것은 환영합니다. 다만 원문출처나 번역에 대한 언급없이 직접 만든 컨텐츠라 하는건 옳지 않다는 생각이 듭니다. 나누고 싶다는 취지에서 제작한 것이지, 누군가의 생색을 위한 것은 아니었습니다. 참고해주셨으면 합니다. 번역자는 김영웅입니다.
1. 데이터 속성에 대해 이해하기 : 컨텍스트가 없는 데이터는 오해로 이어지거나 쓸모없을수도 있습니다. Hadoop, NoSQL, Tableau 와 같은 툴이나 트렌드 단어 없이 데이터 자체에 대해 이야기할 수 있는 사람이 필요합니다. 또한 데이터가 의미하는 바를 제대로 끌어낼 수 있어야 합니다. (개인적으로 데이터과학은 새로운 기술이나 방법이 아니라 생각하는 방식의 변화, 즉 데이터를 기반으로 생각하고 문제에 접근하는 사고적 개념이라고 생각합니다.)
2. 데이터 과학자에 대해 이해하기 : 데이터과학 분야에서 가장 혼란스럽게 사용되는 단어가 '데이터 과학자' 일것입니다. 이 분야의 사람중 일부는 Hadoop, NoSQL 등 기술에 익숙하고 또 다른 일부는 수학이나 통계를 이용하고 매우 어렵게 설명합니다. 또 다른 이들은 대쉬보드를 시각화하거나, 끝없는 ETL 프로세스를 구동합니다. (ETL : Extract, Transform, Load 의 약자로 전통적인 데이터웨어하우스에서 데이터를 변형하여 처리하는 프로세스를 말합니다).
하지만 데이터과학자는 위의 언급된 사람들보다 각 분야에 대한 이해도나 실제로 만들어내는 역량은 다소 부족하지만, 각각을 어떻게 이어나가 일로 만들어낼지는 아는 사람이라고 생각합니다. 좋은 데이터과학자는 outside the box 방식으로 무엇이 가능한지 이해하고 데이터를 현실의 필요와 기술 사이에서 연결하는 사람이라고 할 수 있습니다. 또한 데이터로 부터 인간의 행동을 읽어내고 명확하게 비즈니스적으로 이어내는 사람이라고 볼수도 있습니다.
3. 링크에 나와있는 13가지 TED 영상을 시청해보세요. http://goo.gl/KgzM2z
4. 한스로슬링의 영상을 시청해보세요. http://goo.gl/KnTxEx
5. Partially Derivative 라는 팟캐스트를 구독해보세요. http://goo.gl/YL3C12
6. University of Washington’s Introduction to Data Science 코스(https://goo.gl/Cb6YdV)나 Computing for data analysis(https://goo.gl/7FKmfi) 는 이 분야를 시작하기에 좋은 강의입니다. 이 강의로 데이터분석 분야에 입문해보세요.
7. 이 깃허브링크를 수시로 살펴보세요. https://goo.gl/Hk4Z12
8. http://www.measureofamerica.org 이 페이지를 통해 데이터가 어떠한 차이를 만들어내는지에 대해 이해해보세요.
9. 부즈앨런에서 펴낸 Field Guide to Data Sciences 문서 읽어보세요. http://goo.gl/Zh0gEY
10. 이 인포그래픽에 나와있는대로 따라해보세요. http://goo.gl/aPHi8E
* 첨부된 이미지는 데이터과학의 역사라는 제목으로 작성된 이미지를 가져온 것입니다. 기술발전의 측면에서 참고할만합니다.
출처(번역): 생활코딩
(원문):http://goo.gl/60R4cC
(일단 제가 얻은 직접적인 경로만 적겠습니다. 혹시나 원 출처를 아시는 분은 댓글로 남겨주세요)
저는 아직 네번째 단계까지밖에 못했네요 . (게을러 빠진 나란 놈 ㅜㅠ)
다 해보고 나면 그에 관한 후기도 올릴게요.
'데이터과학 & 빅데이터' 카테고리의 다른 글
Data Scientist와의 대화 (2) | 2016.02.05 |
---|---|
빅데이터(Big data)를 소개합니다. [Big Data 분석 개론] (0) | 2016.01.28 |