Dali van picasso

Data Scientist와의 대화 본문

데이터과학 & 빅데이터

Data Scientist와의 대화

L_zino 2016. 2. 5. 02:26

안녕하세요. 한동안 아파서 글을 게시할 여유가 없었네요.

오늘 소개할 글은 제가 개인적으로 독일의 하이델베르크의 한 연구원분과 인터뷰한 내용입니다. (그래서 저작권법을 생각안해도되지요 음하하핳)

Data Science에 관심이 많거나 독일박사에 관심이 많으신 분들이 참고하였으면 좋겠네요. ㅎㅎ 사적인 정보는 삭제하느라 문맥이 다소 어색할수있는 점 양해해주세요 :)

(무단불펌은 안되요. 꼭 댓글 달아주시고 퍼가주세요)



-------------------------------------------------------------------------------------------------------------------

안녕하세요? 저는 원칙적으로 쪽지나 메일에는 답을 하지 않습니다. 1회성 답변이 될 뿐이고 이후에 다른 분들이 검색하실 수 없기 때문입니다. 게시판으로 질문해주시면 최선을 다해서 답변하려고 노력해보겠습니다. 

... 만, 재미있는 글이라 예외적으로 답변해보겠습니다. 다만 지금 주신 질문과 제 답변을 게시판에 올린다는 전제를 하고 쓰는 답변입니다. 사적인 정보는 제하고요. 물론... 

1.(전공관련 질문) 
> Data Science에는 Hadoop 관련 Data Mining 과 R,Python,SAS 그리고 Excel을 사용하는 데이터 시각화를 도출뒤 해결책을 찾는 분야 크게 두분류가 있는 걸로 알고 있습니다. 저는 후자의 경우로 공부를 할 생각입니다. 

아니오, 잘못 알고 계십니다. 그렇게 간단하지 않습니다. 빅데이터 하면 전자 (병렬/클러스터)의 처리가 많이 나오기는 하고, 나머지를 후자로 볼 수도 있지만, 실은 좋은 구분은 아닙니다. 데이터 사이언스 트랙을 공부해보시면 조금더 감이 오실거에요. 

데이터 사이언스에서 기계학습 방법을 도구로만 사용할때에는 수학과 통계학을 "덜 볼" 수는 있습니다만. 수학과 통계학을 보지 않을 수는 없습니다. 하다보면 병렬화 (hadoop, spark등) 안 할 수도 없을때가 오고요. "나는 이걸 하는 사람이니 저건 안하겠다" 태도는 지금은 좋지 않습니다. 즉, 하다 보면 그게 다 그거입니다. 

> Mining 분야의 경우 당연히 컴공밖에 없겠죠. 하지만 후자의 경우, 컴공이 통계학과에 비해 많이 부족하진 않을까 살짝 우려가 되네요. (통계적 지식과 머신러닝을 구현함에 있어서.) 
> 실제로 Data Science 분야에서 컴공 전공자들이 이런 부분에 대해 어려움 겪고 있는지 알고싶습니다. 

대학원을 가면, 컴퓨터과학/공학은 전부, 100%, 수학입니다. 즉, 수학과나 통계학과 만큼 수학을 잘 해야 합니다. 다만 수학 + 프로그래밍인지라... 수학보다 프로그래밍에 더 방점이 갈 뿐입니다만, 수학 없이 컴퓨터 대학원을 한다는 것은 불가능합니다. 즉, 굳이 구분할 이유 없습니다. 실은 이건 데이터 사이언스 아니라 무얼 해도 마찬가지입니다. 

에,  수학 없는 데이터 사이언스는... 앙꼬 없는 찐빵이오, 컴퓨터 프로그래밍 못하는 컴퓨터과 졸업생입니다. 수학, 통계학에 대한 공부는 내 분야에 한정한 정도이지만, 데이터 사이언스 / 머신 러닝에 필수입니다. ... 수학/통계학에 대한 깊이 없이는 기계 학습 책도 못 읽는답니다만 :-) 다만, 그것이 기계 학습을 위한 수학을 나중에 공부해도 되서... 하다 보면 다 된다고 생각해도 됩니다. (일단 컴퓨터 학부에서 하라는 수학은 다 하면 된다, 그런 이야기입니다.)  

 2. 제 진로를 "한국 석사 - > 독일박사 - > 독일취직"으로 생각하고 있습니다. 
> (독일에선 박사 = 취직 이라고 들었습니다만 그래도 구분해놓겠습니다.) 
> 박사의 경우, 외국인들이 거의 대부분 MPI(연구소)로 박사과정을 수료한다고 들었습니다. 
> 이 과정의 장점과 단점 그리고 필요한 준비를 알려주시면 감사하겠습니다. 
> 또, 제가 알고 있는 방법 외에도 좋은 방법이 있다면 추천부탁드립니다. 

딱 좋은 경로입니다. 제 후배들에게 박사부터 독일에서 해라, 라고 권하는 편인데요. (가능하다면요). 음... 다만 MPI (막스 플랑크 연구소)는 독일의 한 연구 기관일 뿐입니다. 다만 좀 크고, 제일 유명하고 여러군데 지부가 많지요. 그렇지만 대부분 여기서 박사한다는 이야기는 마치, 한국의 박사는 다 ETRI나 KISTI에서 나온다는 이야기처럼 말이 안됩니다. 즉, 어느 대학이건 박사 학생을 뽑는 공고가 나면, 지원하면 능력만 있으면 뽑힙니다. 

어느 학과건 독일에서는 교수가 이공계 박사 과정을 뽑을 때 펀드를 마련합니다. 펀드의 흔함을 따지면 다음이 가장 흔한 정도입니다. 
1) 대학 강의 및 다양한 연구 업무 (대학 연구/연구보조원) 
2) 프로젝트 참여 (독일 연구 펀드 혹은 유럽 연구 펀드) 
3) 장학금 (특정 연구에 대한 펀드 등에서)  

1이나 2는 취업의 형태이고, 3은 학생이지만 지원금을 받는 형태입니다. 연구소에 소속되는 경우에는 (MPI등) 연구소 지부와 연계한 대학이 있어서 거기에서 지도 교수 및 논문을 쓰게 되는 경우입니다. (1-3의 형태 다 그런게 가능합니다.) 즉, 어느 경우건 박사는 돈을 법니다. 굶지 않는 정도의 돈입니다만서도. 

석사를 한국에서 하시는건 매우 좋은데, 다만 반드시 좋은 교수님을 찾아가시기 바랍니다. 교수님의 전공 및, 이 사람이 세계 수준인가, 보는거, 엄청나게 중요합니다. 가능하다면 학생에게 해외 1급 학회에 논문을 쓰게 만드는 교수를 찾아가시는게 좋습니다. 훌륭한 학회 (KDD, SIGIR이니, AAAI니, CIKM이니 등) 에 논문 없는 교수님 밑에서는, 배울게 없습니다. 독일 대학은 순위가 없다고는 하나, 교수가 워낙에들 존경 받는 직업이라, 한국의 서울대/포대 수준의 교수들이 아닌 교수가 없습니다. 경쟁이 정말 치열하거든요. 한국에서도 대학 이름을 볼 이유는 없습니다만, 교수의 이름과, 교수의 수준을 보세요. 대단히 중요합니다. 석사때 좋은 논문을 쓰는건 불가능에 가깝지만 (흐...) , 좋은 논문 하나 있으면 어느 박사과정이건 골라 잡아 갈 수 있습니다. 저는 박사때 좋은 논문 하나 썼고, 그 덕분에 포닥은 이름 높은 어느 대학에 내어도 전화/스카이프 면접까지는 문제 없이 진행되더군요. 그 다음은 물론 역량 및 인터뷰입니다만. 

3. 대학원을 가기 전에 대학생일때 준비했으면 좋겠다는 것들에 대해 조언을 듣고 싶습니다. 

학부에서 배우는 것 어느 하나 쓸모 없는 것이 없습니다. 프로그래밍은 스스로 하나의 프로그램을 (앱이건, 무엇이건) 만들어서 나중에 "내가 이것을 했다" 라고 석사/박사, 혹은 어느 면접에서나 내 보일 수 있는게 중요합니다. 데이터 / 기계 학습이 가미된 것이면 더욱 좋겠지요. 교수 / 면접관의 관점에서, 무엇이 있으면 "이 녀석 쓸만하겠는데" 라고 생각할까, 관점에서 "장난감보다는 더 훌륭한" 무엇을 하나 만들어두시면 그것이 최고라고 저는 생각합니다. 공부 다 따라잡는건 기본이고요.... 


4. 능력에 따라 Case by Case 인건 당연한 얘기지만 독일 컴퓨터 박사에 대한 취업 전망정도만 알려주시면 감사하겠습니다. 

취업 걱정은, 최소한 컴퓨터쪽에서는 독일 박사를 졸업할 수 있다면 취업이 불가능한 경우를 저로서는 상상하기 어렵습니다. 그 경우에는 애당초 졸업이 안되거든요. 이를테면 프로그래밍을 못하는 컴퓨터 박사라거나, 영 실용성이 없는 주제의 컴퓨터 박사라거나 (그런데 컴퓨터 전공은 이게 어렵거든요).. 애, 취업이 어려울수도 있습니다만, 어느정도의 프로그래밍 능력 및, "범용으로 사용가능한 박사 주제"가 있다면 취업이 불가능한 것은 저로서는 상상하기 어렵습니다. 다만, 박사 졸업 자체가 어렵습니다. 제 경험에 따라보면, 박사졸업 성공율은 50% 정도이고 (독일 기준), 박사 졸업을 못하는 경우 취업은 물론 어려워집니다. ... 박사를 왜 졸업 못하느냐고요? 천가지 이유는 댈 수 있습니다. 교수랑 궁합이 나빠서, 프로그래밍 실력이 모자라서, 수학 실력이 모자라서, 논문 쓰는 실력이 모자라서, 그냥 센스가 없어서 (머리가 나빠서), 주제가 나하고 안 맞아서, 주제가 맞지만 세상이 원하는 주제가 아니라서, 등등등. 톨스토이 말따나, 성공적인 (행복한 사람들) 졸업자들은 다 비슷하지만, 실패하는 박사과정들은 (불행한 사람들은) 다 달라서, 개별 스토리가 나오지요... 

취업 문제가 없다, 라는 건 어디까지나 컴퓨터 기준입니다. 즉, 프로그래머, 훌륭한 프로그래밍 능력을 가진 사람은, 독일이건 어디건 취업이 불가능 할 수가 없습니다. 허나 순수과학 (생물학, 등)은 전혀 다른 문제가 될듯 합니다. 

> 5. 4번의 질문과 겹칠수 있겠지만 현재 독일 내 Data Science 상황(연구와 시장)과 IT관련 상황이 어떤지 궁금하네요.(시장 내 수요) 

훌륭한 데이터 사이언티스트 + 프로그래머는 최소한 지금은 전망 매우 밝습니다. (독일로만 한정 하지 않는다면요. 독일은, 독일어가 필수가 되어서 실은 관련 직종에서 독일어 원어민 보다 불리하지요. 네덜란드나 기타 국가에서는 자국어가 업무 언어가 아닌 회사가 더 많습니다.  그래서 전망은 유럽 전체로 보면, 혹은 세계 전체로보면 매우 좋습니다. ... 다만, 그렇기는 한데 5-7년 후 미래를 누가 알겠습니까. 경제 대공황이 올지, 세계 대전이 일어날지... ) 

> 6. 비자에 관해 조언을 듣고싶습니다. 우리나라가 비자관련 최혜국으로 선정되어있고 IT기술자에 대한 특별대우가 있다고 들었습니다. 하지만 자세한 내역까진 잘 몰라서 질문드립니다. 

Blue card에 대해서 검색해보십시오. 베리에서는 블라우에 카르테, 블루 카드 등으로 검색해보시면 됩니다. 별 차이 없고, 그냥 독일에 취업만 되면 된다, 월급 많이 받으면 비자 더 쉽게 나오고 영주권 더 쉽게 나온다, 가 다입니다. 즉, 취업이 선조건입니다. 딱히 나아지는것도 없습니다. 

7. 어학에 대한 현실적인 조언을 듣고 싶습니다. 
> 독일어는 석사졸업전까지 B1수준이 되도록 공부하다가 졸업후 한국연구재단에서 시행하는 2개월 연수를 받을 생각인데 이정도면 충분할지 궁금합니다.  
> 또, 영어는 어느정도 필요한지도 알고싶습니다. (ex: 이왕이면 토플ibt 100을 준비해라.) 

영어는 완벽해야 합니다. 점수가 아니고, 실제로 연구하고 토론하고 면접할때요. 독일어는 독일에 살려면 필요합니다만, 독일에서 박사하는데 필요하지는 않습니다. 저는 가령, 독일어를 읽는 것은 문제가 없지만 쓰지 못하고, 말은 매우 더듬 더듬입니다. 영어는 토플 한번 쳐 본적이 없어서, 토플 ibt 100이 어느 정도인지도 저는 모른답니다 :-) (대학원 졸업에 필요해서 토익은 친 적이 있습니다만, 어차피 상대평가에 지나지 않고, 토익 영어는 쉬워서 당연히 만점이었고요.) 

점수보다도 중요한 것은 영어로 완전하게 표현하는 것에 있습니다. 영어로 교수와 논쟁하고, 동료들과 싸우고 협력하고 감동해야 하니까요. 즉, 내가 생각하고 느낀 것을 한국어로 말하고 적고 (대학원은 적는 것도 *매우* 중요합니다) 할때 생각/감정의 90%를 말/글로 적을 수 있다면 영어로도 비슷하게 (이를테면 85%)는 가야 지장이 없답니다. 영어 점수보다, 실지 영어 실력이 더 중요한데요. 그런 면에서 외국인 엔지니어들과 같이 일해보는게 좋습니다. 교환 학생도 좋고요.  

8. '외국 이공계 업체가 자국민(혹은 EU 시민)을 안뽑고 한국인을 뽑을 수 있는 이유는 수학과 물리부분의 경쟁력이다'라는 말을 들은적이 있습니다. 통계야 당연한거라 논외로 하고 그외의 수학분야는 어디까지 준비를 해 놓는게 좋을지 궁금합니다. 

별로 동의할 수 없는데요? 그냥 전반적으로 전체 역량을 봅니다. 독일 대학원에, 제가 포닥으로 일할때 50%는 독일 학생, 나머지 50%는 세계 각국의 학생이었습니다. 러시아, 중국, 베트남, 등등. 그냥 훌륭한 학생이면 됩니다. 교수들은 굳이 가리지 않습니다. 국적 같은걸 취업보다 더 가리지 않습니다. 
그게 프로그래밍이건, 수학이건, 뭐건 간에 똑똑한 학생은 다 좋아합니다. 교수의 훌륭한 자산이거든요. 논문 있으면 더 좋고, 프로젝트 해 본거 있으면 더 좋습니다. 실력/공부 중요하지만 레퍼런스도 매우 중요합니다. --- (이 프로젝트에서 이 역할을 했었다.) 대부분의 독일 학생들은 프로젝트 경험이나 인턴 경험을 하고 박사에 들어가기 때문입니다. 

=== 

마지막으로 --- 재미있어야 합니다. 석사해보고 재미 없으면 아무 소용 없습니다. 즉, 독일 정착을 목표로 보고, 공부를 수단으로 본다면 성공할 확률이 20%도 안된다고 저는 생각합니다. 마치, "이 여자의 집안을 이어 받아야 해서" 하는 결혼 같이 될겁니다. 공부를 해보고 재미있다면, 그때는 성공 확률이 많이 올라가서 최소한 50%는 넘게 됩니다. 즉, 이 공부가 좋아서 이 공부를 할 곳을 찾는데, 그 중에 독일에 좋은 공부가 있더라, 가 되어야 합니다. (저 여자가 독일에 있으니 결혼하자가 아니고, 이 여자가 좋으니 이 여자와 결혼해서 그녀가 사는 곳으로 가겠다)  

그러므로 일단 독일을 목표로 하지 마세요. 좀 더 너르게, 세상 어디에서건, 어떤 사람들과 일하건 내가 익힌 능력과 내 전공으로 일할 수 있는 사람이 된다 (영어, 수학, 프로그래밍, 데이터에 대한 이해, 그리고 무엇보다도 사람들과 함께 일하는 방법, 리더 쉽 등) 를 목표로 경험/경력을 쌓아가세요. 

석사 - 독일 박사 - 독일 취업, 이런 식의 라인은 가상의 라인일 뿐이지 목표가 되면 안됩니다. 그런 식으로 생각하고 수단과 목표를 헷갈려하다 박사 공부 실패하는 경우를 꽤 보았습니다. 공부해보면 (혹은 회사에서 일해보면)  "내가 어떤 사람인가" 그제서야 배우게 됩니다. 그러면 거기에 맞춰서 유연하게 움직여야 합니다. 공부는 좋아하는, 즐거운, 행복한 것으로만 하셔야 합니다. 그렇지 않다면 성공은 매우 어려워집니다. 

지금은 이렇게 이야기해도 감이 안 오실텐데요. 제 경우에는 군대 훈련소보다 박사논문이 더 어려웠습니다. (지금도 스트레스 받아서 악몽을 꾸면 군대 꿈 아니고 대학원 꿈을 꿉니다) 제가 좋아하고, 사랑하고, 마음에 드는 주제임에도요. 내 사랑이 아니라면, (훌륭한) 박사 졸업은 어렵답니다. 즉, 가짜게 되는지라... 내가 이것을 좋아하겠지, 라고 착각하고 (자신의 진심을 모르고) 박사로 와서 포기하는 경우, 정말 흔하답니다. 누누이 말씀드리지만, 박사 성공확률은 독일 기준으로 50%입니다. 진심이 아니면, 성공 못하고, 진심이라고 착각해도 성공못하는 경우가 많습니다. 

정말 내가 공부에 맞는 사람인가 반드시 확인하셔야 한답니다. 내가 이 여자(공부)를 사랑하는가. 확인하고 그 순수함에 맞추어 움직이시는 것이 오히려 더 성공에 가까워지는 길입니다. 게다가, 대학원 말고도 세상을 돌아다니면서 좋아하는 일을 하고 공부할 방법은 많습니다 :-) 혹시나 너무 대학원이라는 중간 목표에 메이실까봐, 뱀발 다는군요. 자신에 대해서 배우며, 보다 더 유연해지는, 그런 길을 걸으시기를 바래봅니다. 


GilNoh 


Comments