Skip to main content
신문기사

학위 없이 데이터 과학에 입문하는 방법

2020-11-09 06:29:33+00:00
None
조회수 : 79

(본 기사는 구글번역기로 번역한 것입니다. 원문을 읽기 원하시는분은 아래의 링크를 참조해주시기 바랍니다)

 

동일한 위치에 있는 데이터 과학자의 조언

 

소개

 

이 글은 다음 범주 중 하나에 속하는 사람들을 위한 것이다.

1.중등 후 학위는 없지만 데이터 과학에 관심이 있으십니다.

2.STEM 관련 학위는 없지만 데이터 과학에 관심이 있으십니다.

3.데이터 과학과는 전혀 무관한 분야에서 일하고 있지만, 데이터 과학에 관심이 있으십니다.

4.데이터 과학에만 관심이 있고 더 많은 것을 배우고 싶어 하는 것이다.

 

아마 "나한테 기회라도 있을까?"라고 궁금해할 겁니다.

 

대답은 "그래, 가능하지."이다.

 

좋은 소식은 첫 단계를 이미 통과했다는 겁니다. 데이터 과학에 관심이 있다는 겁니다. 이제 그것은 쉬운 여정이 아닐 것이다 왜냐하면 당신은 약자였기 때문이다. 하지만 그것을 매일 자신에게 동기를 부여하는 연료로 사용한다.

 

거기에다 내가 처음 시작할 때 가졌으면 좋겠다는 충고를 할 것이다.

 

우선, 나에 대해 조금…

 

경영학 학위는 있지만 대학교 2학년 때부터 기계학습에 관심이 많았다. 그래서 오늘 내가 알고 있는 대부분의 것을 스스로 학습했고 몇몇 데이터 분석가/데이터 과학 분야에서 일하게 되어 행운이었습니다.

 

내가 왜 이런 말을 하는 거지? 나도 한때 너와 비슷한 입장이었음을 분명히 하고 싶어!

 

이것은 장기적인 목표이므로 장기적으로 결과를 기대해야 한다는 것을 기억하라. 만약 당신이 100% 자신을 헌신할 의향이 있다면, 나는 당신이 계속할지 말지를 결정하기 전에 적어도 1년 전에 그것을 줄 것이다.

 

이 말이 나온 김에, 그것에 대해 깊이 생각해 보자.

 

학위 없이 데이터 과학에 입문하는 방법

 

데이터 과학에 입문하는 것은 두 가지로 귀결되는데, 그것은 여러분의 기술을 성장시키는 것과 보여주는 것이다.

1) 데이터 과학 기술 향상

 

얼마 전, 나는 "다시 시작할 수 있다면 데이터 과학을 어떻게 배울 것인가"라는 기사를 썼다. 이 글에서 나는 무엇을 배워야 하는지, 즉 통계와 수학, 프로그래밍 기초, 기계학습 등 과목별로 세분화했다.

 

이 글에서 나는 당신이 배워야 할 것을 당신의 이해 수준에 따라 나누려고 한다.

 

레벨 0: 기본 원리

 

기본부터 시작해야지, 빌딩 블록, 뭐라고 부르든. 하지만 내가 이 말을 할 때, 당신의 기초가 좋아질수록, 당신의 데이터 과학 여행은 더 부드러워질 것이다.

 

특히, 통계 & 확률, 수학, 프로그래밍 등의 주제에서 기초를 쌓을 것을 추천한다.

 

통계학과 확률: 만약 여러분이 저의 이전 기사를 읽어보셨다면 아마 MILLIONth time을 들으셨을 겁니다. 하지만 데이터 과학자는 정말로 현대 통계학자에 불과할 겁니다.

•통계 및 수학에 거의 노출되지 않는 경우, 통계 및 확률에 대한 Khan Academy의 과정을 추천한다.

•하지만 미적분학 및 통합에 대한 지식이 있다면 조지아 공대의 "통계학적 방법"이라는 과정을 거치는 것이 좋다. 그것은 더 많은 증거를 통과하기 때문에 조금 더 어렵지만, 각 아이디어의 복잡함을 이해하는데 도움이 될 것이다.

 

수학: 고등학교 때 얼마나 많은 관심을 기울였느냐에 따라 기초수학을 배우는데 얼마나 많은 시간이 필요한지 결정하게 된다. 당신이 배워야 할 세 가지 영역이 있다: 미적분학, 적분학, 선형대수학:

•최적화와 관련된 모든 것(데이터 과학과 상당히 관련 있는 것)에 관해서는 미적분학이 필수적이다. 나는 이것을 위해 칸 아카데미의 미적분학 과정을 추천한다.

•확률 분포 및 가설 검정에 있어 통합성은 필수적이다. 칸 아카데미의 통합 강좌를 추천한다.

•심층 학습을 하고 싶다면 특히 선형대수학(Linearal Maintegration)이 중요하지만, 그때도 주성분 분석, 추천 시스템 등 다른 기초적인 기계학습 개념을 아는 것이 좋다. 깜짝 놀랐어, 내가 추천하는 코스가 뭔지 알아맞힐 수 있을 거야. 링크는 여기에 제공된다.

 

프로그래밍: 수학과 통계에 대한 기본적인 이해가 중요한 것처럼, 프로그래밍의 핵심 기본 원리를 아는 것은 특히 구현에 있어 여러분의 삶을 훨씬 더 쉽게 만들어 줄 것이다. 따라서 머신러닝 알고리즘에 뛰어들기 전에 시간을 두고 기본적인 SQL과 파이썬을 익히는 것을 추천한다.

•SQL에 완전히 익숙하지 않다면, 매우 간결하고 철저하므로 Mode의 SQL 자습서를 살펴보는 것이 좋다.

•비슷하게 Python을 완전히 처음 접하는 경우 Codecademy는 Python에 익숙해지기 위한 좋은 리소스입니다.

레벨 1: 전문화

 

일단 기초부터 익히면 전문화를 할 준비가 되어 있다. 이 시점에서 머신러닝 알고리즘, 딥러닝, 자연어 처리, 컴퓨터 비전 등에 집중하고 싶은지는 여러분에게 달려 있다.

•기계학습 알고리즘 및 구현에 대해 자세히 알고 싶다면, Kaggle의 기계학습 소개, Stanford의 머신러닝 과정 또는 Udemi의 머신러닝 A-Z를 살펴보겠다. 그것들을 확인하고 무엇이 당신의 선호도에 가장 적합한지 보라!

•심층 학습에 대해 자세히 알아보려면 여기에서 deeplearning.ai의 전문화를 확인하십시오. 그만한 가치가 있어!

•NLP에 대해 자세히 알아보려면 Stanford, Oxford와 같은 상위 대학의 5개 무료 Natural Language Processing 과정을 참조하십시오.

 

전문적으로 할 수 있는 것이 너무 많으니, 결정을 내리기 전에 더 많은 것을 탐구해 보십시오!

 

레벨 2: 연습

 

다른 것과 마찬가지로 사용하지 않는 것을 잃어버리기 때문에 배운 것을 연습해야 한다! 여기 당신의 기술을 연습하고 다듬기 위해 내가 추천하는 3가지 자료가 있다.

1.리츠코드는 내가 결코 가능하지 않다고 생각했던 기술과 깔끔한 트릭을 배우는데 도움을 준 훌륭한 자원이다. 구직활동을 하면서 크게 활용했던 것이고 항상 돌아갈 수 있는 자원이다. 그 중 가장 좋은 부분은 그들이 일반적으로 추천한 솔루션과 토론 게시판을 가지고 있기 때문에 당신은 더 효율적인 솔루션과 기술에 대해 배울 수 있다는 것이다.

2.판다 연습 문제: 이 자원은 특히 판다를 위한 연습 문제들로 가득 찬 보고다. 이러한 연습 문제를 완료하면 데이터를 필터링 및 정렬하고, 데이터를 집계하고, 데이터를 조작하기 위해 .appy()를 사용하는 방법 등을 알 수 있다.

3.Kaggle은 당신이 선택할 수 있는 수백 개의 데이터셋을 가진 세계에서 가장 큰 데이터 과학 커뮤니티 중 하나이다. Kaggle을 사용하면 경쟁에서 경쟁하거나, 단순히 사용 가능한 데이터셋을 활용하여 자신만의 머신러닝 모델을 만들 수 있다.

 

2) 데이터 과학 기술 보여주기

 

데이터 과학을 배우는 것도 한 가지지만, 사람들이 흔히 잊어버리는 것은 마케팅이다. 결국 여러분이 배운 것을 보여주고 싶을 것이다. 만약 당신이 데이터 과학과 관련된 학위를 가지고 있지 않다면 이것은 특히 당신에게 중요하다.

 

몇 가지 개인 데이터 과학 프로젝트를 완료한 후, 아래에서는 개인 데이터 과학 프로젝트를 소개하고 직접 마케팅할 수 있는 몇 가지 방법을 참조하십시오.

 

 

당신의 이력서

 

첫째, 이력서를 활용하여 데이터 과학 프로젝트를 소개하십시오. 완료한 2~3개의 프로젝트를 나열할 수 있는 '개인 프로젝트' 섹션을 만들 것을 추천한다.

 

마찬가지로 LinkedIn의 "Projects" 섹션에서 이러한 프로젝트를 추가할 수 있다.

 

Github 저장소

 

아직 만들지 않았다면 Github 저장소를 만들 것을 강력히 추천한다. 그리고 우리가 Github에 대해 이야기를 하는 동안 Git을 배우는 것이 좋을 것이다. 여기서 모든 데이터 과학 프로젝트를 포함할 수 있으며, 더 중요한 것은 코드를 다른 사람과 공유하여 볼 수 있다는 것이다.

 

만약 당신이 카글 계정을 가지고 있고 카글에 노트북을 만든다면, 이것은 또한 좋은 대안으로 작용한다.

 

활성 Kaggle 또는 Github 계정이 있으면 이력서, LinkedIn 및 웹 사이트에서 계정 URL을 사용할 수 있는지 확인하십시오.

 

개인 웹사이트

 

웹사이트에 대해 말하자면, 나는 웹사이트의 형태로 데이터 과학 포트폴리오를 구축할 것을 강력히 추천한다. HTML과 CSS는 배우기 매우 간단하고 재미있는 프로젝트가 될 것이다! 시간이 없다면, 스퀘어 스페이스 같은 것도 잘 될 거야.

 

중간에서 블로그 작성

 

나는 이것이 나에게 잘 작용했기 때문에 편견을 가지고 있지만, 그렇다고 내가 블로그를 추천할 수 없다는 것은 아니야! 미디엄과 같은 플랫폼으로 당신은 와인의 품질 예측에 나와 같은 프로젝트 워크스루를 쓸 수 있다.

 

비영리 기회

 

마지막으로, 비영리 데이터 과학 기회를 활용하십시오. 나는 수잔 커리 사이벡이 쓴 기고문을 우연히 발견했는데, 이 기고문은 여러분이 실제 데이터 과학 프로젝트에 참여할 수 있는 기회를 얻을 수 있는 여러 기관을 제공한다.

 

읽어줘서 고마워!

 

이것이 어느 정도 방향을 제시하고 데이터 과학 경력에 도움이 되기를 바란다. 이 일에 접근하는 더 쉬운 방법은 없으니, 이 일은 조금도 거리낌 없이 받아들여라. 그럼에도 불구하고, 나는 네가 데이터 과학에 최선을 다하기를 바라!

 

원문 : https://link.medium.com/hjjpyhaI2ab

TOP