R - ML과 DL을 하는데 R로 짜는 사람도 많다.
Matplot
Python
R이나 Matplot으로 짜는 것은 Python보다 어렵다. Python이 좀 더 강력한 라이브러리가 많기 때문이다.
Data type, Control, Looping, function module만 알면 OK.
데이터 분석을 하기 위한 문제의식도 중요. -> 데이터를 어떻게 핸들링할것인가?에 대한 요구사항 분석.
Scipy(통계분석패키지), Numpy(수치 컴퓨팅 패키지), Pandas(데이터 병합 및 변환 제공하는 데이터 추상화 계층) 및 모든 종속성을 포함하는 바이너리 세트. 데이터과학작업에 필요한 거의 모든것을 제공한다.
Numpy
Pandas
Matplot
지도학습 - Decision Tree, Random Forest, Linear Regression, Rogistic, SVN
비지도학습 - Clustering, K-Means, Collaborative Filtering
데이터를 불러오고 예측하고 학습하고. 전처리. .
머신을 넣은 이유는 딥을 제대로 알기 위해서.
머신강의는 머신강의만. 딥강의는 딥강의만.. 조금 다른 부분이 있다.
레이어를 여러개 쌓는다.
딥의 레이어가 어떻게 이루어져있는지에 대한… 신경망이 어떻게 구현이 되어있는지 정확히 이해해야한다.
-> 텐서플로, 파이토치. . . . . . . . . . . . . . . . . . . . .. . . .
텐서는 embedded와 모바일에 강하다는 점 빼고는 장점이 없다. Customize할 수 있는 라이브러리. 코드가 직관적이지는 않다.
텐서는 포럼이 별로 없고 tutorial도 약하다.
연구원들은 pytorch로 돌아섰고 강력하고 academic한 포럼도 있다.
연산과정이 텐서랑 달라서 연산속도가 매우 빠르다.
Linear
Convolusion - CNN - 합성곱
NN (Neural Net) - ANN, RNN, DNN
ANN : 레이어가 하나.
D(Deep)NN : 레이어가 여러개
D(Deep)CNN
DNN을 CNN으로 바꾸는 작업을 한다. VGGNet Visual Geometric Group… GPU서버로 돌려야 한다.
Colab GPU서버를 지원해주는 구글의 소프트웨어. - 그렇게 복잡하지 않은 걸로.
번외로 keras를 하자.
엄청 간단하게.
재밌겠다.