6 Jul 2020

Python with AI

Language for big data

R - ML과 DL을 하는데 R로 짜는 사람도 많다.

Matplot

Python

R이나 Matplot으로 짜는 것은 Python보다 어렵다. Python이 좀 더 강력한 라이브러리가 많기 때문이다.

Data type, Control, Looping, function module만 알면 OK.

데이터 분석을 하기 위한 문제의식도 중요. -> 데이터를 어떻게 핸들링할것인가?에 대한 요구사항 분석.

Anaconda

Scipy(통계분석패키지), Numpy(수치 컴퓨팅 패키지), Pandas(데이터 병합 및 변환 제공하는 데이터 추상화 계층) 및 모든 종속성을 포함하는 바이너리 세트. 데이터과학작업에 필요한 거의 모든것을 제공한다.

데이터 분석

Numpy

Pandas

Matplot

머신러닝

지도학습 - Decision Tree, Random Forest, Linear Regression, Rogistic, SVN

비지도학습 - Clustering, K-Means, Collaborative Filtering

데이터를 불러오고 예측하고 학습하고. 전처리. .

머신을 넣은 이유는 딥을 제대로 알기 위해서.

머신강의는 머신강의만. 딥강의는 딥강의만.. 조금 다른 부분이 있다.

딥러닝

레이어를 여러개 쌓는다.

딥의 레이어가 어떻게 이루어져있는지에 대한… 신경망이 어떻게 구현이 되어있는지 정확히 이해해야한다.

-> 텐서플로, 파이토치. . . . . . . . . . . . . . . . . . . . .. . . .

텐서는 embedded와 모바일에 강하다는 점 빼고는 장점이 없다. Customize할 수 있는 라이브러리. 코드가 직관적이지는 않다.

텐서는 포럼이 별로 없고 tutorial도 약하다.

연구원들은 pytorch로 돌아섰고 강력하고 academic한 포럼도 있다.

연산과정이 텐서랑 달라서 연산속도가 매우 빠르다.

Linear

Convolusion - CNN - 합성곱

NN (Neural Net) - ANN, RNN, DNN

ANN : 레이어가 하나.

D(Deep)NN : 레이어가 여러개

D(Deep)CNN

DNN을 CNN으로 바꾸는 작업을 한다. VGGNet Visual Geometric Group… GPU서버로 돌려야 한다.

Colab GPU서버를 지원해주는 구글의 소프트웨어. - 그렇게 복잡하지 않은 걸로.

Keras

번외로 keras를 하자.

엄청 간단하게.

재밌겠다.

stackoverflow developer survey results


Tags:
0 comments