Daljaru's blog|Data

heatmap basic

Daljaru 17 Jul 2020

heatmap 히트 맵(heat map)은 열을 뜻하는 히트(heat)와 지도를 뜻하는 맵(map)을 결합시킨 단어로, 색상으로 표현할 수 있는 다양한 정보를 일정...

Tags:

0 comments
boxplot basic

Daljaru 17 Jul 2020

boxplot ‘상자 그림’(box plot, boxplot)은 수치적 자료를 표현하는 그래프입니다. 이 그래프는 가공하지 않은 자료 그대로를 이용하여 그린 것이 아니...

Tags:

0 comments
histogram basic

Daljaru 17 Jul 2020

histogram 히스토그램(histogram)은 표로 되어 있는 도수 분포를 정보 그림으로 나타낸 것입니다. 더 간단하게 말하면, 도수분포표를 그래프로 나타낸 것...

Tags:

0 comments
subplot basic

Daljaru 17 Jul 2020

subplot subplot은 하나의 figure안에 여러개의 그래프를 그릴 수 있게 만들어주는 메소드입니다. names=['group_A', 'group_B', 'g...

Tags:

0 comments
seaborn 기초

Daljaru 17 Jul 2020

seaborn Seaborn은 matplotlib를 기반으로한 파이썬 데이터 시각화 라이브러리입니다. 상당히 높은 수준의 시각화 인터페이스를 제공합니다. 간단한 r...

Tags:

0 comments
산점도 그리기

Daljaru 17 Jul 2020

산점도 산점도 그래프는 scatter() 함수를 이용해서 그립니다. 산점도는 x,y축에 해당하는 데이터들의 상관관계를 표시할 때 데이터들이 얼마나 어떻게 흩어져 있는가를...

Tags:

0 comments
겹쳐진 그래프 그리기

Daljaru 17 Jul 2020

plot() plot()메소드를 통해 여러개의 그래프를 미리 만들어두고 plt.show()메소드를 사용하면 여러개의 그래프가 한 도면에 그려지는 것을 확인 할 수 있습니...

Tags:

0 comments
Matplot Library 기본 개념

Daljaru 17 Jul 2020

matplotlib 파이썬으로 분석한 데이터를 시각화 하는데는 matplotlib이라는 라이브러리를 가장 많이 사용합니다. matplotlib은 파이썬에서 2D ...

Tags:

0 comments
DataFrame pivot_table

Daljaru 16 Jul 2020

Pivot Table pivot은 영어로 ‘축을 중심으로 회전하다’ 라는 뜻을 가지고 있습니다. DataFrame에서 pivot_table의 의미는 컬럼과 인덱스를 자유...

Tags:

0 comments
DataFrame apply function

Daljaru 16 Jul 2020

apply apply함수는 각 컬럼의 값에 임의로 만든 함수를 적용하고 싶을 때 사용합니다. import numpy as np import pandas as pd fr...

Tags:

0 comments
DataFrame numeric function

Daljaru 16 Jul 2020

sum sum함수는 숫자데이터에만 적용되는 함수입니다. 해당하는 컬럼의 합을 구해줍니다. import numpy as np import pandas as pd from...

Tags:

0 comments
describe function

Daljaru 16 Jul 2020

describe describe함수는 데이터에 대한 간단한 통계자료를 내줍니다. 숫자로서 가능한 데이터만 출력합니다. import numpy as np import pan...

Tags:

0 comments
unique function

Daljaru 16 Jul 2020

unique unique함수는 중복된 것은 걸러버리고 중복되지 않은 값만 출력합니다. import numpy as np import pandas as pd from pan...

Tags:

0 comments
DataFrame groupby

Daljaru 16 Jul 2020

groupby 데이터를 그룹화(범주화)하는 일은 통계자료에서 굉장히 빈번합니다. 그룹핑을 시켜서 데이터의 합을 구하거나 평균치를 구하는 일을 합니다. np.random...

Tags:

0 comments
DataFrame Merge

Daljaru 16 Jul 2020

Merge 서로 다른 DataFrame을 하나로 합치는 작업중에서 merge는 두개의 DataFrame의 행이 같은 것은 중복처리하는 특징이 있습니다. import n...

Tags:

0 comments
DataFrame Concat

Daljaru 16 Jul 2020

Concat 서로 다른 DataFrame을 하나로 합치는 작업입니다. Concat은 단순히 하나의 DataFrame에 다른 DataFrame을 연속적으로 붙이는 방법입니...

Tags:

0 comments
DataFrame Sorting

Daljaru 15 Jul 2020

DataFrame 정렬하기 DataFrame을 정렬할 때는 sort_values()와 sort_index()함수를 이용합니다. import numpy as np impor...

Tags:

0 comments
NaN handling in pandas

Daljaru 15 Jul 2020

Pandas의 결측치 Pandas에서는 null값을 missing data 혹은 missing이라고 부릅니다. missing과 null은 번갈아가며 쓸 수 있지만 pan...

Tags:

0 comments
DataFrame drop columns

Daljaru 15 Jul 2020

DataFrame column 삭제하기 import numpy as np import pandas as pd from pandas import Series, DataFr...

Tags:

0 comments
DataFrame indexing

Daljaru 15 Jul 2020

DataFrame indexing import numpy as np import pandas as pd from pandas import DataFrame, Series...

Tags:

0 comments
DataFrame slicing

Daljaru 15 Jul 2020

DataFrame Slicing 함수를 사용하지 않고 0데이터 프레임을 Slicing하는 방법에는 자릿 수를 이용하는 방법과 라벨로 조회하는 방법이 있습니다. 자릿 수로...

Tags:

0 comments
DataFrame 컬럼명 변경 및 추가

Daljaru 14 Jul 2020

Column명 변경 import numpy as np import pandas as pd from pandas import DataFrame, Series df3 = ...

Tags:

0 comments
DataFrame 조회

Daljaru 14 Jul 2020

tail tail()함수는 인자값을 주지 않으면 제일 끝에서 5개의 행을 보여줍니다. 인자값을 원하는 숫자로 주면 해당 숫자만큼 의 행을 데이터의 뒤에서부터 잘라서 보여줍니...

Tags:

0 comments
DataFrame Info

Daljaru 14 Jul 2020

DataFrame 구조 확인 생성된 DataFrame의 기본적인 구조를 파악하는 메소드는 index, values, columns, dtype이 있습니다. index ...

Tags:

0 comments
DataFrame Initialization

Daljaru 14 Jul 2020

DataFrame DataFrame은 Pandas라이브러리에서 제공하는 2차원 배열형식의 자료구조입니다. 표같은 스프레드시트 구조와 비슷합니다. 여러개의 컬럼을 가지고 ...

Tags:

0 comments
Series NaN handling

Daljaru 14 Jul 2020

Pandas의 결측치 Pandas에서는 null값을 missing data 혹은 missing이라고 부릅니다. missing과 null은 번갈아가며 쓸 수 있지만 pan...

Tags:

0 comments
Series 연산

Daljaru 14 Jul 2020

Series 연산 import numpy as np import pandas as pd from pandas import Series, DataFrame import m...

Tags:

0 comments
Series값 조회하기

Daljaru 13 Jul 2020

Series값 조회하기 Series의 값을 조회할 때는 인덱스로 조회하는 방법, 라벨로 조회하는 방법 두 가지가 있습니다. import numpy as np impor...

Tags:

0 comments
Series 초기화

Daljaru 13 Jul 2020

Series Series는 인덱스를 명시적으로 지정하지 않으면 자동으로 0~N-1까지의 정수를 지정합니다. 시리즈는 결론적으로 말하자면 Numpy Array이기 때문에 ...

Tags:

0 comments
Pandas 개념

Daljaru 13 Jul 2020

Pandas Pandas는 Panel Datas의 약자로 파이썬을 이용한 데이터 분석에서 가장 많이 사용되는 라이브러리입니다. Numpy를 기반으로 만들어졌으며 데이...

Tags:

0 comments
Numpy Statistics function

Daljaru 12 Jul 2020

Numpy Array statistics function Numpy에서 자주 쓰이는 통계함수 몇개를 알아보겠습니다. import numpy as np arr4 = n...

Tags:

0 comments
Numpy Indexing and Slicing

Daljaru 12 Jul 2020

1 Dimension에서 Indexing과 Slicing 인덱스가 0부터 length-1까지 있고, 뒤에서부터 접근할 때는 -를 붙여준다. :를 기준으로 Slicing을...

Tags:

0 comments
Numpy Random function

Daljaru 12 Jul 2020

Numpy Randome Module Numpy의 random모듈(서브패키지)에는 난수를 생성하는 다양한 함수들이 존재합니다. 그 중에서 가장 많이 사용되는 3가지를 정...

Tags:

0 comments
Numpy Array 기본 함수

Daljaru 12 Jul 2020

Numpy basic function import numpy as np arr1 = np.array([[1.0,2,3],[4,5,6]], dtype=np.int32...

Tags:

0 comments
Numpy 배열 초기화

Daljaru 12 Jul 2020

Numpy Array Initialization Numpy Array를 초기화하는 방법은 array()함수를 쓰는 것 외에도 여러가지가 있습니다. zeros(value...

Tags:

0 comments
Numpy 배열과 List 비교

Daljaru 12 Jul 2020

Numpy Array vs List numpy array는 array()를 사용합니다. 리스트는 list()를 사용합니다. import numpy as np myLi...

Tags:

0 comments
Numpy 개념

Daljaru 12 Jul 2020

Numpy Numpy(Numeric Python)은 수학 분야와 관련된 통계작업시 사용하는 파이썬의 가장 기본이 되는 라이브러리입니다. 과학계산 컴퓨팅 작업과 데이...

Tags:

0 comments
Anaconda

Daljaru 11 Jul 2020

Anaconda Individual Edition 기준으로 소개합니다. Anaconda는 Python/R 데이터 과학과 Machine Learning을 단일머신에서...

Tags:

0 comments

Data_analysis

heatmap basic

Tags:

boxplot basic

Tags:

histogram basic

Tags:

subplot basic

Tags:

seaborn 기초

Tags:

산점도 그리기

Tags:

겹쳐진 그래프 그리기

Tags:

Matplot Library 기본 개념

Tags:

DataFrame pivot_table

Tags:

DataFrame apply function

Tags:

DataFrame numeric function

Tags:

describe function

Tags:

unique function

Tags:

DataFrame groupby

Tags:

DataFrame Merge

Tags:

DataFrame Concat

Tags:

DataFrame Sorting

Tags:

NaN handling in pandas

Tags:

DataFrame drop columns

Tags:

DataFrame indexing

Tags:

DataFrame slicing

Tags:

DataFrame 컬럼명 변경 및 추가

Tags:

DataFrame 조회

Tags:

DataFrame Info

Tags:

DataFrame Initialization

Tags:

Series NaN handling

Tags:

Series 연산

Tags:

Series값 조회하기

Tags:

Series 초기화

Tags:

Pandas 개념

Tags:

Numpy Statistics function

Tags:

Numpy Indexing and Slicing

Tags:

Numpy Random function

Tags:

Numpy Array 기본 함수

Tags:

Numpy 배열 초기화

Tags:

Numpy 배열과 List 비교

Tags:

Numpy 개념

Tags:

Anaconda

Tags: