실전 데이터 분석하기

2주차 : Colab 과 파이썬에 대하여

shl4917 2023. 4. 21. 13:35

어김없이 돌아온 2주차 강의 아카이빙 입니다..! 

이번주차는 구글 Colab 을 활용하여 데이터를 분석해보는 형태라고 볼 수 있다.

 

원티드에서 데이터 분석 강의를 들을 때 Colab 을 처음 사용해보고 신기하다고 느꼈는데,

스파르타 실전 데이터 강의에서 다시 한번 해당 플랫폼을 마주하니 친숙한 느낌이 드는 기분..?

 

우선 Colab 을 간단히 생각해보면 메모장 같은 역할을 한다. 

그리고 파이썬을 별도로 설치할 필요가 없고, 인터넷만 있으면 어디서든 접속이 가능하다는 큰 장점이 있다!

이제 Colab 을 활용하여 파이썬 문법을 사용하면서 데이터 분석을 차근차근 해보도록 하자! 


파이썬의 가장 기본적인 구조를 파악하기 위한 예제로 아래와 같이 쓸 수 있다.

변수에 대한 값을 지정하여 < ctrl + enter > 로 데이터를 저장, print 로 원하는 값을 도출하는 기본적인 형태이다.

< print > 활용하여 변수 값을 추출할 수 있다

 

데이터를 분석할 때 변수가 너무 많은 경우 리스트를 사용하면 된다.
여기서 리스트의 개념은 "순서가 있는 데이터들의 모음집" 이라고 볼 수 있다!

하나하나 변수 지정을 하기에 어려움이 있을 때, 대괄호를 사용한 리스트로 데이터를 가져올 수 있다

이때 인덱스 순서는 0부터 시작한다는 점..! 보통은 1부터 생각하지만 프로그래밍에서는 이러한 부분이 다르다.

[5,6] 을 추출하기 위해서 순서는 2 (0번, 1번 2번)


이제 딕셔너리를 활용하여 데이터를 볼 차례인데, 여기서 딕셔너리는 무엇일까?
말 그대로 명칭과 뜻이 쌍으로 이루어진 '사전' 같이 이름과 이름에 해당하는 값이 쌍으로 이뤄진 데이터 모음집이다.

 

그렇다면 또 다른 궁금증으로 우린 왜 딕셔너리가 필요할까?

각 학생별로 개인 정보를 기록해 둔 데이터가 있다고 해보자

각 정보당 번호만 매겨져 있다면 그 정보가 몇 번인지 기억해야 하는데 힘이 들 것이다.

그래서 그 정보의 '이름'만  불러준다면 해당 '값'을 가져올 수 해주는 것이 딕셔너리라고 볼 수 있다.

딕셔너리는 중괄호를 사용하고, 원하는 값을 불러올 때 " " 사용

 

이번 주차 강의는 파이썬 문법에서 가장 기초 중에 기초를 배웠다.

이 후 pandas 와 matplotlib  사용하여 데이터를 분석하는 내용이 나오는데 매우 흥미롭다.

이 부분은 정리할 내용이 많을 것 같아 차후 좀 더 집중적으로 다뤄볼 예정이다!