본문 바로가기

IT/밑바닥 부터 시작하는 데이터 분석6

확률론과 통계학 이 부분은 중요하기 때문에 책을 추천하고 넘어가겠다.  1. 미적분학, 해석학 순으로 간략하게 개념을 짚고 넘어간다. 2. 통계학 책수리통계학, R. V. Hogg 3. 확률론 책확률의 입문 2024. 8. 15.
선형대수 선형대수는 벡터 공간을 다루는 수학의 한 분야이다. 선형대수는 다양한 데이터 과학 기술과 개념을 뒷받침해 주는 분야이다.1. 벡터(vector)벡터는 벡터끼리 더하거나 상수(scalar)와 곱해지면 새로운 벡터를 생성하는 개념적인 도구, 여기에서는 내적을 통해 두 벡터의 거리를 구할 것이다.벡터를 float 객체를 갖고 있는 리스트인 Vector라는 타입으로 명시해볼 것이다.from typing import ListVector = List[float]height_weight_age = [70, 170, 40]grades = [95, 80, 75, 62]벡터 덧셈은 zip을 사용해서 두 벡터를 묶은 뒤 각 성분끼리 더하는 리스트 컴프리헨션을 적용시키면 된다. 뺄샘도 마찬가지이다.def add(v: Vect.. 2024. 8. 12.
데이터 시각화 데이터 시각화에는 두가지 목적이 있다.데이터 탐색(exploration)데이터 전달(communication)좋은 시각화와 그렇지 않은 것에 대한 분별력을 길러야 한다.1. matplotlib가장 전통적인 matplotlib은 웹을 위한 인터랙니브한 시각화를 위해서는 적합하지 않지만, 간단한 막대 그래프, 선 그래프, 또는 산점도를 그릴 때는 나쁘지 않다.그 중에서도 matplotlib.pyplot은 시각화를 단계별로 간편하게 만들 수 있는 구조로 되어 있으며, 시각화가 완성되면 savefig()를 통해 그래프를 저장하거나 show()를 사용해서 화면에 띄울 수 있다.from matplotlib import pyplot as pltyears = [1950, 1960, 1970, 1980, 1990, 20.. 2024. 8. 11.
파이썬 속성 강좌: 심화 1. 객체 지향 프로그래밍다른 프로그래밍 언어와 같이 클래스를 사용할 수 있고 클래스 이름은 파스칼 케이스로 클래스의 이름을 표기하면 된다. 크래스는 0 개 이상의 멤버 함수를 포함하며 모든 멤버 함수의 첫 번째 인자는 해당 클래스의 인스턴스를 의미하는 self로 정의해야 한다. 메서드의 이름이 언더 바로 시작하는 경우, 클래스 밖에서 호출을 하면 안되는 private 메서드를 의미한다. init , repr 등 이름의 앞 뒤로 언더바가 두개 씩 추가된 메서드는 dunder(double_UNDERscore)메서드라고 부르며 특별한 기능을 가지고 있다. 또한 부모 클래스에서 기느을 상속받을 수 있는 서브클래스를 종종 사용할 수 있다.class CountingClicker: def __init__(se.. 2024. 8. 11.
파이썬 속성강좌_기초 1. 설치1) Anaconda 배포판 설치2) 3.6 이후 깔끔한 코드를 작성 할 수 있으며, 2.7이 전은 호환이 다양한 라이브러리와 호환이 중지 되었으니 되도록이면 최신 버전을 사용해야 한다.2. 가상 환경프로젝트별로 라이브러리를 관리하기 위해(matplotlib과 같은 외부 라이브러리) 가상환경을 사용해야 한다.콘다를 사용할 경우conda create -n dsfs python=3.6source activate dsfssource deactivatepython을 직접 설치하였을 경우python -m venv exampleexample activate3. 들여쓰기파이썬은 다른 언어와 다르게 단락을 구분하기 위해 중괄호({})를 사용하지 않고 들여쓰기를 사용한다.4. 모듈import를 통해 사용할 수 .. 2024. 8. 11.
데이터 과학 데이터 과학한 벤다이어그램에 의하면 데이터 과학은 다음 세가지 영여의 교집합니다.해킹실력수학 및 통계에 관한 지식도메인 전문성도메인 전문성을 상세히 설명하기 위해서는 수만 페이지가 필요하다. 우선은 앞의 두 가지(해킹실력, 수학 및 통계에 관한 지식)에 집중해야한다. 사실 해킹실력을 키우기 위한 가장 좋은 방법은 직접 이것저것 해킹해 보는 것이다. 자신만의 방법을 찾아야 한다. 비슷한 맥락으로 수학을 배우는 가장 좋은 방법은 수학을 직접해보는 것이지만, 데이터 과학을 위해서는 확률과 통계, 선형대수에 대한 최소한의 이해가 우선적이다. 2024. 8. 11.