데이터 분석에 자주 사용하는 문법
PYTHON/데이터분석2023. 9. 15. 17:15데이터 분석에 자주 사용하는 문법

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt #행렬import numpy as npa = np.array([[1,2],[2,3]])b = np.array([[5],[8]])bar = np.linalg.inv(a) #역행렬aranswer = ar@b #행렬곱answer"""array([[-3., 2.], [ 2., -1.]])"""  #통계heights=np.random.normal(174,10,size=10000)hs = pd.Series(heights) #키값hs.value_counts()"""152.117446 1181.541264 1178.9862..

통계분석시각화 - 통합
PYTHON/데이터분석2023. 9. 15. 17:15통계분석시각화 - 통합

!! 코랩 폰트설치!!!sudo apt-get install -y fonts-nanum!sudo fc-cache -fv!rm ~/.cache/matplotlib -rf"""Reading package lists... DoneBuilding dependency tree Reading state information... Donefonts-nanum is already the newest version (20170925-1).The following package was automatically installed and is no longer required: libnvidia-common-470Use 'sudo apt autoremove' to remove it.0 upgraded, 0 new..

통계분석시각화 - 타이타닉2
PYTHON/데이터분석2023. 9. 15. 17:14통계분석시각화 - 타이타닉2

9. 성별에 따른 생존자와 사망자를 하나의 막대그래프로 나타내시오.(아래:생존자, 위:사망자) sdata = df.Sex #성별 데이터 프레임 sn = len(sdata.unique()) #sn : sdata의 값개수 ps_alive_arr = np.zeros(sn) #0으로 초기화 ps_dead_arr = np.zeros(sn) for index in range(len(sdata)):#sdata개수만큼 if sdata[index] =='female': #인덱스가 female이면 si =0 #si에 0넣고 else: si =1 if sur_data[index] ==0: #죽은 승객일때 ps_dead_arr[si]+=1 else: ps_alive_arr[si]+=1 labels=['female','male..

통계분석시각화 - 타이타닉1
PYTHON/데이터분석2023. 9. 15. 17:14통계분석시각화 - 타이타닉1

Pandas : 데이터분석 라이브러리, 관계형 데이터를 행과 열로 구성된 객체로 만들어준다.Matplotlib : 시각화 라이브러리, 그래프를 그릴 수 있게 해주는 도구Numpy :  선형대수 라이브러리 , 벡터, 행렬 등 수치 연산df : 데이터 프레임import pandas as pdimport matplotlib.pyplot as pltimport numpy as np #csv 파일 읽기path = '/content/sample_data/train_titanic.csv'df = pd.read_csv(path)df   1. 주어진 자료의 인원, 생존자, 사망자는 몇 명인가?데이터 값 세기 :  count( )카테고리별 값 세기 :  df[ ].value_counts( ) - 둘다 특정 column에 ..

통계분석시각화  : matplotlib
PYTHON/데이터분석2023. 9. 15. 17:14통계분석시각화 : matplotlib

#matplotlibhttps://matplotlib.org/ Matplotlib — Visualization with Pythonseaborn seaborn is a high level interface for drawing statistical graphics with Matplotlib. It aims to make visualization a central part of exploring and understanding complex datasets. statistical data visualization Cartopy Cartopy is a Python package desmatplotlib.org파이썬에서 데이터를 효과적으로 시각화하기위해 만든 라이브러리매트랩의 시각화 기능을 모델링해서 만들어..

통계분석시각화-pandas
PYTHON/데이터분석2023. 9. 15. 17:13통계분석시각화-pandas

Numpy는 같은 데이터 타입의 배열만 처리 할 수 있다.pandas는 데이터 타입이 다양하게 섞여있을때도 처리할 수 있다.  #Seriespandas에서 데이터를 생성하는 가장 기본적인 방법 - 1차원 데이터 생성Series 형식의 구조적 데이터를 생성할 수 있다.ex) s=pd.Series(시퀸스 데이터)  튜플,리스트 리스트를 주로 사용  s = pd.Series([1,2,3,4,5]) print(s)"""인덱스/데이터(values)0 11 22 33 44 5dtype: int64"" print(s.values)#[1 2 3 4 5] s=pd.Series(["홍길동", "나길동", "선우길동"])print(s)"""0 홍길동1 나길동2 ..

PYTHON/데이터분석2023. 9. 15. 17:12통계분석시각화 : Numpy -연산

행렬-리스트로 계산불가, 함수 만들어야한다.  assert [조건], [오류메시지]조건 : True이면 코드가 진행,  False: AssertionError 발생(생략가능)def add(l1, l2): assert len(l1)==len(l2), " 조건 :행렬 더하기 연산은 요소의 길이가 같아야 한다." re=[] for i in range(len(l1)): re.append(l1[i]+l2[i]) return rels1=[1,2]ls2=[3,4]ls3=add(ls1,ls2)print(ls3)"""[4, 6]""" numby행렬연산 내장되어있음n1=np.array([1,2])n2=np.array([3,4])n3=n1+n2print(n3)"..

PYTHON/데이터분석2023. 9. 15. 17:12통계분석시각화 : Numpy -소개

https://numpy.org/doc/stable/index.html NumPy documentation — NumPy v1.22 ManualThe reference guide contains a detailed description of the functions, modules, and objects included in NumPy. The reference describes how the methods work and which parameters can be used. It assumes that you have an understanding of the key concepts.numpy.org 파이썬을 통한 데이터 분석을 할때 기초 라이브러리로 사용된다.보통 np라는 별칭으..

PYTHON/문법2023. 9. 15. 17:11예외처리, 모듈, 클래스

#예외처리프로세스가 더 이상 동작하지 못하는 상황일 때 예외가 발생한다.(내부적으로 raise 구문으로 예외 발생시킨 것임)try: 실행할 코드except 예외1: 예외(=에러)가 발생했을 때 처리하는 코드 -else: 예외가 발생하지 않았을 때의 처리finally: 예외가 발생하든 하지 않든 반드시 해야하는 처리 -예제1num1 =int(input("정수입력"))num2 =int(input("정수입력"))try: print(num1/num2)except: print("에러")else: print("에러x")finally: print("반드시 처리") """정수입력4정수입력22.0에러x반드시 처리-------------정수입력3정수입력0에러반드시 처리 """-2#예외를 발생시키기def ge..

카카오 도서검색 api 사용하기
PYTHON/etc2023. 9. 15. 17:09카카오 도서검색 api 사용하기

도서검색 api를 사용한다.  1.https://developers.kakao.com/ 키 발급받기 Kakao Developers카카오 API를 활용하여 다양한 어플리케이션을 개발해보세요. 카카오 로그인, 메시지 보내기, 친구 API, 인공지능 API 등을 제공합니다.developers.kakao.com   2. 문서-> Daum 검색 -> 개발 가이드       3.코드import urllib.requesturl = 'https://dapi.kakao.com/v3/search/book'target_param = "target=title" #제목: param으로 넘어간다.page_param ="page=2" #2번 페이지 보여주기query_in = ..

python 회원 관리 프로그램 -csv파일
PYTHON/etc2023. 9. 15. 17:08python 회원 관리 프로그램 -csv파일

1.회원 데이터 추가-회원 아이디를 입력받는다.-이미 존재하면 기능 종료-이름,이메일,나이,키 입력받는다. 2.회원 데이터 삭제-회원 아이디를 입력받는다.-아이디가 존재하지 않으면 없다고 출력하고 기능 종료-존재하면 삭제하고 삭제하였다고 출력 3.회원 데이터 검색-회원 아이디를 입력받는다.-아이디가 존재하지 않으면 없다고 출력하고 기능 종료-존재하면 출력 4.전체 회원 데이터 정보 출력아이디 순으로 전체 회원정보 출력 0.프로그램 종료프로그램 종료시 회원 정보를 members.csv파일로 기록프로그램 시작시 members.csv파일에 정보를 로딩 -로드#구현하지 않으면 예외처리#members.csv 불러오기members={}def load(fname):..

PYTHON/문법2023. 9. 15. 17:07파이썬 - 반복문(리스트,튜플)

리스트 [요소,요소]ls=[3,4,8,9]for i in ls: print(i, end=' ') #출력 : 3 4 8 9subjects=("국어","영어","수학")scores = []#점수를 기억할 컬레션 생성for i in range(len(subjects)):#반복(3과목) score = int(input(f"{subjects[i]} 점수 입력:"))#점수 입력 scores.append(score)#컬렉션에 보관print((scores[0]+scores[1]+scores[2])/3)#평균 출력"""국어 점수 입력:78영어 점수 입력:78수학 점수 입력:8881.33333333333333""" 딕셔너리키와 값을 쌍으로 갖는 요소를 보관하는 자료구조..

image