분류 전체보기 15

[혼공분석]6주차_복잡한 데이터 표현하기

06 - 1 객체지향 API로 그래프 그리기pyplot  방식 vs  객체지향 API 방식pyplot 방식은 matplotlib.pyplot에 있는 함수를 사용하는 방식으로 함수들이 하나의 피겨객체에 대한 상태를 공유한다객체지향 API방식은 피겨 객체와 서브플롯 객체를 만들고 이 객체의 메서드를 사용하는 방식으로 복잡한 그래프를 그리는 경우 특히 하나의 피겨에 여러 개의 서브플롯을 추가하는 경우 객체지향 API 방식을 사용하는 것이 좋다 그래프에 한글 출력하기✔️미리 네이버 폰트에서 나눔고딕을 다운 받아 Library/Fonts/ 경로에 넣어둔 상태로 진행import matplotlib.pyplot as pltplt.rc('font', family='Nanum Gothic')⚠️진짜 다 맞게 했는데 계속..

[어린왕자] 주옥같은 문장들

이번 포스팅에서는 그냥 어린왕자 내에 나오는 좋은 문장들 몇개만 적어야지 장미의 말이 아니라 행동으로 판단 했어야 했는데. 딱한 거짓말 뒤에 숨겨진 장미의 마음을 알아차렸어야 했는데. 난 너무 어려서 장미를 사랑 할 줄 몰랐던 거야.  나비와 알고 지내려면 애벌레 두세 개는 견뎌야겠지  권위는 우선 이성에 기반해야한다.내가 합리적인 명령을 할 때만 백성에게 복종하라고 할 권리가 있는 거지  어른들은 진짜 말도 안 되게 이상한 사람들이야  네가 날 길들이면 우린 서로 필요해진단다.넌 내게 세상에서 단 하나뿐인 존재가 되는거야 나도 네게 세상에서 단 하나뿐인 여우가 되고   네 장미가 중요한 존재가 된건, 네가 장미에게 들인 시간 때문이야사람들은 이 진실을 잊어버렸지만그래도 너는 잊지마. 네가 길들인 대상에..

도서관 2025.02.15

[혼공분석] 5주차_데이터 시각화하기

05 - 1 맷플롯립 기본 요소 알아보기Figure 객체모든 그래프 구성 요소를 담고 있는 최상위 객체명시적으로 figure 객체를 만들어 활용하면 다양한 그래프 옵션 조절 가능그래프 크기 바꾸기figsize 매개변수plt.figure(figsize=(9,6)) #너비가 9인치, 높이가 6인치인 피겨 객체 생성plt.scatter(ns_book7['도서권수'], ns_book7['대출건수'], alpha = 0.1)plt.show()dpi 매개변수plt.figure(dpi=144)plt.scatter(ns_book7['도서권수'], ns_book7['대출건수'], alpha = 0.1)plt.show()❗️DPI란? dot per inch의 약자로 1인치를 몇 개의 점으로 표현하는지 나타낸다. 맷플롯립의..

[혼공분석]4주차_ 데이터 요약하기

04-1 통계로 요약하기평균 : 데이터 값을 모두 더해 데이터 값의 개수로 나눈 것, 평균을 구하는 방법은 정말 다양하며 상황에 맞게 적절한 평균을 도출 할 수 있어야함중앙값 : 데이터가 홀수인 경우에는 중간에 위치하는 값, 짝수인 경우에는 가운데 두 값의 평균, 즉 데이터의 50%에 해당하는 부분 최솟값 : 말 그대로 시리즈 내에서 가장 작은 값을 나타냄최댓값 : 최솟값과 마찬가지로 시리즈 내에서 가장 큰 값을 나타냄분위수 : 순서대로 정렬한 데이터를 일정한 간격으로 나누는 기준점에 해당하는 것을 나타냄분산 : 평균으로부터 데이터가 얼마나 퍼져있는지를 나타내는 지표. 분산이 클수록 데이터가 넓게 펴져있음. 각 데이터에서 평균을 빼고 제곱한 값을 더해 데이터의 개수로 나눈 값표준편차 : 분산에 제곱근을 ..

[혼공분석]3주차_데이터 정제하기

3주차import pandas as pdns_df = pd.read_csv('도서관 자료.csv', low_memory=False)03 - 1 불필요한 데이터 삭제하기1. 열 삭제하기loc 메서드와 불리언 배열- column 속성은 판다스의 index 클래스의 객체로 이 객체의 원소는 파이썬의 리스트처럼 숫자인덱스로 참조 할 수 있다selected_columns = ns_df.columns != 'unnamed: 13' // 'unnamed: 13'을 제외한 모든 열이 True인덱스를 가짐ns_book = ns_df.loc[:,selected_columns] //True인 열의 모든 행을 선택》》 결과값으로 'unnamed: 13' 열이 삭제된 데이터 프레임을 얻게 된다 같은 방법으로 '부가기호' 열을 ..

[멋진 신세계] 디스토피아 소설...?

책을 선정한 이유싯다르타 포스팅에 올렸던 독서 소모임 멤버들과 다음에 읽을 책을 고민하다 마침 본가 책장에 '멋진신세계'가 꽂혀 있는 것을 봤고 꽤나 유명한 책이고 생각 할 거리도 많다는 얘기를 들어 다음 책으로 이 책을 선정했다. 다만 이번에도 책을 읽은건 나 혼자인거 같다....  총평'재밌는 소설' 보다는 '소설을 빙자한 철학'책에 가까운 느낌이다. 야만인과 문명인의 대비를 명확하게 보여주고 거기서 느껴지는 이질감과 불편함을 고스란히 느끼게 해준다. 동시에 이 세계의 문명인에게는 결핍된 신앙심, 믿음, 사랑과 같은 것들을 중요시 여기는 야만인을 통해 작가가 독자에게 전하고 싶어하는 메시지를 보여준다. 특히 17장에서 총통과 야만인이 대화를 나누는 부분은 이 책의 클라이막스로 다른 문명인과는 달리 총..

도서관 2025.01.22

[혼공분석]2주차_JSON, XML, 웹스크래핑

API?두 프로그램이 서로 대화하기 위한 방법을 정의한 것API를 구현하는 방법은 다양하고 각기 장단점이 있음웹기반 API는 주로 CSV, JSON, XML 형태로 데이터를 전달함파이썬에서 JSON 데이터 다루기JSON?JSON은 파이썬의 딕셔너리와 리스트를 중첩해놓은 것과 같은 '텍스트' 파일이다웹 기반 API로 데이터를 전달할때는 파이썬 딕셔너리가 아니라 '텍스트'로 전달해야 한다JSON 문자열 Python 객체d = {"name" : "혼공분석", "author" : "박해선", "year" : 2022}1. 파이썬 객체를 JSON문자열로 변환하기 : json.dump()함수import jsond_str = json.dumps(d, ensure_ascii=False)print(type(d_str)..

[혼공분석]1주차_CSV파일의 이해

01 - 3 이 도서가 얼마나 인기가 좋을까요?CSV 파일csv 파일이란 ','로 구분된 텍스트 파일이다. 한 줄이 하나의 레코드이며 레코드는 콤마로 구분된 여러 필드 혹은 열로 구성된다. csv 파일의 장점은 여러가지 type의 정보들이 한 번에 저장 될 수 있다는 것이다.  CSV 파일을 데이터프레임으로 읽기: read_csv()함수import pandas as pddf = pd.read_csv('파일 이름', encoding='EUC-KR', low_memory = False)매개변수 'encoding=' 은 파일이 인코딩 된 것과 같은 것을 넣어줘야 한다.read_csv의 default 인코딩 값은 'UTF-8'로 설정 돼 있어 'UTF-8'로 인코딩 된 파일이라면 상관없지만 오류가 생긴다면 그에..