본문 바로가기

Aiffel_learning

(17)
2-2. pandas : 데이터 불러오기, 합치기(concat, join, merge),내보내기 file 불러오기import pandas as pd# csv 파일 불러오기data = pd.read_csv('titinic.csv') # 데이터와 같은 폴더인 경우data = pd.read_csv('data/titianic.csv') # 데이터가 담겨있는 파일보다 상위폴더인 경우data = pd.read_csv('/aiffel/data/titinic.csv') # 위치가 다른 경우 전체 위치경로 포함시키기# 엑셀파일 불러오기data = pd.read_excel('파일경로.xlsx')# JSON파일 불러오기data = pd.read_json('파일경로.json')csv file 내보내기df.to_csv('output.csv', index=False)데이터 합치기concat다 각각 이어붙여짐(인덱스도 ..
2-1. pandas의 기본구조 : series, dataframe https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html#basic-data-structures-in-pandas 10 minutes to pandas — pandas 2.2.2 documentation10 minutes to pandas This is a short introduction to pandas, geared mainly for new users. You can see more complex recipes in the Cookbook. Customarily, we import as follows: In [1]: import numpy as np In [2]: import pandas as pd Basic data structure..
2. pandas 메소드 한눈에! 한눈에 보기 편하려고 정리한 글 :)메소드(코드)설명데이터를 dataframe, series화 하기pd.DataFrame(데이터)데이터를 dataframe으로 변경 pd.Series(데이터) 데이터를 series으로 변경 파일 불러오기data = pd.read_csv('csv파일')csv 파일 불러오기data = pd.read_excel('xlsx 파일')엑셀파일 불러오기파일 내보내기 df.to_csv('output.csv', index=False) csv 파일 내보내기 데이터 병합하기concat()세로 or 가로로 다 각각 이어붙여짐(인덱스도 그대로 각각, 같은 column만 합쳐짐)merge(자료, on=suffix칼럼, how=join방식)두 개 이상의 데이터 프레임을 특정 공통 열 또는 인덱스를 ..
1-1. NumPy 활용하기(audio, image) https://jalammar.github.io/visual-numpy/ A Visual Intro to NumPy and Data RepresentationDiscussions: Hacker News (366 points, 21 comments), Reddit r/MachineLearning (256 points, 18 comments) Translations: Chinese 1, Chinese 2, Japanese, Korean The NumPy package is the workhorse of data analysis, machine learning, and scientific computing in tjalammar.github.io 컴퓨터는 2진수로 이루어진 산술 연산만 가능하기 때문에 데이터(..
1. 데이터분석 기초 : 배열과 표 / Numpy 배열(array) 과 목록(list, 동적배열(Dynamic Array)) : 둘 다 여러 항목을 저장하는 데 사용되는 데이터 구조임 목록 : 다양한 자료형을 저장할때, 형태가 유동적일 때 유용           리스트, 튜플배열 : 동일한 자료형의 데이터를 처리할때, 빠른 처리속도가 필요할 때 유용          값 삽입 : array.insert(1,5)   # array의 두번째 자리에 5를 끼워넣기목록배열여러 데이터 유형의 요소들을 포함가능동일한 데이터 유형 요소만 포함하는 벡터가변적 연속열(형태가 유동적)크기가 고정돼있음쉽게 데이터 수정이 가능삽입, 삭제 비용이 높음짧은 데이터 타입에서 선호됨긴 데이터타입에서 선호됨큰 메모리 소비, 처리속도 느릴 수 있음메모리 크기가 비교적 작음내장함수 사용해..
Enum 모듈 타 그루분의 코드를 보다가 신기한 모듈이 있어서 공부해 보았다. Enum 모듈Enum 모듈은 열거형(Enumerated type)으로 언어의 상수역할을 하는 식별자(python 3.4부터 지원됨)ex. boolean 은 False == 0, True == 1 로 이미 정의되어있는 열거형 불러오기from enum import EnumEnum을 상속받는 클래스 만들기# 아쉽게도 숫자는 자동지정 불가능, 일일이 지정해줘야함class Rainbow(Enum): Red = 0 Orange = 1 Yellow = 2 Green = 3 Blue = 4 Navy = 5 Purple = 6호출방법print(list(Rainbow))>>>[, , , , , , ]# 호출방법 1Ra..
2025.5.21 re모듈(re.sub, re.split)을 이용한 문자열 데이터처리 파이썬 퀘스트2번을 수행하면서 알파벳을 제외한 모든 특수문자를 제거해야하는 데이터처리가 필요했다!우리팀은 매우 수동으로 텍스트파일을 다 읽으면서 모든 특수문자를 다 넣어주었는데;;;;;replacetext = text.replace('.', ' ').replace(',', ' ').replace('?', ' ').replace("'", ' ').replace('-', '').replace('!', ' ').replace('/', ' ')\.replace('^', ' ').replace('%', ' ').replace('\n', ' ').replace('\\', ' ').replace('(', ' ').replace(')', ' ') 심지어 여기서도 \ 를 없애는 과정에서 \\ 로 입력해주어야한다는것을 배..
24.05.14 markdown 마크다운 문법Header큰제목This is an H1=============작은제목This is an H1-------------글머리(1~6까지 지원, 1이 제일 크고 bold체)# This is a H1## This is a H2### This is a H3#### This is a H4##### This is a H5###### This is a H6BlockQuote> This is a first blockqute.> > This is a second blockqute.> > > This is a third blockqute.목록# 순서있는 목록(내림차순으로 정리됨)1. 첫번째2. 두번째3. 세번째# 순서없는 목록* , + , - 혼합해서 사용가능코드블럭# 들여쓰기한 줄 씩 띄우고 작성, tap ..