Aiffel_learning/Data_analysis (13) 썸네일형 리스트형 2-2. pandas : 데이터 불러오기, 합치기(concat, join, merge),내보내기 file 불러오기import pandas as pd# csv 파일 불러오기data = pd.read_csv('titinic.csv') # 데이터와 같은 폴더인 경우data = pd.read_csv('data/titianic.csv') # 데이터가 담겨있는 파일보다 상위폴더인 경우data = pd.read_csv('/aiffel/data/titinic.csv') # 위치가 다른 경우 전체 위치경로 포함시키기# 엑셀파일 불러오기data = pd.read_excel('파일경로.xlsx')# JSON파일 불러오기data = pd.read_json('파일경로.json')csv file 내보내기df.to_csv('output.csv', index=False)데이터 합치기concat다 각각 이어붙여짐(인덱스도 .. 2-1. pandas의 기본구조 : series, dataframe https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html#basic-data-structures-in-pandas 10 minutes to pandas — pandas 2.2.2 documentation10 minutes to pandas This is a short introduction to pandas, geared mainly for new users. You can see more complex recipes in the Cookbook. Customarily, we import as follows: In [1]: import numpy as np In [2]: import pandas as pd Basic data structure.. 2. pandas 메소드 한눈에! 한눈에 보기 편하려고 정리한 글 :)메소드(코드)설명데이터를 dataframe, series화 하기pd.DataFrame(데이터)데이터를 dataframe으로 변경 pd.Series(데이터) 데이터를 series으로 변경 파일 불러오기data = pd.read_csv('csv파일')csv 파일 불러오기data = pd.read_excel('xlsx 파일')엑셀파일 불러오기파일 내보내기 df.to_csv('output.csv', index=False) csv 파일 내보내기 데이터 병합하기concat()세로 or 가로로 다 각각 이어붙여짐(인덱스도 그대로 각각, 같은 column만 합쳐짐)merge(자료, on=suffix칼럼, how=join방식)두 개 이상의 데이터 프레임을 특정 공통 열 또는 인덱스를 .. 1-1. NumPy 활용하기(audio, image) https://jalammar.github.io/visual-numpy/ A Visual Intro to NumPy and Data RepresentationDiscussions: Hacker News (366 points, 21 comments), Reddit r/MachineLearning (256 points, 18 comments) Translations: Chinese 1, Chinese 2, Japanese, Korean The NumPy package is the workhorse of data analysis, machine learning, and scientific computing in tjalammar.github.io 컴퓨터는 2진수로 이루어진 산술 연산만 가능하기 때문에 데이터(.. 1. 데이터분석 기초 : 배열과 표 / Numpy 배열(array) 과 목록(list, 동적배열(Dynamic Array)) : 둘 다 여러 항목을 저장하는 데 사용되는 데이터 구조임 목록 : 다양한 자료형을 저장할때, 형태가 유동적일 때 유용 리스트, 튜플배열 : 동일한 자료형의 데이터를 처리할때, 빠른 처리속도가 필요할 때 유용 값 삽입 : array.insert(1,5) # array의 두번째 자리에 5를 끼워넣기목록배열여러 데이터 유형의 요소들을 포함가능동일한 데이터 유형 요소만 포함하는 벡터가변적 연속열(형태가 유동적)크기가 고정돼있음쉽게 데이터 수정이 가능삽입, 삭제 비용이 높음짧은 데이터 타입에서 선호됨긴 데이터타입에서 선호됨큰 메모리 소비, 처리속도 느릴 수 있음메모리 크기가 비교적 작음내장함수 사용해.. 이전 1 2 다음