본문 바로가기

python/빅데이터분석기사

[초등학생도 이해하는 빅데이터분석기사 실기] 판다스 데이터 정렬(sort_values())

반응형

안녕하세요 '코딩 오페라'블로그를 운영하고 있는 저는 'Master.M'입니다.

오늘부터는 '초등학생도 이해하는 빅데이터분석기사 실기'라는 주제로 판다스(pandas)를 이용한 데이터 마이닝에 대해 포스팅하도록 하겠습니다. 제목처럼 진짜 핵심 내용을 쉽게 설명하는 것을 목표로 하고 있으니 데이터 마이닝에 입문하고 싶은 분들은 많은 관심 부탁드립니다. 오늘 알아볼 내용은 '데이터 정렬'입니다.

 

1. 판다스 (pandas)

본론으로 들어가기 앞서 '판다스'에 대해 간단히 설명드리겠습니다.

  • 판다스(Pandas) : 파이썬 프로그래밍 언어를 위한 데이터 조작과 분석을 위한 라이브러리입니다. 주로 표 형식의 데이터나 다양한 형식의 데이터를 처리하고 분석하는 데 사용됩니다. 판다스는 특히 데이터 프레임(DataFrame)과 시리즈(Series)라는 두 가지 핵심 자료 구조를 제공합니다.

앞으로 배운 빅데이터분석기사 실기에서는 데이터 프레임을 많이 다루니 이 부분을 중점으로 생가하시면 됩니다.

 

2. 데이터 정렬

본론으로 다시 와서 오늘의 주제인 '데이터 정렬'에 대해 설명드리겠습니다. 

  • 데이터 정렬 : 데이터를 특정 기준에 따라 순서대로 나열하는 것을 말합니다. 이를 통해 데이터를 더 쉽게 이해하고 분석할 수 있습니다.

데이터 정렬에는 여러 가지 종류가 있지만, 그중에서 가장 기본이 되는 '오름차순 정렬'과 '내림차순 정렬'을 오늘 설명드리겠습니다. 

 

1. 판다스로 데이터 불러오기

basic1.csv
0.00MB

import pandas as pd

df = pd.read_csv("basic1.csv")
df.head()

 

위 예시 'basic1.csv' 파일을 다운로드 받고, 다음과 같이 pandas의 'read_csv'함수를 이용해 csv파일을 불러와줍니다. 참고로 이부분에 대해 자세히 알고 싶으신 분들이 아래 포스트를 참고하시기 바랍니다.

https://codingopera.tistory.com/11 

 

파이썬 csv 파일 불러오기

안녕하세요 '코딩 오페라'블로그를 운영하고 있는 저는 'Conducter'입니다. 오늘 알아볼 내용은 파이썬에 csv파일을 불러오는 것입니다. 그전에 우선 csv파일에 대해 알아보도록 합시다. csv(comma-separa

codingopera.tistory.com

 

불러온 data frame

 

코드를 실행하면 위와 같이 csv파일의 data frame이 도출되게 됩니다.

 

 

2. 데이터 정렬하기 

 

data frame의 데이터 정렬은 판다스의 'sort_values'라는 함수를 통해 이루어 집니다.

형식은 "원하는 data frame.sort_values('원하는 칼럼', ascending=True or False)"으로 구성되어 있는데, 여기서 ascending은'오름차순'이라는 뜻으로 True를 선택 시 오름차순이 실행되고, False를 선택 시 내림차순이 선택됩니다. 각각의 예시는 다음과 같습니다. 

 

  • 오름차순 정렬
df = df.sort_values('f5', ascending=True)
df.head(10)

오름차순 정렬된 data frame

 

위 결과에서 볼 수 있듯이, 컬럼 'f5'를 기준으로 데이터들이 오름차순 된 모습을 볼 수 있습니다.

 

 

  • 내림차순 정렬
df = df.sort_values('f5', ascending=False)
df.head(10)

내림차순 정렬된 data frame

 

위 결과에서 볼 수 있듯이, 컬럼 'f5'를 기준으로 데이터들이 내림차순 된 모습을 볼 수 있습니다.

 

 

지금 까지 저희는 '판다스(pandas)를 이용한 데이터 정렬'에 대해 알아보았습니다. 도움이 되셨나요? 만약 되셨다면 구독 및 좋아요로 표현해 주시면 정말 많은 힘이 됩니다. 궁금한 사항 혹은 앞으로 다루어 주었으면 좋을 주제가 있으시면 댓글 남겨주시면 감사하겠습니다. 저는 '코딩 오페라'의 'Master.M'이었습니다. 감사합니다.

반응형