판다스 기초-데이터 선택하기



저번 판다스pandas 를 이용한 데이터 불러오기에 이어서 이번 포스팅에서는 데이터 선택하기를 공부해보려고 합니다

"판다스 기초-데이터 불러오기" 포스팅을 보실 분들은 아래 링크로 이동해주세요 ▼

https://pyrstudy.blogspot.com/2021/01/with.html


 

저번 포스팅에 이어서 이번 포스팅에서도 아래의 데이터를 사용할 예정입니다.

새로 다운 받으실 분들은 아래 링크를 클릭해주세요

https://drive.google.com/file/d/1AWo8p8CUnu5VOcNqNdAkiZFni2s66K_y/view?usp=sharing




(3) 데이터 선택하기 – 1. 칼럼기준

 -예제 3-1: 한 개의 칼럼 선택하기, 여러 칼럼 선택하기



입국객수 라는 칼럼만 보고 싶을 경우, sample_1[‘입국객수’] 를 사용합니다.

여러 개의 칼럼을 선택하기 위해서는 예제와 같이 여러 개의 칼럼을 리스트로 묶어서 입력하면 됩니다sample_1[[‘국적코드’,’입국객수’]]

(리스트로 묶어서 입력하는 것이기 때문에 [] 괄호가 두 개씩 사용됩니다.)


-예제 3-2: 칼럼 생성하기



기존 데이터에서 존재하지 않던 “기준년월이라는 칼럼에 ‘2019-11’ 이라는 값을 부여한 결과

기준년월’ 이라는 신규 칼럼이 만들어졌습니다.

이 예제와 같이 데이터에 존재하지 않던 칼럼에 값을 부여하면 새로운 칼럼이 생성됩니다.



(4) 데이터 선택하기 – 2. 로우 기준

-예제4-1: 필터링 실습1 (남성 데이터만 출력하기)


 

condition ()안의 조건문에 따라 값을 변환합니다.

예제에서는 ()의 내용이 성별이 남성이면 True를 여성이면 False 로 변환되게 했습니다.

이에 따라 성별이 남성인 0, 2, 4 True 값을 가지게 되었습니다.

sample_1[condition] 을 출력하면 true 값을 가지고 있는 0, 2, 4 번만이 출력됩니다.


-예제 4-2: 필터링 실습2 (150000명 이상만 출력하기)



예제 4-1과 같이 condition을 사용하여 입국객수가 150,000명 이상인 경우를 찾아봤습니다.
condition =(sample_1[‘입력객수’]>=150000) 


-예제 4-3: 두 개의 칼럼에 대해 필터링 하기 ( &. | , isin) + 역슬래시-줄 바꿈 표시




예제 4-3의 경우 "&"의 기호를 사용해 두 가지 조건물을 동시에 충족하는 케이스만을 추출했습니다. "&"기호는 and 를 의미합니다. 이 예제의 경우 성별이 남성이면서 동시에 입국객수가 150,000명 이상인 데이터를 선택해보았습니다.

위 두 사진 모두 같은 추출값을 갖는 코드인데요, 차이점이라면 역슬래시를 사용한다는 점입니다. 역슬래시는 두 줄을 한 줄로 인식하라는 의미입니다. 줄이 너무 길 때 사용해주는 기호입니다.




이 두번째 경우는 위 경우와 달리 & and 기호가 아닌 | or 기호를 사용해
여러 조건 중 한 가지 이상만 만족해도 되는 경우로 설정해 데이터를 선택해보았습니다.



여러 가지 조건 중 한 가지 이상만 만족해도 되는 경우를 출력하는 방법에는
| or 기호를 사용하는 방법 외에도 isin() 함수를 사용하는 방법도 있습니다.



isin() 함수 안에 찾고 싶은 값들을 리스트 형태 ['A01','A18']로 설정하면
국적코드에서 리스트 안의 값에 해당할 경우 True 값을 변환합니다.
이를 sample_1 에 적용해 출력하게 되면 국적코드가 'A01','A18' 에 해당하는 값들이 출력됩니다.





isin()함수를 이용해 설정한 조건이 아닌 그 반대의 경우를 찾고 싶을 때
condition == False 라는 조건을 부여하면 isin()함수 내 조건에 해당하지 않는 값들이 선택되어 출력됩니다.



오늘은 판다스를 이용한 데이터의 칼럼과 로우를 선택하는 방법을 공부해보았는데요
다음 글에서는 여러 데이터를 하나의 데이터로 통합하는 방법을 알아보도록 하겠습니다.
(저번에 작성 중이였는데 갑자기 글이 올라갔더라구요.. 아직 미숙하네요 ^^;;
그럼 저는 여기서 글을 마칩니다)










댓글 없음:

댓글 쓰기

PyR Intro - 신입생OT학기제