저번 판다스pandas 를 이용한 데이터 불러오기에 이어서 이번 포스팅에서는 데이터 선택하기를 공부해보려고 합니다.
"판다스 기초-데이터 불러오기" 포스팅을 보실 분들은 아래 링크로 이동해주세요 ▼
https://pyrstudy.blogspot.com/2021/01/with.html
저번 포스팅에 이어서
이번 포스팅에서도 아래의 데이터를 사용할 예정입니다.
새로 다운 받으실 분들은
아래 링크를 클릭해주세요 ▼
https://drive.google.com/file/d/1AWo8p8CUnu5VOcNqNdAkiZFni2s66K_y/view?usp=sharing
(3) 데이터 선택하기 –
1. 칼럼기준
-예제 3-1: 한 개의 칼럼 선택하기, 여러 칼럼 선택하기
입국객수 라는 칼럼만 보고 싶을 경우, sample_1[‘입국객수’] 를 사용합니다.
여러 개의 칼럼을 선택하기
위해서는 예제와 같이 여러 개의 칼럼을 리스트로 묶어서 입력하면 됩니다. sample_1[[‘국적코드’,’입국객수’]]
(리스트로 묶어서 입력하는 것이기 때문에 [] 괄호가
두 개씩 사용됩니다.)
-예제 3-2: 칼럼 생성하기
기존 데이터에서 존재하지
않던 “기준년월”이라는 칼럼에 ‘2019-11’ 이라는 값을 부여한 결과
‘기준년월’ 이라는 신규 칼럼이 만들어졌습니다.
이 예제와 같이 데이터에
존재하지 않던 칼럼에 값을 부여하면 새로운 칼럼이 생성됩니다.
(4) 데이터 선택하기 –
2. 로우 기준
-예제4-1: 필터링 실습1 (남성 데이터만 출력하기)
condition은 ()안의
조건문에 따라 값을 변환합니다.
예제에서는 ()의 내용이 성별이 남성이면 True를 여성이면 False 로 변환되게 했습니다.
이에 따라 성별이 남성인 0, 2, 4가 True 값을 가지게 되었습니다.
sample_1[condition] 을 출력하면 true 값을 가지고 있는 0,
2, 4 번만이 출력됩니다.
-예제 4-2: 필터링 실습2 (150000명 이상만 출력하기)
-예제 4-3: 두 개의 칼럼에 대해 필터링 하기 ( &. | , isin) + 역슬래시-줄 바꿈 표시
이 두번째 경우는 위 경우와 달리 & and 기호가 아닌 | or 기호를 사용해
댓글 없음:
댓글 쓰기