데이터를 행 단위로 가져오려면 판다스에서 제공하는 함수 사용
- loc : 인덱스 기준으로 행 데이터 읽기
- iloc : 행 번호를 기준으로 행 데이터 읽기
현재는 데이터가 숫자 형식으로 정렬되어 있어 행 번호 처럼 보이지만,
인덱스는 문자열로 지정할 수 있고, 숫자도 다르게 지정할 수 있습니다.
인덱스 2를 삭제하면 행번호는 0번부터 시작해서 순서대로 이어지지만
인덱스는 그렇지 않다
loc 로 행 추출하기
-0번 인덱스 데이터 가져오기
import pandas as pd
comment1 = pd.read_excel('C:/Users/USER/Desktop/연습문제/댓글내용.xlsx')
print(comment1.loc[0])
번호 1
댓글내용 첫번째 댓글입니다
Name: 0, dtype: object
여러 개의 인덱스에 해당하는 행 데이터 추출
-만약, 1 , 2 인덱스의 데이터를 한꺼번에 가져오고 싶으면
리스트에 원하는 인덱스를 담아 loc 속성에 전달
import pandas as pd
comment1 = pd.read_excel('C:/Users/USER/Desktop/연습문제/댓글내용.xlsx')
print(comment1.loc[[0,1]])
번호 댓글내용
0 1 첫번째 댓글입니다
1 2 두번째 댓글입니다
iloc 속성으로 행 데이터 읽어오기
행 번호를 통해 행 데이터를 가져온다
데이터프레임명.iloc[행번호]
print(comment1.iloc[0])
음수를 사용해서 데이터를 추출할 수도 있다
print(comment1.iloc[-1])
iloc를 통해 여러개의 행 데이터 가져오기
원하는 행 번호를 리스트에 담아 전달
iloc같은 경우는 행과 열 인덱스에 정수리스트를 전달해야 한다
print(comment1.iloc[[0,-1]])
loc, iloc를 통해 행과 열 데이터 가져오기
모든 행(:) 에 대해 'year' 과 'continent' 열 데이터만 가져와라
( : ) 모든 데이터를 가져와라
print(df.loc[:,['year', 'continent']])
모든 행에 대하여 3번열 데이터 전까지 country(0), continent(1), year(2)의 열데이터만 출력
print(df.iloc[:,:3])
'Language Study > R' 카테고리의 다른 글
matplotlib 모듈을 활용한 시각화 (0) | 2020.03.23 |
---|---|
Numpy와 Pandas 모듈을 활용한 정형 데이터 관리 (0) | 2020.02.17 |