본문 바로가기
프로그래밍

python, 데이터프레임(5) - 랭크 구하기

by 청청개구리 2022. 4. 24.
728x90

 

 

엑셀의 랭크구하기를 해보았는데,

파이썬 데이터프레임 으로 비슷한걸 할 수 있다.

(음.. 역시 엑셀은 파이썬으로 대체가능한것인가... ㅎ)

 

 

엑셀, 팁(5) - 랭크 구하기

값에 대한 랭크를 구하고자 한다면, RANK.EQ(), RANK.AVG() 를 사용하자 일정한 조건에 따라 관계식을 통해서 나온 결과에 대한 평가를 할때, 과연 이 데이터 들 중에서 얼마나 상위(하위)의 결과 인건

nothing-else-matters.tistory.com

 

 

 

위의 링크에 있는 작업과 같은 것을 파이썬으로 하는 예를 보인다.

준비된 데이터는 같은 값으로....  금현물 .ㅎㅎㅎ

 

 

 

데이터를 읽고,

 

 

랭크를 구해본다.

 

 

 

 

 

자 이제 1월 5,6,7,8일에 임의로 거래량을 바꾸어서 동률이 생기도록 만들고,

다시 랭크를 구해본다.

 

같은 결과를 얻을 수 있다.

method에는 min, max, average 등을 설정할 수 있는데, 아마 감이 올거다.

 

 

----------------------------------- 이 글은 여기까지 이고, --------------------------------------------

 

 

여기서 잠시...별외편, 

in[31]의 1,2,3,4행의 작업에 의문.

처음에는 df['거래량'][1]=3000 의 작업을 하려했는데, 아래와 같은 메세지를 만났다.

요건 좀 더 확인 해 봐야 겠다. (데이터프레임의 인덱싱관련)

Indexing and selecting data — pandas 1.4.2 documentation (pydata.org)

 

Indexing and selecting data — pandas 1.4.2 documentation

Another common operation is the use of boolean vectors to filter the data. The operators are: | for or, & for and, and ~ for not. These must be grouped by using parentheses, since by default Python will evaluate an expression such as df['A'] > 2 & df['B']

pandas.pydata.org

 

 

 

 

728x90