>

학생 ID, 성별, 민족 등 다양한 요인을 나타내는 열이 10 개인 대학 학생 데이터에 대한 데이터 세트가 있습니다

지금은 다른 학계의 학생들이 시간이 지남에 따라 어떻게 바뀌 었는지보고 싶기 때문에 입학 조건과 민족성에 관심이 있습니다. 그래서 ethnicitydf라는 두 개의 열이있는 새로운 데이터 프레임을 만들었습니다 :

> head(ethnicitydf)
  admit_term                  ethn_desc
1 2011-10-01            White/Caucasian
2 2011-10-01 Filipino/Filipino-American
3 2011-10-01            White/Caucasian
4 2011-10-01       Latino/Other Spanish
5 2011-10-01      East Indian/Pakistani
6 2011-10-01            White/Caucasian

x 축에 admit_term (시간)과 각 admit_term에 대해 각 민족이 발생하는 빈도를 갖는 플롯을 어떻게 만들지 잘 모르겠습니다. 두 번째 열에는 12 개의 고유 한 민족이 있으며 각 admit_term (총 6 개의 용어)에 대해 12 개의 민족별로 빈도가 각 그래프마다 다르며 각 민족마다 다른 색상을 사용하고 싶습니다.

내가 생각했던 첫 번째 단계는 length(which(ethnicitydf$admit_term == "2011-10-01" & ethnicitydf$ethn_desc == "White/Caucasian")) 를 사용하여 각 용어에 대한 각 민족성을 세는 것이 었습니다.  예를 들어 새로운 데이터 프레임에 데이터를 기록하지만 더 빠르고 효율적인 방법이 있어야한다고 생각합니다. 아마도 패키지를 사용합니까? 몸이 나를 도울 수 있습니까? 감사합니다!


  • 답변 # 1

    바 플롯이 당신을 위해 카운트를합니다.

    library(ggplot2)
    ethnicitydf <- data.frame(admit_term = sample(c("2011-10-01","2012-10-01","2013-10-01"), 100, TRUE),
                              ethn_desc =sample(c("White/Caucasian","Filipino/Filipino-American","East Indian/Pakistani"), 100, TRUE))
    ggplot() +
        geom_bar(data=ethnicitydf, mapping=aes(x=admit_term, fill=ethn_desc), position="dodge")
    
    

    2019-07-03에 reprex 패키지 (v0.3.0)에서 생성

    이러한 계열이 많은 경우 점을 플롯 할 수도 있습니다.

    ggplot() +
        geom_point(data=ethnicitydf, mapping=aes(x=admit_term, colour=ethn_desc), stat="count")
    
    

    줄을 얻으려면 y 축이 숫자인지 확인해야합니다 (텍스트 날짜를 연도 등의 숫자로 바꿉니다).

    ethnicitydf$admit_term <- as.Date(ethnicitydf$admit_term)
    ggplot() +
        geom_line(data=ethnicitydf, mapping=aes(x=admit_term, colour=ethn_desc), stat="count") +
        geom_point(data=ethnicitydf, mapping=aes(x=admit_term, colour=ethn_desc), stat="count")
    
    
    

  • 이전 ios - overCurrentContext 모달 viewController와 그 자식을 어떻게 닫을 수 있습니까?
  • 다음 자바 스크립트를 사용하여 CSS 규칙 적용