>

적어도 두 번 방문한 그룹의 누적 URL 수를 포함하는 열을 만들려고합니다. 어떻게해야합니까?

내 데이터 프레임은 다음과 같습니다 :

ID Link                 RevisitedPages
1  example.org          0
1  example.org/whatever 0
1  example.org/blank    0
1  example.org/whatever 1
1  example.org/whatever 1
1  example.org/blank    2

  • 답변 # 1

    다음을 사용할 수 있습니다 :

    df %>% group_by(ID, Link) %>% 
      mutate(RevisitedPages = 1 * (row_number() == 2)) %>%
      group_by(ID) %>% mutate(RevisitedPages = cumsum(RevisitedPages))
    # A tibble: 6 x 3
    # Groups:   ID [1]
    #      ID Link                 RevisitedPages
    #   <int> <fct>                         <dbl>
    # 1     1 example.org                       0
    # 2     1 example.org/whatever              0
    # 3     1 example.org/blank                 0
    # 4     1 example.org/whatever              1
    # 5     1 example.org/whatever              1
    # 6     1 example.org/blank                 2
    
    

    이런 식으로 우리는 먼저 모든 (ID, 링크) 쌍을보고 두 번째 방문 (있는 경우)에 1을 넣습니다. 그런 다음 ID만으로 그룹화하면 cumsum을 사용합니다.

  • 이전 iphone - xml 파일에서 노드 값을 업데이트하고 노드를 추가하는 방법은 무엇입니까?
  • 다음 java : 다른 예외에 중첩된 예외 잡기