>

주 도시 이름 (예 : NY NEW YORK)이 포함 된 데이터 세트가 있지만 일부 위치 이름이 올바르지 않습니다. 위치의 철자가 틀리거나 공백이있는 경우가 있습니다 (예 : NY NEWW YORK 또는 NY NEWYORK). 올바른 도시 이름을 가진 Excel 파일이 있으며 해당 파일을 조회하고 R 스크립트에서 수정하는 방법이 있는지 궁금합니다.

내 엑셀 참조 파일은 다음과 같이 설정됩니다 :

CurrentOrigin     CorrectOrigin
NY NEW YORK        NY NEW YORK
NY NEWW YORK       NY NEW YORK

if 문을 작성하려고했지만 운이 없었습니다.

R 기술은 제한되어 있지만 매일 보폭을냅니다.

if (df$Origin == df2$CurrentOrigin) {
     df2$CorrectOrigin ##not sure what to put in the statement
}

도움이 될 것입니다! 미리 감사드립니다!


  • 답변 # 1

    tidyverse 와 함께  패키지, SQL 스타일 조인은 어떻습니까?

    library(tidyverse)
    df1 <- tibble('ids' = c('1a', '2b' , '3c'),
                  'origin' = c('Ny New York', 'NY NEWYORK', 'NY NEWW York'))
    refdf <- tibble('CurrentOrigin'= c('NY NEWYORK', 'Ny New York', 'NY NEWW York'),
                    'CorrectOrigin' = rep('NY NEWYORK', 3))
    df1corr <- left_join(df1, refdf, by = c('origin' = 'Current Origin'))
    df1corr
    # A tibble: 3 x 3
      ids   origin       CorrectOrigin
      <chr> <chr>        <chr>        
    1 1a    Ny New York  NY NEWYORK   
    2 2b    NY NEWYORK   NY NEWYORK   
    3 3c    NY NEWW York NY NEWYORK      
    
    

    left_join  왼쪽 테이블 df1 의 모든 행을 유지하면서 두 테이블을 조인합니다. . 그런 다음 CorrectOrigin 에 누락 된 데이터가 있는지 확인할 수 있습니다.  또는 다른 필요한 것.

  • 이전 android - gson 협상 요청 오브젝트에서 선택적 필드 설정
  • 다음 asp.net - AngularJs가 ASPMVC5 전달 매개 변수에서 파일을 다운로드하는 방법