홈>
숫자 값을 가진 두 개의 벡터가 있습니다. 와 같은
v1 <- c(1, 3, 4, 5, 6, 7, 8)
v2 <- c(54, 23, 12, 53, 7, 8)
특정 비용으로 한 벡터를 다른 벡터로 바꿔야하는삽입,삭제및대체의 수를 계산하고 싶습니다. 작업 당c1c2및c3별로 기본 패키지의adist함수가 문자열에 대해이 작업을 수행하지만 숫자와 동등한 기능에 대해서는 알지 못합니다.
각 숫자를 문자로 참조하는 것에 대해 생각했지만 2000 개 이상의 고유 번호가 있으므로 R에서 2000 개의 다른 문자를 얻는 방법을 알고 있다면 나에게도 해결책이 될 것입니다.
도움을 주셔서 감사합니다.
- 답변 # 1
관련 자료
- excel - 숫자 조합을위한 적절한 알고리즘 개발
- python - 숫자 ID를 짧고 다른 영숫자 코드로 변환하는 알고리즘
- c++ - 두 벡터 알고리즘 비평/설명의 교점 찾기
- neo4j - 기본 그래프 데이터베이스에서 Levenshtein (거리 편집) 알고리즘이 O (n * m)보다 빠르게 수행됩니까?
- performance - 현대 C ++에서 Levenshtein Distance 알고리즘의 구현
- R 데이터 프레임 문자열 열에서 숫자 벡터를 추출하고 벡터와 함께 열 (목록)로 저장하는 방법
- string - 2 개의 벡터를 연결하고 C ++의 공통 요소 인 경우 벡터를 업데이트하는 알고리즘이 필요합니다 (C ++ 11에만 해당되지 않음)
- r - 4 개의 숫자 형 벡터를 공차 구간과 비교하고 공통 값을보고
- r - dplyr - 숫자 및 문자형 벡터 코딩
트렌드
- OpenCv의 폴더에서 여러 이미지 읽기 (python)
- 파이썬 셀레늄 모든 "href"속성 가져 오기
- html - 자바 스크립트 - 클릭 후 변경 버튼 텍스트 변경
- git commit - 자식 - 로컬 커밋 된 파일에 대한 변경을 취소하는 방법
- JSP에 대한 클래스를 컴파일 할 수 없습니다
- javascript - 현재 URL에서 특정 div 만 새로 고침/새로 고침
- jquery - JavaScript로 현재 세션 값을 얻으시겠습니까?
- javascript - swiperjs에서 정지, 재생 버튼 추가
- JavaScript 변수를 HTML div에 '출력'하는 방법
- python - 문자열에서 특정 문자 제거
정수 벡터는 UTF-32로 인코딩 된 단일 문자열로 볼 수 있습니다 (하나의 유니 코드 코드 포인트는 단일 32 비트 정수로 표시됨).
그런데,intToUtf8
를 사용하여 이러한 벡터를 UTF-8로 변환하면 "일반적인"문자열을 얻을 수 있습니다. .adist
와이즈 비즈 어쨌든 기본적으로 입력에 (반전 op). 내부적으로 정수 벡터에 따라 결과를 계산합니다. 큰 해킹이 없습니다.이것이 해결책입니다.
적어도 모든 숫자가 0보다 크면 위의 코드가 작동해야합니다. R은 유니 코드 코드 포인트를 상당히 자유롭게 처리합니다 (사실 너무 자유롭지 만이 경우 승자가됩니다). 가능한 가장 큰 정수조차도 허용됩니다.
음수 값을 가진 벡터가있는 경우 어떻게 든 변환 할 수 있습니다 (예 :
utf8ToInt(intToUtf8(c(2147483647))) ## 2147483647
와 함께 .삽입, 제거, 교체 비용이 다른 경우
x <- x-min(x)+1
를 확인하십시오 와이즈 비즈 논의. stringdist라는 패키지도 있으며 여기에는 다른 많은 문자열 메트릭이 포함되어 있습니다. 위의 계획도 작동해야합니다.adist's