홈>
서브 시퀀스 하위 치환을 유지하는최소 거리 메트릭을 찾고 있습니다. 이를 통해 두 번째 시퀀스의 하위 시퀀스는 서로 다른 표현을 가질 수 있지만 여전히 첫 번째 하위 시퀀스와 동일하다는 것을 의미합니다. 두 시퀀스의 길이는 항상 같습니다. 나는 Hamming 또는 Levenshtein 거리에 익숙하지만이 경우에는 아마도 쓸모가 없습니다.
이 예제를 고려하십시오 :
AABBAA
CCDDCC
A = C
때문에의 거리는 0입니다
그리고
B = D
(또는
AA = CC
그리고
BB = DD
).
AABBBBBB
CCDDEEEE
A = C
때문에의 거리는 2입니다
그리고
B = E
(또는
AA = CC
또는
BB = EE
또는
BBBB = EEEE
), 그러나
B =/= D
(또는
BB =/= DD
).
참고 :
또한 LZW 알고리즘으로 두 시퀀스를 압축하고 압축 비율을 비교하는 방법도 생각했습니다. 다른 아이디어?- 답변 # 1
관련 자료
- r - 그것이 거리의 13 숫자의 시퀀스 내에있는 경우 관찰 1
- shortest path - sssp 알고리즘 - 최소 거리이지만 특정 수의 "홉"미만
- R에서 행과 모든 이전 행 사이의 최소 거리 계산
- r - 다각형에서 공간 점까지의 최소 거리 계산
- java - Android 용 ArcGIS에서 pointGraphicOverlay와 구불 구불 한 lineGraphicOverlay 사이의 최소 거리를 어떻게 측정 할 수 있습니까?
- python - 최소 거리를 찾는 방법 두 점이 같은 거리에 속하는 경우
- python - gmaps distance matrix - 일련의 행을 반복하고 거리를 생성
- geometry - 직교 평면에서 지정된 벡터를 따라 두 원 사이의 최소 거리
- clojure - 정렬 문제 - 두 점 세트 사이의 최소 전체 거리를 어떻게 찾습니까?
- Oracle SQL을 사용하여 최소 비 반복 시퀀스 찾기
- c++ - 람다를 사용하여 최소 거리를 찾는 방법
- python - leetcode 1320 - 두 손가락을 사용하여 단어를 입력하는 최소 거리 ii
- python - 팬더 데이터 프레임에서 N 개의 최소 거리 쌍 가져 오기
- c++ - leetcode 1320 - 두 손가락을 사용하여 단어를 입력하는 최소 거리 i
- python - 포인트와 커브 사이의 최소 거리는 일부 포인트에 대해 최적화가 실패합니다
처음부터 연속 번호로 시퀀스의 요소를 열거 한 다음 레 벤슈 테인 거리 또는 이와 유사한 것을 사용할 수 있습니다.