홈>
|
의 변수 아래에 문자열이있는 데이터 프레임이 있습니다.
캐릭터. 내가 원하는 것은
|
의 다운 스트림을 제거하는 것입니다.
캐릭터.
예를 들어 문자열을 고려
heat-shock protein hsp70, putative | location=Ld28_v01s1:1091329-1093293(-) | length=654 | sequence_SO=chromosome | SO=protein_coding
만 갖고 싶습니다 :
heat-shock protein hsp70, putative
|
에 대한 탈출 문자가 필요합니까
캐릭터?
내가하면 :
a <- c("foo_5", "bar_7")
gsub("*_.", "", a)
알겠습니다 :
[1] "foo" "bar"
즉
_
의 다운 스트림을 제거하고 있습니다
캐릭터.
|
대신
:
_
알겠습니다 :
b <- c("foo|5", "bar|7")
gsub("*|.", "", a)
[1] "" ""
- 답변 # 1
- 답변 # 2
strsplit
의 더 나은 직업 일 것입니다gsub
보다그렇습니다. 파이프를 이스케이프해야하는 것처럼 보입니다.
string <- "heat-shock protein hsp70, putative | location=Ld28_v01s1:1091329-1093293(-) | length=654 | sequence_SO=chromosome | SO=protein_coding" strsplit(string, ' \\| ')[[1]][1]
그 결과물
"heat-shock protein hsp70, putative"
첫 번째 파이프 이전의 텍스트 만 원하고 파이프를 관심있는 문자열 조각과 분리하는 공간을 삭제하려고한다고 가정합니다.
관련 질문
- 다른 두 문자열 사이의 문자열을 추출하지만 r에서 1 또는 두 개의 불일치를 허용합니다.
- r : GSUB 특정 패턴 및 문자열의 위치
- r 정규식을 사용하여 두 문자와 두 개의 숫자가 뒤 따르는 두 문자를 식별합니다.
- r : 문자열에서 모든 문자를 어떻게 제거 할 수 있지만 "x"인 경우 마지막 문자는 어떻게 제거 할 수 있습니까?
- STR_EXTRACT를 사용하여 r의 문자열에서 패턴이 마지막으로 발생하는 시간 추출
- 루프를위한 GREGEXPR 결과의 첫 번째 값에 액세스하려고하지만 -1 만 얻는 것 -예기치 않은 결과
- GRPE의 "알 수없는 대조군 요소"
- R.에서 GSUB 시퀀스의 누적 적용
- r : 문자열에 0을 왼쪽 패딩합니다
- r : 집계 및 정규 표현제?
당신은
|
를 탈출해야\\|
를 추가하여 . 이것을 시도하십시오여기서
string
입니다이 대안은 출력에서 줄 끝의 공백을 제거합니다