홈>
|
의 변수 아래에 문자열이있는 데이터 프레임이 있습니다.
캐릭터. 내가 원하는 것은
|
의 다운 스트림을 제거하는 것입니다.
캐릭터.
예를 들어 문자열을 고려
heat-shock protein hsp70, putative | location=Ld28_v01s1:1091329-1093293(-) | length=654 | sequence_SO=chromosome | SO=protein_coding
만 갖고 싶습니다 :
heat-shock protein hsp70, putative
|
에 대한 탈출 문자가 필요합니까
캐릭터?
내가하면 :
a <- c("foo_5", "bar_7")
gsub("*_.", "", a)
알겠습니다 :
[1] "foo" "bar"
즉
_
의 다운 스트림을 제거하고 있습니다
캐릭터.
|
대신
:
_
알겠습니다 :
b <- c("foo|5", "bar|7")
gsub("*|.", "", a)
[1] "" ""
- 답변 # 1
- 답변 # 2
strsplit
의 더 나은 직업 일 것입니다gsub
보다그렇습니다. 파이프를 이스케이프해야하는 것처럼 보입니다.
string <- "heat-shock protein hsp70, putative | location=Ld28_v01s1:1091329-1093293(-) | length=654 | sequence_SO=chromosome | SO=protein_coding" strsplit(string, ' \\| ')[[1]][1]
그 결과물
"heat-shock protein hsp70, putative"
첫 번째 파이프 이전의 텍스트 만 원하고 파이프를 관심있는 문자열 조각과 분리하는 공간을 삭제하려고한다고 가정합니다.
관련 질문
- r : 정규식을 사용하여 특정 패턴의 문자 추출
- gsub를 사용한 R 정규식 표현
- r : 패턴 문자열로 문자열의 하위 시퀀스를 마스킹하는 방법
- gsub 및 str_replace는 공백 교체에 작동하지 않습니다.
- 패턴이 길 때 R에서 grepl을 사용하여 패턴 일치를 수행하려면 어떻게 해야 합니까?
- r : 문자열의 값을 조회 테이블로 바꾸기
- r : 데이터 프레임 목록에 대한 괄호 안의 내용을 추출하여 여러 열의 이름 바꾸기
- 정규식을 사용하여 R의 문자열에서 일부를 제거하는 방법은 무엇입니까?
- R의 함수 내에서 부분 변수 이름 검색
- r : 특정 숫자 또는 문자 집합과 일치하는 정규식
당신은
|
를 탈출해야\\|
를 추가하여 . 이것을 시도하십시오여기서
string
입니다이 대안은 출력에서 줄 끝의 공백을 제거합니다