>

파일 이름이 txt입니다.

샘플 데이터 :

hi hello hey

my name is jack

lets do it

그리고 목록이 있습니다

remove = ['it','name']

names.txt에 대한 RDD를 만들었습니다. 목록의 값과 일치하는 요소를 필터링하고 싶습니다. 예상되는 결과는 하나의 요소가있는 RDD입니다

hi hello hey

내 코드 :

RDD = sc.textFile("myfiles/names.txt").map(lambda x: x.split())
remove = ['it','name']
result = RDD.filter(lambda X : "remove.values" not in X)
for i in result.collect() : print i

나는 일종의 반복 방법을 사용해야하지만 나에게는 효과가 없다. 감사합니다

  • 이전 sql - 문자열 행 대신 열로 분할
  • 다음 php - JavaScript jQuery를 사용하여 URL에서 GET 변수 가져 오기