홈>
다음과 같은 스칼라 데이터 프레임이 있습니다 :
+--------+--------------------+
| uid| recommendations|
+--------+--------------------+
|41344966|[[2174, 4.246965E...|
|41345063|[[2174, 0.0015455...|
|41346177|[[2996, 4.137125E...|
|41349171|[[2174, 0.0010590...|
df: org.apache.spark.sql.DataFrame = [uid: int, recommendations: array<struct<iid:int,rating:float>>]
추가 된 기능을 활용하기 위해 스칼라 데이터 세트로 변환하고 싶습니다. 그러나 스칼라를 처음 사용하고 열에 많은 데이터 형식이 포함되어있을 때 변환 클래스를 작성하는 방법이 확실하지 않습니다. 이것이 내가 가진 것입니다 :
val query = "SELECT * FROM myTable"
val df = spark.sql(query)
case class userRecs (uid: String, recommendations: Array[Int])
val ds = df.as[userRecs]
내 오류는 :
org.apache.spark.sql.AnalysisException: cannot resolve 'CAST(lambdavariable(MapObjects_loopValue47, MapObjects_loopIsNull47, StructField(iid,IntegerType,true), StructField(rating,FloatType,true), true) AS INT)' due to data type mismatch: cannot cast struct<iid:int,rating:float> to int;
수업을 어떻게 다시 작성해야합니까?
- 답변 # 1
관련 자료
- python - numpy 배열을 데이터 프레임으로 변환
- python - 다차원 배열을 Pandas 데이터 프레임으로 변환
- R은 JSON 배열이있는 데이터 프레임 열을 구문 분석하고 원-핫 인코딩으로 변환합니다
- javascript - 배열의 배열을 중복없이 배열로 변환
- wprintf ()를 사용하여 WinCE 6 장치에서 C/C ++의 HEX MAC-Address를 WCHAR 배열로 변환
- python 3.x - numpy 배열을 일, 시간, 분으로 어떻게 변환합니까?
- python - Pandas DataFrame을 특정 주석이 달린 CSV 형식으로 변환하는 방법 (내부 설명)
- python - Pandas 데이터 프레임의 각 행을 사전 정의 된 텍스트 파일로 변환 할 수 있습니까?
- r - 데이터 프레임의 셀에있는 값 벡터를 해당 행의 열 값으로 변환
- 스칼라에서 메일 주소를 해시로 변환하는 방법
- python - OHLCV 명명 된 데이터 배열을 numpy 데이터 프레임으로 변환하는 방법은 무엇입니까?
- c# - 중첩 된 개체를 배열로 변환
- apache spark - pyspark에서 중첩 된 dict를 데이터 프레임으로 변환하는 방법?
- Python에서 데이터 프레임의 요소를 varibale로 변환하는 방법
- apache spark - 날짜 시간을 unix_timestamp Scala로 변환
- 열거 형 JavaScript를 배열로 변환하고 배열에서 임의의 요소를 선택합니다
- 파이썬 - txt 데이터를 중첩 배열 목록으로 변환하는 방법은 무엇입니까?
- python - 부울 배열을 행렬로 변환하는 방법은 무엇입니까?
- java - 배열을 값으로 배열 인덱스의 맵으로 변환
- python - 데이터 프레임을 json으로 변환 하시겠습니까?
관련 질문
- scala : Spark Dataset 변환으로 TaskNotSerializable
- scala : 방법 count ()가 진정한 행 수를 가져 오지 않는 이유는 무엇입니까?
- scala : Spark Dataset은 여러 가입 후 열을 해결하지 못했습니다
- dataframe : Spark -하드코딩된 열 이름을 사용하지 않고 2개의 데이터 프레임 비교
- scala : 델타 테이블에서 새 /업데이트 된 레code를 얻는 방법 병합을 사용하여 삽입 한 후?
- scala : AWS 접착제 : SSL을 사용한 카산드라 연결이 작동하지 않습니다.
- Ignite-Spark Lib 종속성 문제로 인해 Ignite-Scala SBT code를 실행할 수 없습니다.
- scala : 스파크 데이터 프레임의 특정 숫자로 이중 값을 강제로 강제하는 방법은 무엇입니까?
- scala : 오류없이 JSON 파일을 HDFS에 작성할 수 없습니다
- Spark -Scala : Spark-Cassandra-Connector로 여러 조인을 수행 할 수 없습니다.
이 솔루션은 다른 클래스가 사용할 수있는 클래스를 만드는 것이 었습니다 :