홈>
내장 모델의 아래 첫 번째 링크에 표시된 것처럼 단순히 csv에서 protobuf 형식으로 변경하는 것과 같이 훈련하기 전에 sagemaker notebook 및 전처리 데이터를 사용하지 않으려 고합니다.
https://docs.aws .amazon.com/sagemaker/latest/dg/ex1-preprocess-data-transform.html
다음 예에서는 sagemaker python-sdk의 도움으로 sklearn 파이프 라인을 사용하여 전처리를 설명합니다
https://aws.amazon.com/blogs/machine-learning/preprocess-input-data-before-making-predictions-using-amazon-sagemaker-inference-pipelines-and- scikit-learn/
변경과 같은 형식을 수행하기 만하면 능률적 인 처리 방법을 사용할 필요가없는 경우 모범 사례는 무엇입니까?
- 답변 # 1
관련 자료
- 임시 변수를 사용하지 않고 쓰레기를 녹슬지 않게 던지는 방법은 무엇입니까?
- reactjs - 이벤트를 사용하지 않고 구성 요소의 속성을 가져 오는 방법
- python - 반복 시간을 늘리지 않고 find_element를 사용하여 루프에서 셀레늄 찾기 요소
- pyspark - Spark Core Rddmax ()를 사용하지 않고 RDD 함수의 최대 n 개 행을 가져 오는 방법
- c# - 클라이언트 컴퓨터에 MSMQ를 설치하지 않고 MSMQ 사용
- html - css 위치를 사용하지 않고 png 이미지 겹치기 - 상대
- c++ - 가상 기능을 재정의하지 않고 가상 기능을 사용하는 목적
- python - 셀레늄을 사용하여 ID, 값 및 유형이없는 요소 (버튼)를 찾는 방법은 무엇입니까?
- python - split 메서드를 사용하지 않고 문자열에서 가장 긴 단어를 찾는 방법
- node.js - 미들웨어 기능없이 multer를 사용하여 S3에 업로드
- html - 부트 스트랩을 사용하여 수평 스크롤바없이 인쇄하는 방법은 무엇입니까?
- python - for 루프를 사용하지 않고 벡터화 된 구현
- Lua의 스크립트에 정의 된 함수를 사용하지 않고 함수를 실행하는 방법
- java - 각 클래스의 요소 수만 사용하여 대체하지 않고 샘플링하는 방법은 무엇입니까?
- python - 인덱스 및 슬라이싱을 사용하지 않고 중첩 목록의 값에 액세스하는 방법은 무엇입니까?
- java - putIfAbsent를 사용하지 않고 ConcurrentHashMap 스레드 안전성
- 파이썬에서 목록을 사용하지 않고 4 개의 숫자 중 가장 큰 숫자를 찾는 방법
- javascript - for 루프를 사용하지 않는 알고리즘 문제 해결
- javascript - display - none 또는 visibility : hidden을 사용하지 않고 요소 숨기기
- javascript - axios를 사용하여 React 앱에서 네트워크없이 작업
트렌드
- OpenCv의 폴더에서 여러 이미지 읽기 (python)
- 파이썬 셀레늄 모든 "href"속성 가져 오기
- html - 자바 스크립트 - 클릭 후 변경 버튼 텍스트 변경
- javascript - 현재 URL에서 특정 div 만 새로 고침/새로 고침
- JSP에 대한 클래스를 컴파일 할 수 없습니다
- git commit - 자식 - 로컬 커밋 된 파일에 대한 변경을 취소하는 방법
- jquery - JavaScript로 현재 세션 값을 얻으시겠습니까?
- JavaScript 변수를 HTML div에 '출력'하는 방법
- javascript - swiperjs에서 정지, 재생 버튼 추가
- python - 문자열에서 특정 문자 제거
사전 처리 또는 교육을 수행하기 위해 SageMaker Notebook 인스턴스를 사용할 필요는 없습니다. 노트북은 실험을 탐색하고 수행하는 방법입니다. 프로덕션 사용 사례의 경우 사전 처리, 데이터 준비 (피처 엔지니어링, 형식 변환 등), AWS Step Functions를 사용한 모델 교육 및 평가와 같은 ML 파이프 라인의 작업을 조정할 수 있습니다. Julien은 최근 대화에서이를 다루었습니다.
파이썬 스크립트 (Python Shell을 통해) 또는 Apache Spark (Glue 작업)를 사용하여 사전 처리를 위해 AWS Glue를 사용하여 탐색 할 수 있습니다. 이러한 사용 사례는이 블로그를 참조하십시오. https://aws.amazon.com/blogs/machine-learning/ensure-consistency-in-data-processing-code-between-training-and-inference-in-amazon-sagemaker/