>

진실 사실이 자동 레이블을 작성하는 데 필요한 최소 텍스트 행 수는 얼마입니까? 1000 개의 행을 포함하는 텍스트 파일이 있는데, 이것이 sagemaker ground truth에 의해 자동 레이블링을 시작할 수있을만큼 충분합니까?

  • 답변 # 1

    Amazon SageMaker Ground Truth 팀의 제품 관리자이며이 질문에 대해 기꺼이 도와 드리겠습니다. 최소 시스템 요구 사항은 1,000 개의 개체입니다. 실제로 텍스트 분류에서는 2,000 ~ 3,000 개의 텍스트 개체가있는 경우에만 의미있는 결과 (데이터의 %가 자동 레이블 지정됨)를 볼 수 있습니다. 성능은 가변적이며 데이터 세트와 작업의 복잡성에 따라 다릅니다.

  • 답변 # 2

    문서에서

    와이즈 비즈

    https://docs.aws.amazon.com/sagemaker/latest/dg/sms-automated-labeling.html

    You should use automated data labeling only on large datasets. The neural networks used with active learning require a significant amount of data for every new dataset. With larger datasets there is more potential to automatically label the data and therefore reduce the total cost of labeling. We recommend that you use thousands of data objects when using automated data labeling. You must use at least 5,000 data objects

  • 이전 angular - 예산의 경고, 초기 초과
  • 다음 javascript - 두 문자열 (또는 배열)을 비교하고 순서에 관계없이 유사성의 %를 반환해야합니다